自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

CS青雀的巢

心平气和,不起执念。

原创 《机器学习实战》——logistic回归

基本原理:现在有一些数据点,用一条直线对这些数据进行拟合,将它们分为两类。这条直线叫做最佳拟合直线,这个拟合过程叫做回归。logistic回归的思想是,利用一个阶跃函数(在某一点突然由0变1),实现分类器。Sigmoid函数近似于阶跃函数: 现在将每个特征乘以一个回归系数,再全部相加,总和...

2015-10-24 22:08:20

阅读数 1092

评论数 0

原创 python调用新浪API爬虫

1. 索引:python调用新浪微博API项目实践 2. 下载pytho SDK 。下载地址,默认支持python2.6/2.7. 改为python3.4版本。(想要现成的可直接联系作者) 3. 报错:"访问出错了.你所访问的站点在新浪微博的认证失败,请联系****或者稍后再试.(err...

2015-10-23 16:57:15

阅读数 928

评论数 0

原创 【Python有坑系列】python中编码问题——unicode, gbk, utf8

1.默认编码类型   >>> import sys >>> sys.getdefaultencoding() 'utf-8' python 3.4默认为utf...

2015-10-23 11:02:09

阅读数 1187

评论数 0

转载 强化学习(reinforcement learning)教程

正文: Q学习算法是一种用来解决马尔可夫决策过程中最优化问题的方法。Q学习算法最大的特点是它具有选择瞬时奖励和延迟奖励的能力。在每一步中,agent通过观察状态s的向量,然后选择并执行行动a,随着状态从s转移到s‘,agent能够收到一个强化值r(s, a)。训练的目标是发现一条行动的路径,从而...

2015-10-22 22:16:23

阅读数 4960

评论数 0

原创 《机器学习实战》——朴素贝叶斯算法

基本原理:统计特征在数据集中取某个特定值的次数,再除以数据集实例总数,就是特征取该值的概率。选择各概率中最高的一个,对应的类别就是所求的值。即,选择具有最高概率的决策。使用条件概率来分类,使用贝叶斯准则来交换条件概率中的条件和结果。 朴素两个含义:1)各个特征之间相互独立。2)每个特征同等重要 关...

2015-10-22 21:40:33

阅读数 1193

评论数 0

原创 《机器学习实战》——决策树

基本原理:每个数据集都有一个或者多个特征作为已知条件,现在根据这些特征分类。K-近邻算法是已知部分分类,通过比较特征距离来将新的数据划分到旧的分类,但是你不知道它是如何划分,也就不知道分类是什么含义。决策树则是将一堆全新的数据,通过一个一个问答的形式,逐步缩小范围,给出最终分类,行成一个树形图。它...

2015-10-22 11:37:10

阅读数 928

评论数 0

原创 《机器学习实战》—K-近邻算法

基本原理:通过计算新数据与给定的样本数据之间的距离,来确定相似度排名;然后取前K个最相似的样本,统计这k(一般不大于20)个样本中出现最多的分类,设为新数据的分类。 关键词:新数据,训练样本集,样本数据标签(即分类),最近邻(前k个最相似数据),最近邻标签 算法实施: 首先提取要比较的特征,确定各...

2015-10-21 16:41:54

阅读数 885

评论数 0

提示
确定要删除当前文章?
取消 删除