机器学习笔记-15(大规模机器学习)

这部分主要是讲超大规模数据下的机器学习优化方法。之前就说过了一个结论”大数据下,各算法差异不明显。”

Machine learning and data

大数据集下的机器学习情况

关于评估机器学习的效果,也就是之前的学习曲线,在这就不多说了,直接说这部分的内容了,这部分东西总的来说不多,也很容易理解。

Learning with large datasets

大规模数据下的学习曲线

课程一共介绍了四个关于大规模机器学习的优化方法,首先来讲第一个Stochastic gradient descent(随机梯度下降法)。 Continue reading “机器学习笔记-15(大规模机器学习)” >

机器学习笔记-14(推荐系统)

课程第十六部分, 介绍了推荐系统。这个问题在工业界应该算是比较火热的应用范畴了,现在很多互联网企业都有用到该技术。

这一问题的形成,具体可以由一个具体的实际例子来引入。课程中使用了一个电影评级系统来介绍推荐系统的应用。现在假设咱有5部电影,4位用户,分别对每部电影进行了0~5星的评级或者未评级,为了方便,咱用nm代表电影数,nu代表用户数,r(i,j)指示用户j对电影i的评级与否,0代表未评级,反之1表示已评级。Y(i,j)表示用户j对电影i的评级,取值范围在0~5之间,一个大的前提是r(i,j)=1,也就是用户应该有对该电影进行了评级。

Example:Predicting movie ratings

推荐系统:电影评级

OK,现在咱的问题就出来了,在给定的某些用户评级数据下,如何预测用户对某电影(他/她未对该电影进行评级)的评级,也就是预测上图中打上了?的值。如果大家对电影非常熟悉的话,可能会注意到这五部电影里的前三部属于爱情类,而后两部为动作类,这是很重要的数据。 Continue reading “机器学习笔记-14(推荐系统)” >

机器学习-13(异常检测)

这是第十六部分了。。。。讲得是异常检测,非监督学习算法中的一种。

先举个课程里的例子来引开这部分的内容吧,对飞机引擎的异常检测,课程里选择了热量生成和振动强度两个特征来引入异常检测,使用大量的训练样本在二维坐标系中绘制出两个特征对应关系的图,此时有一个新引擎送来检测,通过这两个特征,咱可以通过判断其数据点是否在正常区域范围内与否,来分析其是否异常。

Anomaly detection example

异常检测例子:飞机引擎检测

根据上图,咱可以通过数据点的密集程度来判断异常情况,点越密集越正常,否则异常。可以通过使用一个阈值来辅助判断,小于阈值为异常,大于阈值为正常。 Continue reading “机器学习-13(异常检测)” >

机器学习笔记-12(降维)

上部分讲到了非监督学习算法一种类型”聚类”,并了解到了K平均算法。

这一部分,咱开始讨论非监督学习中的另一类型问题:降维

为什么要对数据进行降维?论动机的话,主要有两个:1、压缩数据 2、利于视觉化数据分析 而且通常情况,对数据进行降维后,还有利于大幅度提升机器学习算法的运行速度。下面,咱来具体讨论。

扯些可能”题外话”。数据降维的处理其实有点类似咱人类的做法,因为人天生就有提取重要特征的能力。其实在课程里Andrew Ng教授给出国家GDP等数据的例子里,便可以看出(从N多的特征中,抽象出几个重要的新特征)。降维其实是一种提取重要特征的方法。

在很多情况下,机器学习算法中使用的特征,数量通常都不会很小。大量的特征配合大数量样本数就产生数量巨大的数据,数据越多,算法运行起来也有可能更慢。此时,咱首先想到的方法是对数据进行压缩。但是具体该使用何种方法呢?这里,咱使用的就是对数据进行降维。 Continue reading “机器学习笔记-12(降维)” >