最小二乘与梯度下降详解

http://blog.csdn.net/guang09080908/article/details/41415193 说: 最小二乘和极大似然是目标函数,梯度下降是优化算法。 机器学习的核心是一个model,一个loss fucti...

svm 多分类机制详解

参考 http://www.cnblogs.com/CheeseZH/p/5265959.html SVM本身是一个二值分类器   SVM算法最初是为二值分类问题设计的,当处理多类问题时,就需要构造合适的多类分类器。...

逻辑回归(Logistic Regression)详解

一 什么是逻辑回归         首先,LR虽然名字里有回归,但它并不是解决回归问题,而是解决分类问题的。        另外,有人会问,...

交叉验证(Cross validation)总结详解

一  什么是CV        CV,通俗理解就是使用训练数据和测试数据交叉的方式来验证一个(或多个)模型的性能,以此判定算法在数据上的大致性能。    ...

方差,标准差,MSE, RMSE详解

1.  方差      样本X的期望       方差是一种特殊的期望,        标准差  即上面...

决策树的究极进化之Bagging和Boosting详解

决策树基础参考: http://blog.csdn.net/leiting_imecas/article/details/52950663 本节介绍决策树的究极进化 1. Bagging(bootstrap Aggregation)...

机器学习之特征工程(一)详解

一 什么是特征工程 特征是指数据中抽取出来的对结果预测有用的信息 特征工程是使用专业背景和技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程。 特征工程的意义:1.更好的特征意味着更强的灵活性 2更好的特征意味着只需要简...

机器学习之特征归一化(normalization)详解

参考自斯坦福机器学习课程 一 引子 对房屋售价进行预测时,我们的特征仅有房屋面积一项,但是,在实际生活中,卧室数目也一定程度上影响了房屋售价。下面,我们有这样一组训练样本: 房屋面积(英尺) 卧室数量...

机器学习之特征工程(二)详解

本节主要介绍数据和特征处理。 https://github.com/liuleigit/ML_tutorial 一 特征处理     (1)数值型        ...

新闻内容去重算法simhash实践详解

前言     最近做了新闻去重算法的工作,mark下     两个应用场景:1. 重复新闻整体检测、去重   2. 从非重复的新闻中寻找重复的句子,依次判断两篇新闻是否存在同一...