Category: 机器学习 | mantch的博客

【机器学习】GBDT

mantch

2019-07-09

机器学习

字数统计:

2k字

阅读时长≈

7分

解释一下GBDT算法的过程 GBDT(Gradient Boosting Decision Tree)，全名叫梯度提升决策树，使用的是Boosting的思想。 Boosting方法训练基分类器时采用串行的方式，各个基分类器之间有依赖。它的基本思路是将基分类器层层叠加，每一…

阅读全文

【机器学习】随机森林

mantch

2019-07-07

机器学习

字数统计:

2.1k字

阅读时长≈

7分

Bagging是bootstrap aggregating。思想就是从总体样本当中随机取一部分样本进行训练，通过多次这样的结果，进行投票获取平均值作为结果输出，这就极大可能的避免了不好的样本数据，从而提高准确度。因为有些是不好的样本，相当于噪声，模型学入噪声后会使准确度不高。假设有1000个样本…

阅读全文

【机器学习】决策树

mantch

2019-07-06

机器学习

字数统计:

2.9k字

阅读时长≈

10分

其实用一下图片能更好的理解LR模型和决策树模型算法的根本区别，我们可以思考一下一个决策问题：是否去相亲，一个女孩的母亲要给这个女海介绍对象。大家都看得很明白了吧！LR模型是一股脑儿的把所有特征塞入学习，而决策树更像是编程语言中的if-else一样，去做条件判断，这就是根本性的区别。决策树基于“…

阅读全文

【机器学习】逻辑回归

mantch

2019-07-06

机器学习

字数统计:

2.1k字

阅读时长≈

7分

逻辑回归是用来做分类算法的，大家都熟悉线性回归，一般形式是Y=aX+b，y的取值范围是[-∞, +∞]，有这么多取值，怎么进行分类呢？不用担心，伟大的数学家已经为我们找到了一个方法。也就是把Y的结果带入一个非线性变换的SIGMOID函数中，即可得到[0,1]之间取值范围的数S，S可以把它看成是一…

阅读全文

【机器学习】线性回归

mantch

2019-07-05

机器学习

字数统计:

1.5k字

阅读时长≈

5分

线性回归对大量的观测数据进行处理，从而得到比较符合事物内部规律的数学表达式。也就是说寻找到数据与数据之间的规律所在，从而就可以模拟出结果，也就是对结果进行预测。解决的就是通过已知的数据得到未知的结果。例如：对房价的预测、判断信用评价、电影票房预估等。

阅读全文