- Soft Voting Classifier:将所有模型预测样本为某一类別的概率的平均值作为标准概率最高的对应的类型为最终的预测结果;
- 将所有模型预测样本为某一类别的概率的平均值作为标准;
- 如上圖,最终的分类结果不是由概率值更大的模型 1 和模型 4 决定而是由概率值相对较低的模型 2/3/5 来决定的;
二、各分类算法的概率计算
- Soft Voting 的决策方式,要求集合的每一个模型都能估计概率;
- k 个样本点中数量最多的样本所对应的类别作为最终的预测结果;
- kNN 算法也可以考虑权值,根据選中的 k 个点距离待预测点的距离不同k 个点的权值也不同;
- n:k 个样本中,最终确定的类型的个数;如下图最终判断为 红色类型,概率:p = n/k = 2 / 3;
- 通常在“叶子”节点处的信息熵或者基尼系数不为 0数据集中包含多种类别的数据,以数量最多的样本对应的类别作为最终的预测结果;(和 kNN 算法类似)
- n:“叶子”中数量最多的样本的类型对应的样本数量;
- N:“叶子”中样本总量;
- 计算样本为各个类别的概率需要花费较哆时间;
发布了11 篇原创文章 · 获赞 9 · 访问量 1万+