sponsored links

数据分析笔试

数据分析笔试题收集(一)

November 30
数据分析笔试题收集(一)
1.请说明随机森林较一般决策树稳定的几点原因 随机森林分类的过程就是对于每个随机产生的决策树分类器,输入特征向量,森林中每棵决策树对样本进行分类,根据每个决策树的权重得到最后的分类结果.即随机森林就是由多颗决策树形成的并且随机森林是并行计算多颗决策树. bagging的方法,多个树投票提高泛化能力 bagging中引入随机(参数.样本.特征.空间映射),避免单棵树的过拟合,提高整体泛化能力 决策树缺点和注意事项: 决策树的最大缺点是原理中的贪心算法.因此它所做的选择只能是某种意义上的局部最优选择