CART 与决策树中的超参数
CART: Classification and Regression Tree
根据某一个维度d和某一个阈值v进行二分类。
SKlearn中的决策树用CART机制实现。其他可以用ID3, C4.5, C5.0来实现。
容易产生过拟合(和kNN一样), 所以必须剪枝,这样可以降低复杂度,解决过拟合。 max_depth = 2
不带参数时,会一直分类到gini系数为0, 所以会过拟合。
min_samples_split: 可以进一步拆分的最小样本数量 min_samples_leaf: 对于叶子节点最小可以有多少个样本
max_leaf_nodes:最多可以有多少个叶子节点