【西瓜书笔记】补充3:树模型补充.md
CART:Classification and Regression Tree. 基础更多集中在CART树模型中。
树模型的基本思路就是对训练集进行划分,使得划分后的集合的纯度变得“更纯”。因此问题的要点在于:
如何定义集合的纯度。(划分前和划分后)如何对集合进行划分。(选择哪个特征和阈值)如何确定叶子节点的值。(决定了预测结果)
CART模型
纯度
CART模型既能解决分类,也能解决回归问题。在面对分类问题的时候,使用熵和GINI指数。在面对回归问题时,使用方差。
GINI指数的公式
Gini
(
D
共有 0 条评论