吴恩达机器学习笔记 二十七 决策树中连续值特征的选择 回归树

还是猫狗分类的案例,假如再增加一个特征weight,该值是一个连续的值,如何在决策树中使用该特征?

        如下图所示,尝试不同的阈值,如 weight<=9 , 此时左边有四个样本,都为猫,右边有六个样本,其中一个为猫,计算信息增益(绿色的那个)。同理,把条件设为weight<=8,划分后左边有两个样本,全是猫,右边有八个样本,其中三个是猫,计算信息增益(蓝色的那个),可以发现边界设为9时信息增益最大,所以就按照这个标准分。

 

决策树用于分类问题-->推广到回归问题:回归树

用决策树来预测一个数字而不是类别

        用于回归问题时,我们不追求减少熵,而是期望能够降低分类后每个子集 weight 的方差 。如下图,计算不同分类后的左右两支子树的带权重方差和,再用根节点的方差减去这个数,得到方差的减少量,方差减少的越多越好,所以选择 ear shape 作为分割特征。

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-24 14:20:01       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-24 14:20:01       100 阅读
  3. 在Django里面运行非项目文件

    2024-03-24 14:20:01       82 阅读
  4. Python语言-面向对象

    2024-03-24 14:20:01       91 阅读

热门阅读

  1. BERT与GPT

    2024-03-24 14:20:01       42 阅读
  2. 浏览器强缓存和弱缓存的主要区别

    2024-03-24 14:20:01       45 阅读
  3. 如何结合NLP和图像描述技术

    2024-03-24 14:20:01       40 阅读
  4. Python实战:枚举类型enum及应用

    2024-03-24 14:20:01       43 阅读
  5. make | ubuntu源码编译指定版本make

    2024-03-24 14:20:01       40 阅读
  6. 通用型服务器和专用型服务器的区别

    2024-03-24 14:20:01       40 阅读
  7. 【React】React中将 Props 传递给组件

    2024-03-24 14:20:01       41 阅读
  8. 自定义Redis工具类(解决缓存穿透和击穿)

    2024-03-24 14:20:01       47 阅读
  9. qiankun实现基座、子应用样式隔离

    2024-03-24 14:20:01       43 阅读
  10. npm 常用命令详解

    2024-03-24 14:20:01       34 阅读
  11. 好玩的AI生产PPT工具分享

    2024-03-24 14:20:01       41 阅读
  12. Spark面试整理-Spark是什么?

    2024-03-24 14:20:01       36 阅读
  13. lin_20240321_calculating_rG4score.R

    2024-03-24 14:20:01       36 阅读
  14. 0324Caliper测试fabric1.4的TPS与Delay

    2024-03-24 14:20:01       47 阅读
  15. SCI论文发表很容易【8】:参考文献的格式

    2024-03-24 14:20:01       40 阅读
  16. 编译和安装Linux版7zip并替代p7zip

    2024-03-24 14:20:01       46 阅读