决策树模型的用途_决策树模型怎么建立

决策树模型的用途_决策树模型怎么建立概念定义在特征空间与类空间上的条件概率分布,即给定特征条件下类的条件概率分布;也可以认为是if-then规则的集合优点模型具有可读性,分类速度快。模型首先,介绍一下决策树模型:由结点和有向边组成,结点又可分为内部结点和叶结点。内部结点表示一个特征或属性,叶结点表示一个类。决策树与条件概率分布决策树所表示的条件概率分布由各个单元给定条件下的类的条件概率分布组成。若X表…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

概念

定义在特征空间与类空间上的条件概率分布,即给定特征条件下类的条件概率分布;也可以认为是if-then规则的集合

优点

模型具有可读性,分类速度快。

模型

首先,介绍一下决策树模型:

结点有向边组成,结点又可分为内部结点叶结点内部结点表示一个特征或属性叶结点表示一个

决策树与条件概率分布

决策树所表示的条件概率分布由各个单元给定条件下的类的条件概率分布组成。若X表示特征的随机变量,取值于给定划分下单元的集合,Y表示类的随机变量,取值于类的集合,则该条件概率分布可以表示为P(Y|X)。

各叶结点(单元)上的条件概率往往偏向于某一类,即属于某一类的概率较大。

决策树本质

从训练数据集中归纳出一组分类规则。

步骤

决策树的学习常包含三个步骤:

特征选择

决策树的生成

决策树的剪枝

特征选择

是决定用哪个特征来划分特征空间。三种方法:

信息增益

信息增益比

基尼指数

决策树的生成

基本方法,从根结点出发,对结点计算所有可能的特征的信息增益(或信息增益比或基尼指数),选择信息增益值(或信息增益比或基尼指数)较大的特征作为结点的特征。

几种选择标准的不同(ID3, C4.5, CART)可参考:决策树

决策树的剪枝

通过极小化决策树整体的损失函数或代价函数来实现。

两者的不同:

决策树的生成只考虑了通过提高信息增益或信息增益比对数据进行更好的拟合,而剪枝通过优化损失函数还减小了模型的复杂度。

决策树生成学习局部的模型,而决策树剪枝学习整体的模型。

 

 

 

 

 

 

 

 

 

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/179599.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • Linux awk统计日志中出现过的IP(或出现次数最多的N个IP)

    Linux awk统计日志中出现过的IP(或出现次数最多的N个IP)

  • spring cloud 入门系列六:使用Zuul 实现API网关服务「建议收藏」

    通过前面几次的分享,我们了解了微服务架构的几个核心设施,通过这些组件我们可以搭建简单的微服务架构系统。比如通过SpringCloudEureka搭建高可用的服务注册中心并实现服务的注册和发现;通

  • PS修补工具使用方法[通俗易懂]

    PS修补工具使用方法[通俗易懂]使用场景:当我们在选取图片时,发现有多余的部分想要去除时可以通过PS中的修补工具来帮助我们实现这一操作,如果有对此功能不是很了解的小伙伴请看以下教程,小编将为大家带来PS修补工具的使用方法。方法步骤:一:把一张需要抹除的照片导入到Photoshop中二:然后找到Photoshop工具栏中的这个图标,点击选择”修复画笔工具”三:按住鼠标左键,把要抹去的部分选取出来.选取完成后会有一条虚线.四:保持鼠标在虚线内,按住鼠标左键,向相似的地方移动,这个时候你就会发现鼠标移动到的地方就是填.

  • ip addr命令作用_ipconfig命令的功能和作用

    ip addr命令作用_ipconfig命令的功能和作用一、ifconfig命令1)配置地址:比如修改eth0网卡的ip为192.168.174.100,子网掩码为255.255.255.0ifconfigeth0192.168.174.100/24使用ifconfig修改ip会直接在内存中生效,重启系统或者重启network服务就丢失。重启服务:Centos6:ser…

  • 允许Traceroute探测「建议收藏」

    允许Traceroute探测「建议收藏」漏洞描述使用Traceroute探测来获取扫描器与远程主机之间的路由信息。攻击者也可以利用这些信息来了解目标网络的网络拓扑。解决方法在防火墙中禁用TimeExceeded类型的ICMP包

  • 如何将a4排版成a3双面打印_A4如何双面打印

    如何将a4排版成a3双面打印_A4如何双面打印A4排成A3双面打印怎么操作?A3纸张的尺寸是297mm×420mm,其大小相当于两张A4的大小,A4是大家工作及生活中使用较多的纸张尺寸,A3纸张不常用,但是遇到一些比较重要的画报、图纸等之类的资料,A3纸张就比较突出了。在城市周边打印店,打印资料时多以使用A4纸张居多,所以如果您到打印店打印A3纸张,很有可能会被打印店告知:无法打印。有时候可能不是打印店员工不会帮您排版,而是打印店的设备不支持为大家打印A3大小的纸张资料。今天小编给大家介绍一个比较专业的网上在线打印平台——易桌面打印室,这是一个网

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号