为什么机器学习中常常假设数据是独立同分布的？

全栈程序员-用户IM • 2021年11月19日下午6:00 • 未分类

为什么机器学习中常常假设数据是独立同分布的？

独立、相关的关系：

独立，两个事件的发生没有任何关系

相关，一般指线性相关，不相关指不线性相关，但或许满足非线性相关

同分布：

意味着X1和X2具有相同的分布形状和相同的分布参数，对离散随机变量具有相同的分布律，对连续随机变量具有相同的概率密度函数，有着相同的分布函数，相同的期望、方差。

独立同分布（iid）

在不少问题中要求样本（数据）采样自同一个分布是因为希望用训练数据集训练得到的模型可以合理用于测试集，使用同分布假设能够使得这个做法解释得通。

（机器学习就是利用当前获取到的信息（或数据）进行训练学习，用以对未来的数据进行预测、模拟。因此需要我们使用的历史数据具有总体的代表性。）

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。

发布者：全栈程序员-用户IM，转载请注明出处：https://javaforall.cn/119465.html原文链接：https://javaforall.cn

【正版授权，激活自己账号】： Jetbrains全家桶Ide使用，1年售后保障，每天仅需1毛

【官方授权正版激活】： 官方授权正版激活支持Jetbrains家族下所有IDE 使用个人JB账号...

赞 (0)

全栈程序员-用户IM

0 0

weka怎么安装_we是什么安装方式

weka怎么安装_we是什么安装方式1什么是看板管理首先我们先两张现实中的看板系统，能够有助于我们理解看板管理系统。大家常见的应该是实体看板，适合布置在团队所有成员都在一个办公室工作的环境。它的优点很明显，方便工作成员展示和查看自

全栈程序员-用户IM
2022年8月4日
linux下.tar.gz和.gz文件解压详解[通俗易懂]

linux下.tar.gz和.gz文件解压详解[通俗易懂].tar.gz和.gz文件是两种不同的文件，需要区别对待，解压命令当然也不同咯，下面来分享一下他们各自的解压方法。1..tar.gz文件，这种文件是tar文件的压缩文件，可以使用tar命令进行解压。例如：解压：tarzxvfpythontab.tar.gztar-xjvfhttpd-2.4.4.tar.bz2解压文件到指定文件夹：tarxzvf…

全栈程序员-用户IM
2022年4月27日
编写Excel宏[通俗易懂]

编写Excel宏[通俗易懂]编写Excel宏

全栈程序员-用户IM
2022年6月6日
java 基本类型引用_语法重点

java 基本类型引用_语法重点Java引用类型引用数据类型：数组，类，接口。class作为成员变量类作为成员变量时，对它进行赋值的操作，实际上，是赋给它该类的一个对象。在这里插入代码片interface作为成员变量在这里插入代码片interface作为方法参数和返回值类型接口作为参数时，传递它的子类对象。接口作为返回值类型时，返回它的子类对象。在这里插入代码片…

全栈程序员-用户IM
2022年10月19日
dubbo的工作原理[通俗易懂]

转载地址：https://blog.csdn.net/A_BlackMoon/article/details/85609328dubbo的工作原理1、面试题说一下的dubbo的工作原理？注册中心挂了可以继续通信吗？说说一次rpc请求的流程？2、面试官心里分析MQ、ES、Redis、Dubbo，上来先问你一些思考的问题，原理（kafka高可用架构原理、es分布式架构原理、redis线程模型…

全栈程序员-用户IM
2022年4月5日
穷举暴力激活成功教程密码（真香版）

穷举暴力激活成功教程密码（真香版）最近没事干，本来是准备激活成功教程邻居家WiFi密码的，后来发现太慢了，要加载好久，所以自己做了个测试机。下面是激活成功教程器源码:#include<windows.h>#include<iostream>#include<cstdio>#include<conio.h>usingnamespacestd;voiddown(chara){ keybd_event(a,(BYTE)0,0,0); keybd_event(a,(BYTE)0,

全栈程序员-用户IM
2022年8月22日

发表回复

关注全栈程序员社区公众号