大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。
Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺
前言
《深入浅出Python机器学习》读书笔记,第一章概述
提示:以下是本篇文章正文内容
一、什么是机器学习
本意是指一种让计算机不经过明显编程的情况下,对数据进行学习,并且做出预测的方法,数据计算机科学领域的一个子集。
二、机器学习的一些应用场景
- 智能推荐。例如淘宝的商品推荐,网易云音乐的歌曲推荐
- 社交网络中的效果广告。给用户推送合适的广告
- 互联网金融中的风控系统。根据过往数据,判断当前订单是否
是欺诈订单 - 新闻资讯中的内容审查。判断新闻是否是虚假新闻,或者内容
是否违反国家 法律 - 其他领域。如医疗中根据病史症状和化验结果找到病因;
智能物流、智能家居、无人驾驶等领域。 - AlphaGo
三、学习机器学习的过程
- 掌握一门语言
- 学习机器学习的基本概念
- 了解常见的算法
- 掌握数据处理的技巧
- 优化模型
- 动手
四、有监督学习和无监督学习
-
有监督学习是通过现有数据集进行建模,再用模型对新的数据样本进行分类或者回归分析的机器学习方法。有监督学习中,训练数据集一般包含样本特征变量及分类标签,机器学习使用不同的算法通过这些数据推断出分类的方法,并用在新的样本中。
-
无监督学习是在没有训练数据集的情况下,对没有标签的数据分析并建立合适的模型,一遍给出解决方案的方法。在无监督学习中,场景的两种任务类型是数据转换和聚类分析。数据转换的目的是把复杂数据通过非监督算法进行简化。常见的转换方法是数据降维:通过对数据集进行分析,将无关紧要的维度去除,保留关键特征。聚类是把相似特征的数据分到不同的组。
五、分类和回归
-
分类是对样本的类标签进行预测,判断样本属于哪个类别。通常分类是离散
的数值。 -
回归分析是要预测一个连续的数值或范围。
六、模型的泛化、过拟合与欠拟合
-
模型的泛化是指模型用来预测新数据时的好坏,如果对新数据预测依然准
确,说明泛化的准确度较好。 -
过拟合是指拟合训练数据集时拟合很好,拟合测试数据集市很差的情况
-
欠拟合指模型连训练数据集都拟合不好,测试数据集也很差的情况
发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/183486.html原文链接:https://javaforall.cn
【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛
【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...