sklearn库的功能_numpy库

sklearn库的功能_numpy库sklearn是目前python中十分流行的用来实现机器学习的第三方包,其中包含了多种常见算法如:决策树,逻辑回归、集成算法等。即使你还不太懂机器学习的具体过程,依旧可以使用此库进行机器学习操作,因为其对各种算法进行了良好的封装,可以在不了解算法实现过程的情况下使用算法,所以可以把sklearn库当作学习过程中的一个过度,如果你想快速建立一个模型,这也是一个不错的选择。数据导入skle…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

sklearn是目前python中十分流行的用来实现机器学习的第三方包,其中包含了多种常见算法如:决策树,逻辑回归、集成算法等。

即使你还不太懂机器学习的具体过程,依旧可以使用此库进行机器学习操作,因为其对各种算法进行了良好的封装,可以在不了解算法实现过程的情况下使用算法,所以可以把 sklearn 库当作学习过程中的一个过度,如果你想快速建立一个模型,这也是一个不错的选择。


数据导入

sklearn 内含有很多数据集,可以用来练手,一些小规模数据可以直接使用,但大规模数据要下载

内部小规模数据的导入方式:

from sklearn import datasets

boston = datasets.load_boston()	# 导入波士顿房价数据
iris = datasets.load_iris() # 导入鸢尾花数据
diabetes = datasets.load_diabetes()	# 导入糖尿病数据
digits = datasets.load_digits()	# 导入手写数字集数据

提取特征和目标,以手写数字集为例:

X = digits.data # 获得其特征向量
y = digits.target # 获得样本label

若使用外部的数据集,则需要另行导入,比如以 csv 文件存储的信息,可以选择使用 Pandas 库导入:

import pandas as pd

df = pd.read_csv('load.csv')

数据预处理

如果原始数据不太标准,为避免后期学习过程太长,可以先对数据进行处理

使用模块

from sklearn import preprocessing

标准化

scaler = preprocessing.StandardScaler().fit(train_data)
scaler.transform(train_data)
scaler.transform(test_data)

归一化

scaler = preprocessing.MinMaxScaler(feature_range=(0, 1)).fit(train_data)
scaler.transform(train_data)
scaler.transform(test_data)

正则化:

normalized = preprocessing.normalize(X, norm='...')

拆分数据集

为了查看训练出的模型的效果,需要将数据拆分为训练集和测试集,一部分用于训练另一部分用于验证

from sklearn.mode_selection import train_test_split

x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.3, random_state=1)

test_size 为测试集的比例,random_state 为随机种子


选择模型

举几个例子

from sklearn.svm import SVC	# 支持向量机
model = SVC(C=1.0, kernel=’rbf’, gamma=’auto’)

from sklearn import neighbors	# KNN
model = neighbors.KNeighborsClassifier(n_neighbors=5, n_jobs=1) # 分类
model = neighbors.KNeighborsRegressor(n_neighbors=5, n_jobs=1) # 回归

from sklearn.neural_network import MLPClassifier	# 神经网络
model = MLPClassifier(activation='relu', solver='adam', alpha=0.0001)

模型训练

sklearn 为所有模型提供了非常相似的接口,这样就使训练和验证过程有一个同一的方法

上面所有模型都以 model 变量表示,下面直接运用:

model.fit(X_train, y_train)	# 拟合模型
model.predict(X_test)	# 模型预测
model.get_params()	# 获得这个模型的参数
model.score(X_test, y_test)	# 为模型进行打分
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/180915.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • 第 3.3 节 Leetcode-Database 题解

    第 3.3 节 Leetcode-Database 题解

  • UML工具:EA(Enterprise Architect)

    UML工具:EA(Enterprise Architect)EA跟RationalRose一样都仅仅是一个UML建模软件,随着对EA的熟悉发现EA的功能太强大了。EA跟RationalRose大不一样,RationalRose只是实现对软件的建模即构建系统的UML模型,而EA却不仅仅是实现这些功能。对于一个软件设计者来说,从需求分析到概要设计、详细设计、数据库设计到测试、发布、部署等一系列软件设计必须的操作都可以在EA中完成。可以说只需要一个EA就可…

  • Web漏洞扫描神器:xray

    Web漏洞扫描神器:xray一.Xray简介:xray是从长亭洞鉴核心引擎中提取出的社区版漏洞扫描神器,支持主动、被动多种扫描方式,自备盲打平台、可以灵活定义POC,功能丰富,调用简单,支持Windows/macOS/Linux多种操作系统,可以满足广大安全从业者的自动化Web漏洞探测需求二.下载地址:GitHub项目地址:https://github.com/chaitin/xray下载地址:https://download.xray.cool/xray/1.7.0三.版本说明:..

  • npm使用淘宝镜像(npm切换淘宝镜像)

    1.通过cnpm使用淘宝镜像:npminstall-gcnpm–registry=https://registry.npm.taobao.org2.将npm设置为淘宝镜像:npmconfigsetregistryhttps://registry.npm.taobao.org3.查看cnpm镜像设置:cnpmconfiggetregistry

  • 单片机控制步进电机正反转c语言程序,单片机控制步进电机1步10步100步正反转…

    单片机控制步进电机正反转c语言程序,单片机控制步进电机1步10步100步正反转…原标题:单片机控制步进电机1步10步100步正反转一,程序设计方案的构想:1)的控制原理步进电机是将电脉冲信号转变为角位移或线位移的开环控制元件.在非超载的情况下,电机的转速,停止的位置只取决于脉冲信号的频率和脉冲数,而不受负载变化的影响.即给电机加一个信号,电机则转过一个步距角.这一线形关系的存在,加上步进电机只有周期性的误差而无积累误差等特点,使得在线速度,位置等控制领域用步进电机来控制变的…

  • innerHTML和outerHTML的区别

    innerHTML和outerHTML的区别为什么要总结innerHTML和outerHTML的区别呢,主要是在看vue.js官方文档时,看到生命周期时)]原生的方法有点忘了,所以要重拾起来。示例如下:<!DOCTYPEhtml><htmllang=”en”><head><metacharset=”UTF-8″><metaname=”viewport”content=”width=device-width,initial-scale=1.0″>

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号