python 处理数据归一化

全栈程序员-用户IM • 2022年6月23日下午2:16 • 未分类

python 处理数据归一化数据规范化为了消除指标之间的量纲和取值范围差异的影响，需要进行标准化（归一化）处理，将数据按照比例进行缩放，使之落入一个特定的区域，便于进行综合分析。数据规范化方法主要有：-最小-最大规范化-零-均值规范化数据示例代码实现#-*-coding:utf-8-*-#数据规范化importpandasaspdimportnumpyasnpdat…

大家好，又见面了，我是你们的朋友全栈君。

数据规范化
为了消除指标之间的量纲和取值范围差异的影响，需要进行标准化（归一化）处理，将数据按照比例进行缩放，使之落入一个特定的区域，便于进行综合分析。

数据规范化方法主要有： 
- 最小-最大规范化 
- 零-均值规范化

数据示例


代码实现
#-*- coding: utf-8 -*-
#数据规范化
import pandas as pd
import numpy as np

datafile = '../data/normalization_data.xls' #参数初始化
data = pd.read_excel(datafile, header = None) #读取数据

(data - data.min())/(data.max() - data.min()) #最小-最大规范化
(data - data.mean())/data.std() #零-均值规范化

从命令行可以看到下面的输出：

>>> (data-data.min())/(data.max()-data.min(
          0         1         2         3
0  0.074380  0.937291  0.923520  1.000000
1  0.619835  0.000000  0.000000  0.850941
2  0.214876  0.119565  0.813322  0.000000
3  0.000000  1.000000  1.000000  0.563676
4  1.000000  0.942308  0.996711  0.804149
5  0.264463  0.838629  0.814967  0.909310
6  0.636364  0.846990  0.786184  0.929571

>>> (data-data.mean())/data.std()
          0         1         2         3
0 -0.905383  0.635863  0.464531  0.798149
1  0.604678 -1.587675 -2.193167  0.369390
2 -0.516428 -1.304030  0.147406 -2.078279
3 -1.111301  0.784628  0.684625 -0.456906
4  1.657146  0.647765  0.675159  0.234796
5 -0.379150  0.401807  0.152139  0.537286
6  0.650438  0.421642  0.069308  0.595564

转载链接: https://blog.csdn.net/sinat_25873421/article/details/80753121

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。

发布者：全栈程序员-用户IM，转载请注明出处：https://javaforall.cn/152331.html原文链接：https://javaforall.cn

【正版授权，激活自己账号】： Jetbrains全家桶Ide使用，1年售后保障，每天仅需1毛

【官方授权正版激活】： 官方授权正版激活支持Jetbrains家族下所有IDE 使用个人JB账号...

赞 (0)

全栈程序员-用户IM

0 0

你想要的Http和Https知识这里都有[通俗易懂]

你想要的Http和Https知识这里都有[通俗易懂]你真的了解HTTP和HTTPS吗？HTTPS=SSL+HTTP，面试必问。

全栈程序员-用户IM
2022年10月16日
DoS和DDoS攻击[通俗易懂]

DoS和DDoS攻击[通俗易懂]文章目录一、DoS攻击1、DoS攻击简介2、DoS攻击分类2.1、按攻击的对象分类2.2、按攻击目标分类2.3、按攻击方式分类2.4、按受害者类型分类2.5、按攻击是否针对受害者分类2.6、按攻击地点分类3、常见DoS攻击3.1、Land程序攻击3.2、SYNFlood攻击3.2、IP欺骗DoS攻击3.4、Smurf攻击3.5、PingofDeath3.6、Teardrop攻击3.7、WinNuke攻击二、DDoS攻击1、DDoS攻击

全栈程序员-用户IM
2022年9月27日
SecureCRT中文乱码问题的解决

SecureCRT中文乱码问题的解决SecureCRT中文乱码问题的解决最近开始使用SecureCRT，但发现中文一直是乱码：上网搜查时编码问题，于是就把编码改为了UTF-8: 然而并没有解决问题，中文变成了？：编码修正后，还是不行，点击Font,发现字符集是西文，马上修改成中文GB2312 确定保存后，中文正常显示了：小结：影响中文显示一般先考虑编码方式，再考虑字符集设置。…

全栈程序员-用户IM
2022年7月17日
ADRC学习心得（持续更新）[通俗易懂]

ADRC学习心得（持续更新）[通俗易懂]两年前第一次接触到PID觉得很高深，很神奇；后来逐渐觉得单纯的PID小儿科了，又了解到专家PID，模糊PID，神经网络PID这些改进算法，再后来又知道了ADRC，便感控制领域浩如烟海，所学不过沧海一粟。然便纵真理无穷，进一寸自有一寸的欢喜。不敢说看了几篇论文，听了几节报告，做了几次仿真，就吃透ADRC了，不过只是一些粗浅的理解，记录一行歪歪斜斜的足迹。以便回首过眼云烟之时，可以安慰自己一句，我已经飞过。一、系统有关概念1、系统的状态空间模型描述一个系统，最常用的数学模型有：微分方程传递函数状

全栈程序员-用户IM
2022年5月19日
python字符串拼接

python字符串拼接Python字符串拼接在Python的实际开发中，很多都需要用到字符串拼接，python中字符串拼接有很多，今天总结一下：用+符号拼接用%符号拼接用join()方法拼接用format()方法

全栈程序员-用户IM
2022年7月5日
dnf钓鱼网站不小心点开了_dnf易语言源码

dnf钓鱼网站不小心点开了_dnf易语言源码其实本人当时也没注意很多。就按下了“点此充值”注意!这个所谓的登录根本不是TX的登录，其实就是用一个表单将你的帐号和密码发给盗号的!当你打完帐号密码后按下那个“登录”按钮，你的帐号密码已经到了盗号的手里，不过，他们还差一步，才能将你的号彻底洗干净，那就是你的绑定手机和手机令牌、二级密码。好吧，草了个蛋，这是个.net的页面。继续，当你打完你的号码以后不按“登录”，好吧，我解释一下，因为盗号的人不需…

全栈程序员-用户IM
2022年8月24日

发表回复

关注全栈程序员社区公众号