pandas用平均值填充缺失值_pandas筛选列不为空值

pandas用平均值填充缺失值_pandas筛选列不为空值官方fillna方法文档pandas中fillna()方法,能够使用指定的方法填充NA/NaN值。1.函数详解函数形式:fillna(value=None,method=None,axis=None,inplace=False,limit=None,downcast=None,**kwargs)参数:value:用于填充的空值的值。method:{‘backfill…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

  • ? 版权: 本文由【墨理学AI】原创、在CSDN首发、各位大佬、感谢查阅、感谢三连、感谢关注

基础参考资料


1


pandasfillna()方法,能够使用指定的方法填充NA/NaN值。

函数详解

函数形式:fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)

参数:

value:用于填充的空值的值。

method: {‘backfill’, ‘bfill’, ‘pad’, ‘ffill’, None}, default None。定义了填充空值的方法, pad / ffill表示用前面行/列的值,填充当前行/列的空值, backfill / bfill表示用后面行/列的值,填充当前行/列的空值。

axis:轴。0或’index’,表示按行删除;1或’columns’,表示按列删除。

inplace:是否原地替换。布尔值,默认为False。如果为True,则在原DataFrame上进行操作,返回值为None。

limit:int, default None。如果method被指定,对于连续的空值,这段连续区域,最多填充前 limit 个空值(如果存在多段连续区域,每段最多填充前 limit 个空值)。如果method未被指定, 在该axis下,最多填充前 limit 个空值(不论空值连续区间是否间断)

downcast:dict, default is None,字典中的项为,为类型向下转换规则。或者为字符串“infer”,此时会在合适的等价类型之间进行向下转换,比如float64 to int64 if possible。

返回值:
DataFrame or None
Object with missing values filled or None if inplace=True.


  • 用均值进行填充:
for column in list(df.columns[df.isnull().sum() > 0]):
    mean_val = df[column].mean()
    df[column].fillna(mean_val, inplace=True)

  • 用后一行的值进行填充NaN
print(df.fillna(method='backfill', axis=0, inplace=False))
  • 我的测试代码如下:
import numpy as np
import pandas as pd

a = np.arange(100, dtype=float).reshape((10, 10))

a[0, 1] = np.nan
a[0, 3] = np.nan
a[0, 4] = np.nan
a[0, 6] = np.nan

a[3, 1] = np.nan
a[3, 3] = np.nan
a[3, 4] = np.nan
a[3, 6] = np.nan

df = pd.DataFrame(data=a)
# 重命名列名
df.columns = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j']

print(df)
# 筛选需要填充的列
print(df.columns[df.isnull().sum() > 0])

# 用列均值进行填充NaN
for column in list(df.columns[df.isnull().sum() > 0]):
    mean_val = df[column].mean()
    df[column].fillna(mean_val, inplace=True)

# 用后一行的值进行填充NaN
# print(df.fillna(method='backfill', axis=0, inplace=True))


# 筛选需要填充的列 发现没有这样的列了
print(df.columns[df.isnull().sum() > 0])

print(df)



9-8

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/169999.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)
blank

相关推荐

  • html段落空格怎么写,html怎么写空格

    html段落空格怎么写,html怎么写空格html写空格的方法:1、通过键入“空格”键在html网页中输入一个空格;2、通过空格字符代码“”在html中输入多个空格即可。本文操作环境:windows7系统、HTML5版、DellG3电脑。HTML中如何键入空格?一个空格的键入在html网页中一个空格,我们可以键入“空格”键即可实现。多个html空格字符如果在html中想实现多个空格间隙,如果是键入多个“空格”键,但最终也只…

  • Java IO层次体系结构[通俗易懂]

    Java IO层次体系结构[通俗易懂]在整个Java.io包中最重要的就是5个类和一个接口。5个类指的是File、OutputStream、InputStream、Writer、Reader;一个接口指的是Serializable.掌握了这些IO的核心操作那么对于Java中的IO体系也就有了一个初步的认识了   JavaI/O主要包括如下几个层次,包含三个部分:   1.流式部分――IO的主体部分;  2.非流式…

  • 徐 氏 介 绍_徐氏的起源

    徐 氏 介 绍_徐氏的起源一、姓氏源流徐氏的姓氏来源比较纯正,主要出自嬴姓。是先帝玄孙伯益之子若木的后裔。相传陷帝有一个孙女叫女修,因食燕子蛋而怀有大业。大业娶少典氏女子女华为妻,生下了皋陶,皋陶生三子(另一说是六子)长子伯益,又叫…

  • 《TCP/IP具体解释卷2:实现》笔记–ICMP:Internet控制报文协议

    《TCP/IP具体解释卷2:实现》笔记–ICMP:Internet控制报文协议

  • win7安装vs2015失败_win10还是win7

    win7安装vs2015失败_win10还是win7错误日志:解决方法:1、把vs2008镜像文件下的\WCU\WebDesignerCore\WebDesignerCore.EXE手动解压到一个地方(注意解压出来的文件夹里面有个Office.zh-cn)2、找一个Office2007光盘或光盘镜像,找到Office.zh-cn文件夹,把该文件夹复制,然后覆盖到上一步解压中的Office.zh-cn中3、在第一步解压出来的文

  • Java中List的详细用法

    Java中List的详细用法目录:list中添加,获取,删除元素;list中是否包含某个元素;list中根据索引将元素数值改变(替换);list中查看(判断)元素的索引;根据元素索引位置进行的判断;利用list中索引位置重新生成一个新的list(截取集合);对比两个list中的所有元素;判断list是否为空;返回Iterator集合对象;将集合转换为字符串;将集合转换为数组;集…

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号