pandas处理缺失值的函数_pandas填充缺失值

pandas处理缺失值的函数_pandas填充缺失值df.dropna()函数用于删除dataframe数据中的缺失数据,即删除NaN数据.官方函数说明:DataFrame.dropna(axis=0,how=’any’,thresh=None,subset=None,inplace=False) Removemissingvalues. SeetheUserGuideformoreonwhichvaluesareconsideredmissing, andhowtoworkwithmissing

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

df.dropna()函数用于删除dataframe数据中的缺失数据,即 删除NaN数据.

官方函数说明:

DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)
	Remove missing values.

	See the User Guide for more on which values are considered missing, 
	and how to work with missing data.

Returns
	DataFrame
	DataFrame with NA entries dropped from it.

参数说明:

Parameters 说明
axis 0为行 1为列,default 0,数据删除维度
how {‘any’, ‘all’}, default ‘any’,any:删除带有nan的行;all:删除全为nan的行
thresh int,保留至少 int 个非nan行
subset list,在特定列缺失值处理
inplace bool,是否修改源文件

测试:

>>>df = pd.DataFrame({ 
   "name": ['Alfred', 'Batman', 'Catwoman'],
                   "toy": [np.nan, 'Batmobile', 'Bullwhip'],
                   "born": [pd.NaT, pd.Timestamp("1940-04-25"),
                            pd.NaT]})
>>>df
       name        toy       born
0    Alfred        NaN        NaT
1    Batman  Batmobile 1940-04-25
2  Catwoman   Bullwhip        NaT

删除至少缺少一个元素的行:

>>>df.dropna()
     name        toy       born
1  Batman  Batmobile 1940-04-25

删除至少缺少一个元素的列:

>>>df.dropna(axis=1)
       name
0    Alfred
1    Batman
2  Catwoman

删除所有元素丢失的行:

>>>df.dropna(how='all')
       name        toy       born
0    Alfred        NaN        NaT
1    Batman  Batmobile 1940-04-25
2  Catwoman   Bullwhip        NaT

只保留至少2个非NA值的行:

>>>df.dropna(thresh=2)
       name        toy       born
1    Batman  Batmobile 1940-04-25
2  Catwoman   Bullwhip        NaT

从特定列中查找缺少的值:

>>>df.dropna(subset=['name', 'born'])
       name        toy       born
1    Batman  Batmobile 1940-04-25

修改原数据:

>>>df.dropna(inplace=True)
>>>df
     name        toy       born
1  Batman  Batmobile 1940-04-25

以上。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/192382.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • UDP flood攻击_udp攻击是什么意思

    UDP flood攻击_udp攻击是什么意思UDPFlood是日渐猖厥的流量型DoS攻击,原理也很简单。常见的情况是利用大量UDP小包冲击DNS服务器或Radius认证服务器、流媒体视频服务器。100kpps的UDPFlood经常将线路上的骨干设备例如防火墙打瘫,造成整个网段的瘫痪。由于UDP协议是一种无连接的服务,在UDPFLOOD攻击中,攻击者可发送大量伪造源IP地址的小UDP包。但是,由于UDP协议是无连接性的,所以只要开了一个UDP的端口提供相关服务的话,那么就可针对相关的服务进行攻击。…

  • 基于流水线的CPU的设计「建议收藏」

    基于流水线的CPU的设计「建议收藏」1.我们知道,CPU是电脑的中央处理单元,CPU到底是怎么连续的执行指令的。我们以MIPS为例,探究一下。2.基础的知识我们需要知道,CPU执行一条指令时分为五个阶段的:(1)在内存取指令(2)根据指令读寄存器(3)利用寄存器中的数据ALU(4)访问内存(5)写寄存器。一般是这五个阶段,但是很多指令并不是说这五个阶段全部都在做事情。比如add,它只有四个阶段,其中不涉及到内存的访问。但是,又有…

  • 同时安装wps和office怎样默认office打开_wps表格合并多个文件

    同时安装wps和office怎样默认office打开_wps表格合并多个文件MicrosoftOffice是微软公司的一款办公软件,学习工作中的必备工具。WPS则是由金山推出的新兴免费国产办公软件,也非常的好用,可以手机、平板、电脑三端同步。WPS的功能相对可能会较多,用户群体学生党偏多。但是MicrosoftOffice毕竟是老牌办公软件,商务人士一般使用较多,很多场合下若是有软件要求,基本都会选择需要使用MicrosoftOffice。而且WPS和Office之间相互转换的话,也会有可能出现问题。那么,很多人的电脑上都会同时安装这两款软件。如果我们电脑同时安装了WPS

    2022年10月14日
  • C语言中volatile关键字的作用

    C语言中volatile关键字的作用一.前言1.编译器优化介绍:由于内存访问速度远不及CPU处理速度,为提高机器整体性能,在硬件上引入硬件高速缓存Cache,加速对内存的访问。另外在现代CPU中指令的执行并不一定严格按照顺序执行,没有相关性的指令可以乱序执行,以充分利用CPU的指令流水线,提高执行速度。以上是硬件级别的优化。再看软件一级的优化:一种是在编写代码时由程序员优化,另一种是由编译器进行优化。编译器优化常用的方法有:将内存变

  • shell循环打印「建议收藏」

    shell循环打印「建议收藏」#!/usr/bin/envbashstart=”$1″end=”$2″while[${start}-le${end}]doecho”${start}”start=$((${start}+1))donewhile[${start}-le${end}];doecho”${start}”start=$((${start}+1))do…

  • linux route文件,Linux route 命令使用详解

    linux route文件,Linux route 命令使用详解一:使用route命令添加使用route命令添加的路由,机器重启或者网卡重启后路由就失效了,方法://添加到主机的路由#routeadd–host192.168.1.11deveth0#routeadd–host192.168.1.12gw192.168.1.1//添加到网络的路由#routeadd–net192.168.1.11netmask255.2…

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号