Python使用pandas读取excel表格数据

Python使用pandas读取excel表格数据导入importpandasaspd若使用的是Anaconda集成包则可直接使用,否则可能需要下载:pipinstallpandas读取表格并得到表格行列信息df=pd.read_excel(‘test.xlsx’)height,width=df.shapeprint(height,width,type(df))表格如下:得到如下输出,为一个4行5列的数据块:…

大家好,又见面了,我是你们的朋友全栈君。

导入

import pandas as pd

若使用的是Anaconda集成包则可直接使用,否则可能需要下载:pip install pandas

读取表格并得到表格行列信息

df=pd.read_excel('test.xlsx')
height,width = df.shape
print(height,width,type(df))

表格如下:
test.xlsx1
得到如下输出,为一个4行5列的数据块,为DataFrame格式:
输出
直接print(df)得到的结果:
print(df)
对比结果和表格,很显然表格中的第一行(黄色高亮部分)被定义为数据块的列下标,而实际视作数据的是后四行(蓝色高亮部分);并且自动在表格第一列之前加了一个行索引{0,1,2,3}。
test.xlsx2

提取数据放入数组中

x = np.zeros((height,width))
for i in range(0,height):
	for j in range(1,width+1): #遍历的实际下标,即excel第一行
		x[i][j-1] = df.ix[i,j]
print(x.shape)
print(x)

np.zeros()方法定义一个初试值全为0的二维数组(需要导入numpy库),用df.ix[i,j]读取数据并复制入二维数组中,其中for i in range(0,height)循环表示从下标0到下标height-1(不包含height),得到的输出如下:
输出

对代码做一些补充说明:

从DataFrame结构的数据中取值有三种常用的方法:

#第一种方法:ix
df.ix[i,j]		# 这里面的i,j为内置数字索引,行列均从0开始计数
df.ix[row,col]	# 这里面的row和col为表格行列索引,也就是表格中的行与列名称

#第二种方法:loc
df.loc[row,col]	# loc只支持使用表格行列索引,不能用内置数字索引

#第三种方法:iloc
df.iloc[i,j]	# iloc只支持使用内置数字索引,不能用表格行列索引

由于ix方法对两种索引都支持,所以这里就有一个问题:如果表格行列索引也是数字怎么办? 比如我上述例子中列索引为表格的第一行{1,2,3,4},而行索引为读取时自动添加的。
经过实验这种情况将会优先使用表格行列索引,也就对应了上面代码中得到的结果。不过为了不在使用时产生混乱,我个人建议还是使用loc或者iloc而不是ix为好。

在表格中自定义行列索引的情况

如果表格是下面这样的形式:
新表格
想要让读取得到的DataFrame行索引为{‘one’,‘two’,‘three’,‘four’},列索引为{‘一’,‘二’,‘三’,‘四’,‘五’}。如果直接使用read_excel(filename),虽然列索引会默认为第一行,但是行索引并不会默认为第一列,而是会自动添加一个{0,1,2,3}作为行索引。因此需要达到我们的目的需要设定一下读取时的参数,如下:

df = pd.read_excel(filename,index_col=0)	# 即指定第一列为行索引
print(df)
print('第0行第1列的数据为:',df.iloc[0,1])
print('第three行第二列的数据为:',df.loc['three','二'])

得到的输出如下所示:
新dataframe

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/154163.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • windows启动tomcat闪退

    windows启动tomcat闪退现象:windows下双击tomcat\bin\startup.bat时闪退原因:缺少环境变量导致解决方法:打开编辑tomcat\bin\startup.bat,头部加入以下代码,一个是JAVA目录,一个是Tomcat目录SETJAVA_HOME=C:\ProgramFiles\Java\jdk1.6.0_39SETTOMCAT_HOME=D:\hunk\work\apache-tomcat

  • 工作流入门教程(flowable框架)

    工作流入门教程(flowable框架)最近有一段时间没写博客了,本来打算写写对于工作流的心得,但是工作时间比较饱和只好延后。最初接触工作流是上一家公司工作,具体我不透露哪家公司,只是感受到人情冷暖,或许公司都是这样,当你的价值被用完了也就是你走人的时候。好了,废话不多说,我们直接进入主题。前言对于框架的选型,我推荐使用flowable框架,在最初的项目选型是选择activiti的,但是深入去了解框架的时候发现activiti还是有一些坑的,而flowable正是activiti框架的修正版,据了解flowable的背景是activiti原班

  • 中心频点计算公式_5G中的频点计算及实例分析[通俗易懂]

    中心频点计算公式_5G中的频点计算及实例分析[通俗易懂]什么是ARFCNARFCN,英文全称AbsoluteRadioFrequencyChannelNumber,即绝对无线频道编号,是指在GSM无线系统中用来鉴别特殊射频通道的编号方案。“ARFCN”一词源自于GSM技术,随着新技术的发展,延伸出其他类似术语,如UMTS/WCDMA的UARFCN,E-UTRAN/LTE的EARFCN,以及现在5G/NR的NR-ARFCN。计算公式:…

  • vista怎么用_电脑系统vista

    vista怎么用_电脑系统vista1、怎么才可以关掉”windows需要你的许可才能继续”这个窗口?你用的系统是WindowsVista可以按下Win+R输入“Msconfig”打开“系统配置”程序,切换到“工具”选项卡,选中“禁用UAC”,并点击“启动”禁用它吧2、vista我的电脑在哪里WindowsVista默认安装桌面上仅保存一个回收站图标,我们可以在桌面的空白处单击鼠标邮件,在弹出的快捷…

  • 个人网站可以申请微信授权登录吗

    个人网站可以申请微信授权登录吗

    2021年10月25日
  • winhex哈希值校验_文件的哈希值不在指定的目录中

    winhex哈希值校验_文件的哈希值不在指定的目录中Certutil是一个windows预装的CLI程序,主要作用是转储和显示证书颁发机构(CA),配置信息,证书服务,CA组件的备份和还原以及验证证书、密钥对和证书链,它作为证书服务的一部分安装。可用于校验文件MD5、SHA1、SHA256,下载恶意文件和免杀。这里记录如何使用这个程序校验文件,网上很多资源的下载很多都会提供文件的md5,SHA256等等之类的哈希值,便于下载者校验文件是否…

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号