大家好,又见面了,我是你们的朋友全栈君。
有一个带有三列数据框的CSV格式文件。
第三栏文字较长。
当我尝试使用pandas.read_csv打开文件时,出现此错误消息
message : UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xa1 in position 0: invalid start byte.
但是用打开文件没有问题
with open(‘file.csv’, ‘r’, encoding=’utf-8′, errors = “ignore”) as csvfile:
我不知道如何将这些数据转换为数据帧,并且我认为pandas.read_csv无法正确处理此错误。
那么,如何打开该文件并获取数据框?
参考方案
试试这个:
在文本编辑器中打开cvs文件,并确保将其保存为utf-8格式。
然后照常读取文件:
import pandas
csvfile = pandas.read_csv(‘file.csv’, encoding=’utf-8′)
如何使用Pandas groupby在组上添加顺序计数器列 – python
我觉得有比这更好的方法:import pandas as pd df = pd.DataFrame( [[‘A’, ‘X’, 3], [‘A’, ‘X’, 5], [‘A’, ‘Y’, 7], [‘A’, ‘Y…R’relaimpo’软件包的Python端口 – python
我需要计算Lindeman-Merenda-Gold(LMG)分数,以进行回归分析。我发现R语言的relaimpo包下有该文件。不幸的是,我对R没有任何经验。我检查了互联网,但找不到。这个程序包有python端口吗?如果不存在,是否可以通过python使用该包? python参考方案 最近,我遇到了pingouin库。如何用’-‘解析字符串到节点js本地脚本? – python
我正在使用本地节点js脚本来处理字符串。我陷入了将’-‘字符串解析为本地节点js脚本的问题。render.js:#! /usr/bin/env -S node -r esm let argv = require(‘yargs’) .usage(‘$0 [string]’) .argv; console.log(argv…Python:传递记录器是个好主意吗? – python
我的Web服务器的API日志如下:started started succeeded failed 那是同时收到的两个请求。很难说哪一个成功或失败。为了彼此分离请求,我为每个请求创建了一个随机数,并将其用作记录器的名称logger = logging.getLogger(random_number) 日志变成[111] started [222] start…Python sqlite3数据库已锁定 – python
我在Windows上使用Python 3和sqlite3。我正在开发一个使用数据库存储联系人的小型应用程序。我注意到,如果应用程序被强制关闭(通过错误或通过任务管理器结束),则会收到sqlite3错误(sqlite3.OperationalError:数据库已锁定)。我想这是因为在应用程序关闭之前,我没有正确关闭数据库连接。我已经试过了: connectio…
发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/162480.html原文链接:https://javaforall.cn
【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛
【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...