Pandas读取Excel常见错误

tamoadmin 赛事报道 2024-04-23 23 0

在使用Pandas读取Excel文件时,可能会遇到一些常见的错误。以下是几个典型的问题及其解决方案:

1.错误1:

当输入为

`df

=

pd.read_excel(io='D:\XunleiDownload\002\people.xlsx')`

时,报错提示:`OSError:

[Errno

22]

Invalid

argument:

'D:\XunleiDownload\x02\people.xlsx'`

出错原因:

由于`\`具有转义字符的功能,在Windows电脑上默认此为路径标识,但是编译器不认识这种路径。

解决方案:

需要使用`r`前缀表示原始字符串,或者使用`/`代替Windows系统下的`\`作为路径分隔符。

2.错误2:

Pandas无法读取Excel的全部列,特别是当Excel文件有多个sheet表时,默认Pandas会读取第一个sheet,而用Excel打开的文件有时候不会默认显示第一个sheet,这可能导致读取数据的失误。

解决方法:

在读取的时候指定sheet即可,使用`pd.read_excel()`的`sheet_name`参数指定需要读取的sheet名。

3.错误3:

当CSV文件中每行使用了`\r`(回车符)时,可能会报错:`pandas.parser.CParserError:

Error

tokenizing

data.C

error:

Buffer

overflow

caught

Pandas读取Excel常见错误

possible

malformed

input

file.`

出错原因:

CSV文件中的换行符不正确,导致Pandas解析时出现缓冲区溢出错误。

解决方案:

在读取CSV文件时,添加参数`lineterminator="\n"`,指定用`\n`作为换行符。

4.错误4:

读取包含公式的Excel文件时,Pandas可能无***确处理这些公式。

解决方法:

使用`pd.read_excel()`的`keep_default_na=False`参数,