gpt4 book ai didi

python - 当 csv 文件中的字段包含引号时,Pandas 错误标记数据

转载 作者:太空宇宙 更新时间:2023-11-04 10:39:23 24 4
gpt4 key购买 nike

我正在使用 pandas.read_csv 读取制表符分隔的文件并遇到错误:错误标记数据。 C 错误:在第 73058 行中预期有 364 个字段,但看到了 398

经过大量搜索,似乎有问题的条目是:"– SO ,쳌\\?Œ ø ,d -L ,ú ,‚ ZO

去掉引号好像能解决问题。我有很多大文件,里面有很多奇怪的字符,所以这无疑会重演。我是否需要提前删除单引号,或者有什么办法可以解决这个问题?

最佳答案

read_csv 有一个引用参数:

quoting : int or csv.QUOTE_* instance, default None
Control field quoting behavior per ``csv.QUOTE_*`` constants. Use one of
QUOTE_MINIMAL (0), QUOTE_ALL (1), QUOTE_NONNUMERIC (2) or QUOTE_NONE (3).
Default (None) results in QUOTE_MINIMAL behavior.

这些是 described in the csv docs .

尝试设置 quoting=3(即 QUOTE_NONE)。

关于python - 当 csv 文件中的字段包含引号时,Pandas 错误标记数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21591091/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com