gpt4 book ai didi

python - 从具有列值的 quotechar 和定界符的 pandas 中读取 csv

转载 作者:太空宇宙 更新时间:2023-11-04 00:54:27 24 4
gpt4 key购买 nike

这是一个 csv 文件“test.csv”的内容,我试图通过 pandas read_csv() 读取它

"col1", "col2", "col3", "col4"
"v1", "v2", "v3", "v4"
"v21", "v22", "v23", "this, "creating, what to do? " problems"

这是我正在使用的命令-

messages = pd.read_csv('test.csv', sep=',', skipinitialspace=True)

但是我收到以下错误-

CParserError: Error tokenizing data. C error: Expected 4 fields in line 3, saw 5

我希望line3中column4的内容是'这个,“创建,要做什么?”问题'

当列可以包含引号和分隔符时如何读取文件?

最佳答案

pandas 不允许您保留格式错误的行,老实说,在您的示例中,我真的没有看到忽略某些 " 字符而不是其他字符的方法。我认为您使用 的直觉code>'", "' 作为分隔符,然后进行清理是最好的方法。如果您真的担心在一行中执行此操作:

message = pd.read_csv('test.txt', sep='", "', names = ['col1','col2','col3','col4'], skiprows=1).apply(lambda x: x.str.strip('"'))

它也处理列名称中的剥离引号并为您提供:

>>> message
>>>
col1 col2 col3 col4
0 v1 v2 v3 v4
1 v21 v22 v23 this, "creating, what to do? " problems

关于python - 从具有列值的 quotechar 和定界符的 pandas 中读取 csv,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35686920/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com