gpt4 book ai didi

python - 如何处理引号不均匀的 .tsv?

转载 作者:行者123 更新时间:2023-11-30 23:18:08 35 4
gpt4 key购买 nike

我刚开始使用 Python 的 csv 模块,但由于缺少转义字符和奇怪的数据,我不断遇到无法解析的问题。以下是导致它抓取多行并中断(制表符分隔值)的两个示例:

B 2885192 "Some input

L 30019 "

两个示例都破坏了它并得到“无转义字符集”错误。这是我阅读它的主线:

with open (INFO_FILE, "rt", encoding = "latin1") as info:
info = csv.reader (info, delimiter = '\t')

我找不到可靠的答案,也无法在文档中找出处理此问题的确切方法。我确信这就像修改 csv.writer 的选项一样简单。我应该改变什么来接受这些作为直字符串,而不是让它尝试在这些情况下找到结束引号?

最佳答案

您没有为您的阅读器指定quoting=csv.QUOTE_NONE。尝试一下

with open (INFO_FILE, "rt", encoding = "latin1") as info:
info = csv.reader (info, delimiter = '\t', quoting=csv.QUOTE_NONE)
for line in info:
print(line)

输出:

['B', '2885192', '"Some input']
[]
['L', '30019', '"']

关于python - 如何处理引号不均匀的 .tsv?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26920849/

35 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com