gpt4 book ai didi

python - 解析以引号开头的tsv文件

转载 作者:太空宇宙 更新时间:2023-11-04 01:54:03 24 4
gpt4 key购买 nike

我试图解析一个包含两列的 TSV 文件,有些行只包含引号。有没有一种方法可以使用 python 将它们解析为单独的行,而无需在引号前添加“\”?

presents    O
it O
in O
" O
classical O
" O
principles O
on O
which O
' O
the O
operation O
was O
' O
conceived O
. O

我试过这样的代码

with open("sample.tsv") as tsvfile:
tsvreader = csv.reader(tsvfile, delimiter="\t")
for line in tsvreader:
print (line)

三行结果不正确

"   O
classical O
" O

当前结果是

['\tO\nclassical\tO\n', 'O']

我想要的结果是

['"', 'O']
['classical', 'O']
['"', 'O']

最佳答案

您可以在创建实例时通过添加 quoting = csv.QUOTE_NONE 告诉 csv.reader 忽略引号字符:

import csv
with open("sample.tsv") as tsvfile:
tsvreader = csv.reader(tsvfile, delimiter="\t", quoting=csv.QUOTE_NONE)
for line in tsvreader:
print (line)

输出(带引号的行):

['"', 'O']
['classical', 'O']
['"', 'O']

csv module 的文档解释说 csv.QUOTE_NONE “指示 reader 不对引号字符执行特殊处理。”

关于python - 解析以引号开头的tsv文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57319192/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com