gpt4 book ai didi

Python CSV 阅读器应在输入错误时引发错误

转载 作者:太空宇宙 更新时间:2023-11-03 11:27:55 25 4
gpt4 key购买 nike

我有一个名为 group_data 的字符串,我想用 Python 的 csv.reader 读取它。这是我的电话。

group = csv.reader(group_data.split('\n'), delimiter=';', 
doublequote=True, quoting=csv.QUOTE_ALL, strict=True)

我希望只要出现以下情况之一,就会引发异常:

  • 有一个单引号:"A";"B "bb"B";"C""A";"B""bb""B";"C")
  • 任何字段都不是引用:A;B;C 而不是 "A";"B";"C"

但是,上面的摘录接受两行都是正确的,即使使用了 doublequote=Truequoting=csv.QUOTE_ALLstrict=True设置。我应该设置另一个选项使其失败吗?如果这不可能,是否有另一种方法可以快速注意到是否存在单引号或未引号字段?

最佳答案

就其值(value)而言,Python 3.4 似乎确实拒绝了您的第一个示例:

In [8]: mkreader = lambda x: csv.reader(x.split("\n"), delimiter=";", doublequote=True, quoting=csv.QUOTE_ALL, strict=True)
In [11]: for l in mkreader('''"A";"B ""bb"" B";"C"'''): print(l)
['A', 'B "bb" B', 'C']
In [12]: for l in mkreader('''"A";"B "bb" B";"C"'''): print(l)
...
Error: ';' expected after '"'

虽然它允许第二个:

In [13]: for l in mkreader('''A;B;C'''): print(l)
['A', 'B', 'C']

查看 docs ,这似乎是因为 QUOTE_ALL 严格来说是作者设置,而不是读者设置:

csv.QUOTE_ALL
Instructs writer objects to quote all fields.

比较:

csv.QUOTE_NONNUMERIC

Instructs writer objects to quote all non-numeric fields.

Instructs the reader to convert all non-quoted fields to type float.

所以看起来如果你想要的话,你需要自己做。如果您知道 ; 永远不会出现在您的行内(这似乎是这种情况,因为您没有设置 escapechar),这很简单:

In [19]: def check_line(line):
for word in line.split(';'):
if word[0] != '"' or word[-1] != '"':
raise csv.Error("Bad input.")
In [20]: check_line("A;B;C")
...
Error: Bad input.

关于Python CSV 阅读器应在输入错误时引发错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30307434/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com