gpt4 book ai didi

Python csv阅读器多字符quotechar?

转载 作者:行者123 更新时间:2023-11-30 22:50:12 33 4
gpt4 key购买 nike

我正在处理 Concordance 加载文件并且必须编辑它们,因此我使用 Python 来实现这一点。这些列由 pilcrow 字符 分隔,并使用 þ 作为 quotechar。

问题出在quotechar上,python中的csv模块只接受单字符引号(我写csv文件时没有问题)。

问题:如何在 Python 中读取 quotechar 为多字符的 CSV 文件?

CSV 文件示例:

þcol_1þ¶þcol_2þ¶þcol_3þ¶þcol_4þ

最佳答案

Concordance 文件格式采用 8 位编码,并且 þ 字符确实采用 Latin-1 编码。这意味着它们分别被编码为二进制值 0xB6 和 0xFE。

Python 2 csv 模块非常高兴地接受这些字节:

csv.reader(fileobj, delimiter='\xb6', quotechar='\xfe')

csv 模块一样,确保以二进制模式打开文件,以便将换行符处理留给模块。

在 Python 3 中,使用 newline=''encoding='latin1' 以文本模式打开文件,并使用上面的 \xhh 转义或实际字符,因此 delimiter='¶', quotechar='þ'

关于Python csv阅读器多字符quotechar?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39484436/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com