gpt4 book ai didi

python - 使用Python 're.split' Unicode字符

转载 作者:行者123 更新时间:2023-12-02 10:48:41 25 4
gpt4 key购买 nike

我正在尝试将以下数据字段拆分为3个字段(pre,match和suf),并将其输入到逗号分隔的txt文件中。我正在从一个csv文件中读取所有内容...这是utf-8数据。

我现在的问题是我无法解决“TypeError:强制转换为Unicode:需要字符串或缓冲区,找到列表”错误...但是,看到我已经尝试设置编码,我不知道犯规在哪里...

样本数据:

 A-1 طس
TX 35-L
Av Rib

对此进行拆分应该(\ d +(-?[NSEW])?)为我提供以下内容:
Column1 | Column2 | Column3
A |1 |طس
TX |35 |-L
Av Rib | |

我当前的代码是这样的:
## Iterate over csv file to create matches and splits 
## string according to regex pattern..

reader = csv.reader(csvfile)

with codecs.open(r'file.txt', 'w', 'utf-8') as outfile1:
for row in reader:
unicode_row = [x.decode('utf-8') for x in row]
item = unicode_row[1]
parsed = re.compile("\d+(-?[NSEW])?", re.UNICODE).split(unicode(item, 'utf-8'))
outfile1.write(parsed + "\n")

最佳答案

关于python - 使用Python 're.split' Unicode字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20189150/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com