gpt4 book ai didi

python - 如何删除我的 csv 中非 ascii 感染的行

转载 作者:太空宇宙 更新时间:2023-11-04 08:20:39 29 4
gpt4 key购买 nike

我有一个非常大的 csv 文件,如下所示:

关键词,印象
下载 juegos gratis,951
パソコン kakaku com,451
公司 session ,155
租车,356
聪明,1224
吉他谱,064
英è¯ç¿»è¯‘,160

我已经像这样将文件读入字典:

# Read the CSV
filename = argv[1]
csvfile = open(filename, 'r')
csvreader = csv.DictReader(csvfile)
rows = []
for row in csvreader:
rows.append(row)

我将如何删除具有非 ascii 字符的行,以便我最终只得到:

关键词,印象
下载 juegos gratis,951
公司 session ,155
租车,356
聪明,1224
吉他谱,064

简而言之:如果行中存在任何非 ascii 字符,则必须删除整行。

谢谢!

最佳答案

简单的方法:你可以尝试解码它,并捕获异常。

try:
string.decode('ascii')
except UnicodeDecodeError:
print "Not ascii"

关于python - 如何删除我的 csv 中非 ascii 感染的行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5656528/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com