带有 UTF-8 数据的 Python CSV DictReader-6ren

带有 UTF-8 数据的 Python CSV DictReader

转载作者：IT老高更新时间：2023-10-28 22:11:22

28

4

AFAIK，默认情况下 Python (v2.6) csv 模块无法处理 unicode 数据，对吗？在 Python 文档中有一个 example关于如何从 UTF-8 编码文件中读取。但此示例仅将 CSV 行作为列表返回。我想按名称访问行列，因为它是由 csv.DictReader 完成的，但使用 UTF-8 编码的 CSV 输入文件。

谁能告诉我如何以有效的方式做到这一点？我将不得不处理 100 兆字节大小的 CSV 文件。

最佳答案

我自己想出了一个答案:

def UnicodeDictReader(utf8_data, **kwargs):
    csv_reader = csv.DictReader(utf8_data, **kwargs)
    for row in csv_reader:
        yield {unicode(key, 'utf-8'):unicode(value, 'utf-8') for key, value in row.iteritems()}

_{注意:此内容已更新，因此根据评论中的建议对 key 进行解码}

关于带有 UTF-8 数据的 Python CSV DictReader，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/5004687/

28

4

0

文章推荐： python - 更快的numpy笛卡尔到球坐标转换？

文章推荐： apache - 将子域发送到 node.js

文章推荐： node.js - Jade 模板引擎，如何使用layout.jade？

文章推荐： python - 字典中键的顺序

python - DictReader 应该在错误的列数上出错
应该Dialect.strict在 DictReader 上，如果一行中的列数与标题列数不匹配，它会引发异常吗？ The docs (强调我的): To make it easier to speci
python - DictReader 字段名称位于第三行而不是第一行
这个问题已经有答案了: Skip first couple of lines while reading lines in Python file (9 个回答) 已关闭 3 年前。我有一些 csv
Python Dictreader 排序字段名
我有一个包含内容(示例)的 .csv 文件 Attributes,Description,Dial-Up 4,2,0.2 3,1,0.4 使用字典阅读器: dictreader = csv.DictR
Python DictReader - 跳过缺少列的行？
我有一个 Excel .CSV 文件，我正在尝试使用 DictReader 读入。一切似乎都很好，除了它似乎省略了行，特别是那些缺少列的行。我们的输入看起来像: mail,givenName,sn
python - DictReader 的类型错误
我正在使用 DictReader 和 DictWriter 处理一个 csv 文件。我尝试根据找到的以下代码工作 here : import csv fieldnames = ['Node', 'I
CSV文件的python Dictread，数据中包含NUL字节
我有一个 CSV 文件，其中一些数据中嵌入了 NUL 字节。给定 A B C D 列，C 列中的一个字段将包含如下数据，引号字符“一些数据”NUL“更多数据”NUL“数据结束”引号字符，当我用
python - 遍历 DictReader
我已经阅读了一个 csv 文件， with open('test.csv', newline='') as csv_file: #restval = blank columns = -
python - 使用 DictReader 时替换字段名
我有一个 test.csv文件: foo,bar,foobar,barfoo 1,2,3,4 5,6,7,8 9,10,11,12 以及以下 CSV解析器: #!/usr/bin/env python
python - 如何让 DictReader 打开以分号作为字段分隔符的文件？
我的 csv 文件以分号作为分隔符。我可以用打开它 r = csv.reader(infile, delimiter=";") 没有任何问题。问题是我想将文件作为字典打开。 csv.DictReade
Python:csv.Dictreader 列上的额外逗号
我有这个读取函数，它使用 csv.DictReader 读取 csv 文件。 file.csv 以逗号分隔，可完整读取。但是，我的文件的这一部分有一列包含多个逗号。我的问题是，如何确保逗号算作列的一部
python - csv.DictReader 文件末尾异常
我使用以下代码作为解析 FCC License View 的概念证明 sample data set : import csv if __name__ == '__main__': csv_f
python - csv.dictreader 没有给出所需的输出
圣诞快乐! 我有以下数据: a = (" 101, 151, 0,'T1',2,2,1, 1.71470E-1,-1.02880E-1,2,'NUCA GSU ',1, 1,
python - 使用 DictReader 节省内存开销
我使用csv.DictReader从 CSV 文件读取数据。当读取器被迭代时，它会生成带有从 CSV header 获取的键和每行值的字典: with open(filename) as h:
python - 如何在python中从 `dictreader`中获取数据
使用以下代码: import sys import os import csv if __name__ == '__main__': csvRaw = csv.dictreader(open(
python - DictReader 上的 Filter()
我是 python 新手，尝试理解如何使用 csv.DictReader 上的过滤器函数来过滤 csv 文件中的行。 filter()可以用于“可迭代”，据我了解 DictReader适合这个defi
python - 如何使用 DictReader 指定要标记的字段名称？
我使用 DictReader 指定字段名称，但并非所有列都有用，甚至包含数据。如何指定要标记哪些列？这是我的代码: my_tot_reader = csv.DictReader(tot_file, d
python 处理 DictReader 缺少键
这个脚本工作正常，直到我点击一个空的单元格: import csv,time,string,os,requests dw = "\\\\network\\folder\\btc.csv" inv_fi
python - 模拟 CSV DictReader
有没有一种方法可以模拟 DictReader 进行单元测试，而无需实际编写文件然后重新打开它。我的函数接受一个 DictReader 实例，所以我可以轻松地传递给它们一个来测试它们的功能，但似乎无法
Python csv.DictReader - 如何反转输出？
我正在尝试反转读取文件的方式。我正在使用 DictReader，因为我想要字典中的内容。我想读取文件中的第一行并将其用于键，然后反向(从下到上)解析文件，有点像 linux“tac”命令。是否有捷径可
python - DictReader 和 UnicodeError
def openFile(fileName): try: trainFile = io.open(fileName,"r",encoding = "utf-8") ex

首页

博学

6Ren·AI

商城

带有 UTF-8 数据的 Python CSV DictReader