gpt4 book ai didi

python - 包含所有列名的 CSV 到 Python 字典?

转载 作者:太空狗 更新时间:2023-10-30 02:23:11 27 4
gpt4 key购买 nike

我对使用 python 从头开始​​编程还是很陌生,所以作为练习,我会使用一个我使用 SQL 处理的文件并尝试使用 Python 复制该功能。看来我想获取我的(压缩的,zip)csv 文件并创建它的字典(或者可能是字典的字典?)。当我使用字典阅读器时,我将第一行作为键而不是每一列作为自己的键?例如

import csv, sys, zipfile
sys.argv[0] = "/home/tom/Documents/REdata/AllListing1RES.zip"
zip_file = zipfile.ZipFile(sys.argv[0])
items_file = zip_file.open('AllListing1RES.txt', 'rU')

for row in csv.DictReader(items_file,dialect='excel'):
pass

产量:

>>> for key in row:
print 'key=%s, value=%s' % (key, row[key])

key=MLS_ACCT PARCEL_ID AREA COUNTY STREET_NUM STREET_NAME CITY ZIP STATUS PROP_TYPE LIST_PRICE LIST_DATE DOM DATE_MODIFIED BATHS_HALF BATHS_FULL BEDROOMS ACREAGE YEAR_BUILT YEAR_BUILT_DESC OWNER_NAME SOLD_DATE WITHDRAWN_DATE STATUS_DATE SUBDIVISION PENDING_DATE SOLD_PRICE,
value=492859 28-15-3-009-001.0000 200 JEFF 3828 ORLEANS RD MOUNTAIN BROOK 35243 A SFR 324900 3/3/2011 2 3/4/2011 12:04:11 AM 0 2 3 0 1968 EXIST SPARKS 3/3/2011 11:54:56 PM KNOLLWOOD

所以我正在寻找的是 MLS_ACCT 的一列和 PARCEL_ID 等的单独一列,这样我就可以对包含的所有项目进行平均价格之类的操作SUBDIVISION 字段中的 KNOLLWOOD 按日期范围、销售日期等进一步分割

我很清楚如何使用 SQL 来完成它,但正如我所说,我想在这里获得一些 Python 技能。最近几天我一直在阅读,但还没有找到关于这种用例的任何非常简单的插图。指向所述文档的指针将不胜感激。我意识到我可以使用驻留内存的 SQL-lite 但我的愿望是学习 Python 方法。我已经阅读了一些关于 Numpy 和 Scipy 的文章并加载了 sage 但仍然找不到一些有用的插图,因为这些工具似乎专注于只有数字作为元素的数组,我需要做很多字符串匹配以及日期范围计算和比较。

最终我需要替换表中的值(因为我有脏数据),我现在通过一个包含所有脏变体并为最终使用提供“干净”答案的“转换表”来做到这一点。

最佳答案

您确定这是一个包含逗号分隔值的文件吗?这些行似乎由制表符分隔。

如果这是正确的,请在 DictReader 构造函数中指定制表符分隔符。

for row in csv.DictReader(items_file, dialect='excel', delimiter='\t'):
for key in row:
print 'key=%s, value=%s' % (key, row[key])

来源:http://docs.python.org/library/csv.html

关于python - 包含所有列名的 CSV 到 Python 字典?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5695395/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com