python - 包含所有列名的 CSV 到 Python 字典？-6ren

python - 包含所有列名的 CSV 到 Python 字典？

转载作者：太空狗更新时间：2023-10-30 02:23:11

27

4

我对使用 python 从头开始编程还是很陌生，所以作为练习，我会使用一个我使用 SQL 处理的文件并尝试使用 Python 复制该功能。看来我想获取我的(压缩的，zip)csv 文件并创建它的字典(或者可能是字典的字典？)。当我使用字典阅读器时，我将第一行作为键而不是每一列作为自己的键？例如

import csv, sys, zipfile
sys.argv[0] = "/home/tom/Documents/REdata/AllListing1RES.zip"
zip_file    = zipfile.ZipFile(sys.argv[0])
items_file  = zip_file.open('AllListing1RES.txt', 'rU')

for row in csv.DictReader(items_file,dialect='excel'):
    pass

产量:

>>> for key in row:
        print 'key=%s, value=%s' % (key, row[key])

key=MLS_ACCT    PARCEL_ID   AREA    COUNTY  STREET_NUM  STREET_NAME CITY        ZIP STATUS  PROP_TYPE   LIST_PRICE  LIST_DATE   DOM DATE_MODIFIED   BATHS_HALF  BATHS_FULL  BEDROOMS    ACREAGE YEAR_BUILT  YEAR_BUILT_DESC OWNER_NAME  SOLD_DATE   WITHDRAWN_DATE  STATUS_DATE SUBDIVISION PENDING_DATE    SOLD_PRICE,  
value=492859    28-15-3-009-001.0000    200 JEFF    3828    ORLEANS RD  MOUNTAIN BROOK  35243   A   SFR 324900  3/3/2011    2   3/4/2011 12:04:11 AM    0   2   3   0   1968    EXIST   SPARKS          3/3/2011 11:54:56 PM    KNOLLWOOD

所以我正在寻找的是 MLS_ACCT 的一列和 PARCEL_ID 等的单独一列，这样我就可以对包含的所有项目进行平均价格之类的操作SUBDIVISION 字段中的 KNOLLWOOD 按日期范围、销售日期等进一步分割

我很清楚如何使用 SQL 来完成它，但正如我所说，我想在这里获得一些 Python 技能。最近几天我一直在阅读，但还没有找到关于这种用例的任何非常简单的插图。指向所述文档的指针将不胜感激。我意识到我可以使用驻留内存的 SQL-lite 但我的愿望是学习 Python 方法。我已经阅读了一些关于 Numpy 和 Scipy 的文章并加载了 sage 但仍然找不到一些有用的插图，因为这些工具似乎专注于只有数字作为元素的数组，我需要做很多字符串匹配以及日期范围计算和比较。

最终我需要替换表中的值(因为我有脏数据)，我现在通过一个包含所有脏变体并为最终使用提供“干净”答案的“转换表”来做到这一点。

最佳答案

您确定这是一个包含逗号分隔值的文件吗？这些行似乎由制表符分隔。

如果这是正确的，请在 DictReader 构造函数中指定制表符分隔符。

for row in csv.DictReader(items_file, dialect='excel', delimiter='\t'):
    for key in row:
        print 'key=%s, value=%s' % (key, row[key])

来源:http://docs.python.org/library/csv.html

关于python - 包含所有列名的 CSV 到 Python 字典？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/5695395/

27

4

0

文章推荐： python - 在 Python 中将二进制列表转为 PNG

文章推荐： python - 如何通过 Fabric 设置远程服务器时区？

文章推荐： python - Django pre_save 触发了两次

MySQL 列名
这个问题已经有答案了: When to use single quotes, double quotes, and backticks in MySQL (13 个答案) 已关闭 3 年前。我正在尝
SQL - 子查询(列名)
我需要一个返回某些列值的选择查询。我想要的列以“U_S”开头。 Select * from em 我需要转换上面的查询。 '*' 必须是以下结果(但带有逗号): select COLUMN_NAME
JPA OneToMany 列名
在JPA中设置一对多关系时如何设置外键的列名？我想将“items_id”的名称更改为“item_id” @OneToMany private List items; 我尝试了以下注释但没有成功: @
javascript - jqGrid搜索的任意索引(列名)
我有一个jqGrid列定义如下 name : 'idmycolumn', index : 'idmycolumn', width : 80,
查询的 MySql 列名
我是否可以编写一个带参数的存储过程，即 mysql 查询，存储过程返回查询的列名？例如我调用程序: 调用选择器('select * from users') 过程返回列名。使用 informatio
mysql concat 列名
嗨，我刚刚开始学习 sql，我希望使用 concat 将列合并为一个列，但没能做到。我可以在没有 concat 的情况下运行代码，但是当我使用 concat 时，它会给我一个错误代码。谁能告诉我我做错
postgresql - 列名 ... 在此结果集中找不到
我们正在使用 java jdk 1.7.0_45，postgresql jdbc 连接器 postgresql-9.3-1100.jdbc41.jar。这是我们问题的概要，下面粘贴了尽可能多的代码。
python - 返回新数据框中的第一个匹配值/列名
import pandas as pd import numpy as np rng = pd.date_range('1/1/2011', periods=6, freq='H') df = pd.
php - 使用PDO时如何获取原始表/列名？
借助 PHP 的 mysqli 扩展，我可以使用 fetch_field() 方法通过 orgname 和获取列和表的原始(无别名)名称结果中的 orgtable。 PDO 提供了方法getColu
php - 安全转义表名/列名
我在 php 中使用 PDO，因此无法使用准备好的语句转义表名或列名。以下是我自己实现它的万无一失的方法吗: $tn = str_replace('`', '', $_REQUEST['tn']);
R:行名、列名、暗号和名称适用
我想使用 apply 来跨越矩阵的行，并且我想在我的函数中使用当前行的行名。好像不能用rownames , colnames , dimnames或 names直接在函数内部。我知道我可以根据 thi
sql - 处理动态(用户提供的)列名
在编写管理数据的应用程序时，允许最终用户创建或删除最好表示为列的数据类别通常很有用。例如，我正在开发字典构建应用程序；用户可能会决定他们想要向数据添加“备用拼写”字段或其他内容，这可以很容易地表示为另
r - 如何从系列字符(列名)中删除最后两个元素？
在我的数据框中，许多列名称以“.y”结尾，如示例所示: dat <- data.frame(x1=sample(c(0:1)), id=sample(10), av1.y = sample(10) ,
sql - 数据库中所有列的逗号分隔列表(表名 | 列名...)
在 SQL Server 中，我希望看到 Table_Name 以及数据库中与该 Table_Name 关联的所有列。所以输出应该是这样的: TABLE_NAME COLUMN_N
r - 如何从系列字符(列名)中删除最后两个元素？
在我的数据框中，许多列名称以“.y”结尾，如示例所示: dat <- data.frame(x1=sample(c(0:1)), id=sample(10), av1.y = sample(10) ,
oracle - 验证 Oracle 列名
在一种情况下，我们动态创建 sql 到 create动态临时表。 table_name 没有问题，因为它是由我们决定的，但是列名是由我们无法控制的来源提供的。通常我们会使用以下查询检查列名: sel
python - Pandas GroupBy 列名
我有一个数据框，我们可以通过代理 df = pd.DataFrame({'a':[1,0,0], 'b':[0,1,0], 'c':[1,0,0], 'd':[2,3,4]}) 还有一个类别系列 ca
r - 编写用户函数以返回每个变量的列位置、列名、模式和类
我需要编写一个用户定义的函数，当应用于数据框时，它将返回列位置、列名称、模式和每个变量的类。我能够创建一个返回模式和类的，但是当我包含位置/名称时，我总是收到错误。我一直在这样做， myFunctio
hibernate - QueryDsl orderBy 列名
我刚开始使用 QueryDSL 并遇到了问题。是否可以使用列名进行 orderBy？我为 orderBy 动态路径生成找到了这个: Generic querydsl orderBy dynamic p
.net - 如何安全访问 DataGridView 列名？
操作 DataGridView 单元格时，您通常会执行以下操作: MyGrid.CurrentRow.Cells["EmployeeFirstName"].Value = "John"; 这一切都很好

首页

博学

6Ren·AI

商城

python - 包含所有列名的 CSV 到 Python 字典？