python - 用于在 Python 中解析复杂制表符分隔/csv 文件的循环-6ren

python - 用于在 Python 中解析复杂制表符分隔/csv 文件的循环

转载作者：太空宇宙更新时间：2023-11-03 13:46:08

25

4

需要说明的是，我是编程新手，我使用的是 Python 3.3!现在我在相同的基本布局中有很多文件。每个文件有 9 列，制表符分隔和可变数量的标题行——尽管大多数文件有 5 行。行或列没有标题!

看起来像这样:

#header1
#header2
#header3
#header4
#header5
ID1    asdf    asdk    asdfk    asdfkl    adsfkln    askdlfn   safsda    asdf    Notes1..
ID2    asdf    asdk    asdfk    asdfkl    adsfkln    askdlfn   safsda    asdf    Notes2..
ID3    asdf    asdk    asdfk    asdfkl    adsfkln    askdlfn   safsda    asdf    Notes3..
ID4    asdf    asdk    asdfk    asdfkl    adsfkln    askdlfn   safsda    asdf    Notes4..

我想要的唯一信息是第一列，其中包含 ID，最后一列包含有关每个 ID 的注释。我正在为一本像这样的字典拍摄

{'ID1': [notes1...]
 'ID2': [notes2...]....
 'ID1234': [notes1234...]}

但我也会很高兴有一个字典列表或类似的东西。

所以我首先将文本变成列表的列表，这样我就可以按索引查找条目:

import csv

list_all = list(csv.reader(open(r'complex_tabbed_file.gff', 'rb'), delimiter='\t'))

d = dict()
ID = data[5][0]     #starting at 5 to skip the header lines
notes = data[5][8]
d[ID]= notes

print (d)

这为我提供了我正在寻找的信息，但我一次只能读取一个条目。我需要创建一个循环来读取包含数百个条目的整个文件..关于起点的建议？

我研究并发现了这个:Read specific columns from a csv file with csv module?

描述了类似的情况，但编码有点让我头疼。因为我是一个新手，所以我很难将这个例子应用到我的特定案例中 =(

就迭代而言，这是我尝试过的:

i=0

if i < 4:
    i= i+1

if i >= 5:
    ID = list_all[i][0]
    notes = list_all[i][8] 
    i= i+1

print (d)

这会返回一个空字典 ( d={ } ) 不好。

也试过

d = dict()  
i=5
for line in list_all: 
    ID = list_all[i][0]
    notes = list_all[i][8] 
    i = i+1

print (d)

这给出了非常可爱的“列表索引超出范围”错误消息。如果有任何建议，我将不胜感激，谢谢!

最佳答案

您可以解决它迭代每一行并丢弃那些只有一个字段(标题)的问题:

import csv
import sys

d = dict()

with open(sys.argv[1], newline='') as csvfile:
    csvreader = csv.reader(csvfile, delimiter='\t')
    for row in csvreader:
        if len(row) == 1: continue
        _d = {row[0]: [row[-1]]}
        d.update(_d)

print(d)

像这样运行它:

python3 script.py infile

产生:

{
    'ID4': ['Notes4..'], 
    'ID1': ['Notes1..'], 
    'ID2': ['Notes2..'], 
    'ID3': ['Notes3..']
}

关于python - 用于在 Python 中解析复杂制表符分隔/csv 文件的循环，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/20108308/

25

4

0

文章推荐： python - 这个 .write 命令有什么问题？

文章推荐： c# - 带和组之间的区别

文章推荐： c# - joliver/EventStore 最终一致性

文章推荐： amazon-web-services - SSL 证书不起作用(AWS Route 53)

sql - 连续行之间的日期差异 - 复杂
我之前发布过question已得到答复，但我也需要对此进行查询。我有一个包含这样数据的表结构(日期格式为 dd/mm/yyyy)。 ID Account Number Unit Ad
javascript - 将对象数组转换为包含对象数组的对象(复杂)
我正在使用 React Native Calendars 并尝试为议程组件构建我的数据。预期的数据结构是(一个对象) { '2012-05-22': [{text: 'item 1 - any j
c - 复杂 while 语句的时间和空间复杂度
这个问题不太可能对任何 future 的访客有帮助；它只与一个较小的地理区域、一个特定的时间点或一个非常狭窄的情况相关，通常不适用于全世界的互联网受众。如需帮助使此问题更广泛适用，visit the
Mysql，复杂 ORDER BY
两列城镇和优先级。我需要对表进行排序，以便优先级=1的城镇排在第一位，并且不按名称 ASC 排序，而其余城镇则按名称 ASC 排序。我该怎么做？谢谢;) 更新 SELECT * FROM map
Mysql 复杂 SELECT
我有三个表“Hardware_model”、“Warehouse”和“Brand”，并且表以这种方式一起引用:Hardware_model 仓库Hardware_model 品牌现在我要执行以下
MySQL 复杂 SELECT
我有一个 MySQL 表 (tbl_filters)，包含 3 列:id、cat、val id 和 val 是数字，cat 是 varchar。每个 id 有多行。我还有另一个包含多个列的表 (tb
mysql 条件查询 - 复杂
我想获取字段的不同值，比方说:field1...这需要一个如下查询:“从表中选择不同的(字段1)” 但是，对于某些记录，field1 为空，并且还有另一列可以替代 field1，即 field2。对于
php - 修改MYSQL字段中的一个值有多个值(复杂)
表 1 - 用户 id username items 1 Paul 1(0020);2(0001); 表 2 - 项目 id name 1 name_here 在我的用户的项目中，我输入了 2(000
MySQL join同表按列显示行(复杂)
我想连接同一个表 4 次以获取列的显示方式，我不确定是否可以在 1 个 SQL 语句中完成。 tbl_用户名 id username 1 Adam 2 Bob 3 Chris tbl_机
javascript - 我该如何使其更加“复杂”？
首先，我刚刚开始自己学习JS，没有任何编程经验，这意味着我仍然要了解这种出色的编程语言的基本构建模块。我的问题与我编写的以下代码有关： let orderCount = 0; con
PHP - 从数据库中获取信息(复杂)
关闭。这个问题需要details or clarity .它目前不接受答案。想改进这个问题吗？通过 editing this post 添加细节并澄清问题. 关闭 9 年前。 Improve t
PHP + MySQL 复杂
我正在使用 XMAPP，MySQL 正在正常运行。在 phpMyAdmin 中，我不太明白这一点，所以我尝试在 PHP 中创建一个。使用此代码，它会告诉我数据库 benutzer。尽管我在 phpMy
algorithm - 寻找具有最大平均度数的子图。复杂？
是否有一种高效的算法可以找到平均度最大的子图(可能是图本身)？最佳答案 The paper "Finding a Maximum-Density Subgraph" by Andrew Goldbe
复杂「场景」数据导入导出
目录 1、业务背景 2、场景分析 3、流程设计 1、业务流程 2、导入流程
sql - 复杂(？)SQL 连接查询
我有 2 个表: 1) 包含自 1900 年 1 月 1 日以来所有日期的 Masterdates 表 2) Stockdata 表，其中包含表单中的股票数据日期、交易品种、开盘价、最高价、最低价、
.net - 复杂 UI 上的批量更新
我有一个非常复杂的 UI，其状态栏不断变化，其中包含多种类型的状态消息，并且 UI 具有复杂的图表控件和已加载的指示性地理 map 。现在这些小而复杂的区域的数据上下文具有同样复杂的 ViewMod
big-o - 复杂。为什么常量不重要？
有人可以用简单的方式向我解释为什么常量在大 O 表示法中无关紧要吗？为什么添加常量时复杂性保持不变。这不是作业问题，我只是想更好地理解这一点。让我明白这个大 O 是为了看到一个函数在接近无穷大时的行为
elasticsearch - 复杂 Elasticsearch 查询
我在 flex 搜索索引中有以下文档。 [{ "_index": "ten2", "_type": "documents", "_id": "c323c
LINQ - 如何保持(复杂)结果有序？
我有一个以零碎的方式构建的 LINQ 查询，如下所示: var initialQuery = from item in MyContext where xxx == yyy select item;
java - Hibernate 查询 - 复杂
我目前正在涉足 SQL，并且希望针对我所创建的问题获得一些帮助。为了练习一些编程，我正在制作一个 IOU 应用程序。下面是我存储的表我的借条记录(忽略一些相关栏目)。该表允许用户说“嘿，你欠我 X

首页

博学

6Ren·AI

商城

python - 用于在 Python 中解析复杂制表符分隔/csv 文件的循环