Python:读取文本文件并将文件拆分为列表变量，每个变量各有 4 行-6ren

Python:读取文本文件并将文件拆分为列表变量，每个变量各有 4 行

转载作者：太空宇宙更新时间：2023-11-03 14:44:26

我有一个文本文件(fastq 文件)。文件格式为

1st line - ID
2nd Line - Sequence
3rd Line - something
4th Line - something else.

然后再次重复这 4 行。

例如:

1  @M9890393393
2 ATCTGTAAAA
3 +
4 FG%@ATAAAA
5  @M9890393394
6 ATGTCTATCC
7 +
8 AA%$$983089

我想做的是，拆分这个文件，这样我可以按 4 行读取这个文件。我可以制作一个列表，每个变量包含 4 行。在上面的示例中，我将列出包含 2 个变量的列表。

最佳答案

使用生成器，您可以定义一个惰性读取器，每次生成一个包含 4 个值的列表。

您可以如下所示，耗尽或延迟迭代生成器。

import csv
from io import StringIO

mystr = StringIO("""1  @M9890393393
2 ATCTGTAAAA
3 +
4 FG%@ATAAAA
5  @M9890393394
6 ATGTCTATCC
7 +
8 AA%$$983089
""")

def gen():
    # replace mystr with open('file.csv', 'r')
    with mystr as fin:
        reader = csv.reader(fin, delimiter=' ',  skipinitialspace=True)
        res = []
        for line in reader:
            res.append(line[1])
            if len(res) == 4:
                yield res
                res = []

耗尽发电机:

lines = list(gen())

print(lines)

[['@M9890393393', 'ATCTGTAAAA', '+', 'FG%@ATAAAA'],
 ['@M9890393394', 'ATGTCTATCC', '+', 'AA%$$983089']]

迭代生成器:

for line in gen():
    print(line)

['@M9890393393', 'ATCTGTAAAA', '+', 'FG%@ATAAAA']
['@M9890393394', 'ATGTCTATCC', '+', 'AA%$$983089']

关于Python:读取文本文件并将文件拆分为列表变量，每个变量各有 4 行，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50951355/

文章推荐： python3 http.client ssl证书错误

文章推荐： python - 求解线性系统的 sympy 问题

文章推荐： python - 在 Python 中从 https 站点获取 HTML 内容

文章推荐： python - 使用 Electrum 控制台验证付款

太空宇宙

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

Python:读取文本文件并将文件拆分为列表变量，每个变量各有 4 行