gpt4 book ai didi

python - 在 python 中使用 "bed"文件

转载 作者:行者123 更新时间:2023-12-01 20:26:59 25 4
gpt4 key购买 nike

我有一个 .bed 文件,其中包含 1000 行,每行中的单词由制表符 (\t) 分隔。如果我们将每个单词视为一列,则每行有 12 列。我需要一种方法将此 .bed 文件转换为矩阵,以便我可以轻松访问其列。例如,我需要访问第 12 列。有什么办法可以做到这一点吗?

我已经尝试过这个:

    import numpy as np
data = np.genfromtxt("myFile.bed")

但它无法正常工作。有人可以帮我吗?

最佳答案

BED 文件是标准的制表符分隔文本文件。 Tu 将其内容存储在内存中的通常方法是:

content = []
with open("myFile.bed")as f:
for line in f:
content.append(line.strip().split())

您可以在此处使用 numpy 数组而不是列表,或者根据需要使用 np.asarray 转换结果。

实际上很少需要它的矩阵,因为它们代表(基因组?)间隔并且通常非常大。大多数时候,您会在循环中的每一行修改/读取/执行某些函数:

with open("myFile.bed")as f:
for line in f:
L = line.strip().split()
# ... do something with L

否则,Pandas库实现了 R 中的“数据帧”(但我从未使用过它)。

关于python - 在 python 中使用 "bed"文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25213673/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com