gpt4 book ai didi

python - 在大型 txt 文件 pandas 中查找标题

转载 作者:太空宇宙 更新时间:2023-11-03 11:39:05 25 4
gpt4 key购买 nike

假设我有一个包含几百万行的大文件。前 300 多行(可变数字)包含有关文件的信息,然后在数据之前有一个标题行。我不知道标题在哪一行,但我知道它以什么开头。这是我的数据示例:

#This File contains some cool suff
#We will see what line the header is on
#Maybe it is in this line
#CHROM POS ID
1 100 17
2 200 18
2 300 18

标题行是#CHROM POS ID

这是我尝试过的,但它返回list index out of range:

database = pd.read_table(infile, header=[num for num,line in enumerate(infile) if line.startswith("#CHROM")])

我认为我曾天真地假设 pd.read_table 的操作方式与 with open() 的操作方式相同,并且这可能有效。任何帮助将不胜感激!

最佳答案

编辑:刚刚看到它是一个文本文件

设置一个变量作为标题行,

lineno = 0
for line in infile.readlines():
if line.startswith('#CHROM'):
headerrow = lineno
lineno += 1

然后当您引入文件时,您可以执行类似 pd.read_table('my_file.txt', header = headerrow) 的操作以及您需要的任何其他参数。

关于python - 在大型 txt 文件 pandas 中查找标题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53549090/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com