gpt4 book ai didi

python - 我可以导入具有不同空格分隔符的文本文件吗?

转载 作者:行者123 更新时间:2023-11-28 21:38:07 36 4
gpt4 key购买 nike

我想导入此 .txt 文件,但由于“No”和“Record”之间的空格,pandas 将它们导入为单独的列。我怎样才能拥有不同的 sep?正则表达式?

data = pd.read_table('file.txt', sep=' ', header=None)

数据

01/01/1933  NO RECORD   NO RECORD   MISSING     MISSING
01/02/1933 NO RECORD NO RECORD MISSING MISSING
01/03/1933 NO RECORD NO RECORD MISSING MISSING
01/04/1933 NO RECORD NO RECORD MISSING MISSING
01/05/1933 NO RECORD NO RECORD MISSING MISSING
01/06/1933 NO RECORD NO RECORD MISSING MISSING
01/07/1933 NO RECORD NO RECORD 368.00 MISSING
01/08/1933 NO RECORD NO RECORD MISSING MISSING
01/09/1933 NO RECORD NO RECORD MISSING MISSING
01/10/1933 NO RECORD NO RECORD MISSING MISSING
01/11/1933 NO RECORD NO RECORD MISSING MISSING

当前导入

**  0   1   2   3   4   5
0 01/01/1933\tNO RECORD \tNO RECORD \tMISSING \tMISSING
1 01/02/1933\tNO RECORD \tNO RECORD \tMISSING \tMISSING
2 01/03/1933\tNO RECORD \tNO RECORD \tMISSING \tMISSING
3 01/04/1933\tNO RECORD \tNO RECORD \tMISSING \tMISSING
4 01/05/1933\tNO RECORD \tNO RECORD \tMISSING \tMISSING**

最佳答案

这看起来像一个制表符分隔的文件。您可以使用 sep='\t',它应该可以正常工作。

事实上,pd.read_table 的默认值已经是 sep='\t

关于python - 我可以导入具有不同空格分隔符的文本文件吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48633861/

36 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com