gpt4 book ai didi

python - 如何将文本文件加载到 pandas 数据框中?

转载 作者:行者123 更新时间:2023-11-30 22:36:28 24 4
gpt4 key购买 nike

我有一个看起来像这样的文本文件:

`

 101   the   323
103 to 324
104 is 325

其中分隔符是四个空格。我正在尝试 read_csv 函数,以便将其转换为 pandas 数据框。

data= pd.read_csv('file.txt', sep=" ", header = None)

但是它给了我很多 NaN 值

    101\tthe\tthe\t10115  NaN  NaN     NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN
102\tto\tto\t5491 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
103\tof\tof\t4767 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
104\ta\ta\t4532 NaN NaN NaN NaN NaN NaN NaN NaN NaN Na

有什么方法可以将文本文件读取为正确的 csv 格式。

最佳答案

如果需要分隔符正好 4 个空格:

data = pd.read_csv('file.txt', sep="\s{4}", header = None, engine='python')
print (data)
0 1 2
0 101 the 323
1 103 to 324
2 104 is 325

或者使用参数 delim_whitespace=True (感谢 carthurs )或 \s+ 如果需要分隔一个或多个空格:

data = pd.read_csv('file.txt', sep="\s+", header = None)
data = pd.read_csv('file.txt', delim_whitespace=True, header = None)

但是如果分隔符是制表符:

data = pd.read_csv('file.txt', sep="\t", header = None)

关于python - 如何将文本文件加载到 pandas 数据框中?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44157856/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com