gpt4 book ai didi

python - Pandas 将文本文件读入数据框

转载 作者:行者123 更新时间:2023-12-04 15:17:19 24 4
gpt4 key购买 nike

我有一个 .txt 文件

[7, 9, 20, 30, 50]  [1-8]
[9, 14, 27, 31, 45] [2-5]
[7, 10, 22, 27, 38] [1-7]

我正在尝试使用 df = pd.read_fwf(readfile,header=None) 读入两列的数据框它不是两列,而是形成一个包含三列的数据框,有时会将第一个数字列表中的每一个读入五列

    0              1      2
0 [7, 9, 20, 30, 50] [1-8]
1 [9, 14, 27, 31, 45] [2-5]
2 [7, 10, 22, 27, 38] [1-7]

我不明白我做错了什么。有人可以帮忙吗?

最佳答案

您可以利用列表之间的两个空格

pd.read_csv(readfile, sep='\s\s', header=None, engine='python')

输出:

                     0      1
0 [7, 9, 20, 30, 50] [1-8]
1 [9, 14, 27, 31, 45] [2-5]
2 [7, 10, 22, 27, 38] [1-7]

pd.read_fwf没有明确的 widths 参数会尝试推断固定宽度。但是第一个列表的长度有所不同。每行分成两列没有固定的宽度。
如果您的数据没有定界符但每个值的字母数固定,则 widths 参数非常有用。 40 年前,这是一种常见的数据格式。

# data.txt
20200810ITEM02PRICE30COUNT001
20200811ITEM03PRICE31COUNT012
20200812ITEM12PRICE02COUNT107

pd.read_csv sep 参数接受多字符和正则表达式分隔符。这通常更灵活地将字符串分隔成列。

关于python - Pandas 将文本文件读入数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64099596/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com