gpt4 book ai didi

python - 需要帮助格式化 .txt 文件并将其放入数据框中

转载 作者:太空宇宙 更新时间:2023-11-03 15:42:28 26 4
gpt4 key购买 nike

我有一个具有以下格式的 .txt 文件:

CIK|Company Name|Form Type|Date Filed|Filename
--------------------------------------------------------------------------------
1000032|BINCH JAMES G|4|2016-11-07|edgar/data/1000032/0001209191-16-148633.txt
1000032|BINCH JAMES G|4|2016-12-02|edgar/data/1000032/0001209191-16-153119.txt
1000045|NICHOLAS FINANCIAL INC|10-Q|2016-11-09|edgar/data/1000045/0001193125-16-763849.txt
1000045|NICHOLAS FINANCIAL INC|4|2016-10-04|edgar/data/1000045/0001000045-16-000006.txt

我想做的是导入这些信息,然后将其插入到数据框中,每个部分都在“|”之后在一个新列中,每个新行一个新条目。我有将 .csv 和格式良好的文件导入数据帧的经验,但从未处理过如此困惑的事情。如果您想使用 .txt 文件,请告诉我。

感谢您提前提供的帮助。

最佳答案

假设您有以下文本文件:

CIK|Company Name|Form Type|Date Filed|Filename
--------------------------------------------------------------------------------
1000032|BINCH JAMES G|4|2016-11-07|edgar/data/1000032/0001209191-16-148633.txt
1000032|BINCH JAMES G|4|2016-12-02|edgar/data/1000032/0001209191-16-153119.txt
1000045|NICHOLAS FINANCIAL INC|10-Q|2016-11-09|edgar/data/1000045/0001193125-16-763849.txt
1000045|NICHOLAS FINANCIAL INC|4|2016-10-04|edgar/data/1000045/0001000045-16-000006.txt

解决方案:

df = pd.read_csv(filename, sep='|', skiprows=[1], parse_dates=['Date Filed'])

结果:

In [94]: df
Out[94]:
CIK Company Name Form Type Date Filed Filename
0 1000032 BINCH JAMES G 4 2016-11-07 edgar/data/1000032/0001209191-16-148633.txt
1 1000032 BINCH JAMES G 4 2016-12-02 edgar/data/1000032/0001209191-16-153119.txt
2 1000045 NICHOLAS FINANCIAL INC 10-Q 2016-11-09 edgar/data/1000045/0001193125-16-763849.txt
3 1000045 NICHOLAS FINANCIAL INC 4 2016-10-04 edgar/data/1000045/0001000045-16-000006.txt

In [95]: df.dtypes
Out[95]:
CIK int64
Company Name object
Form Type object
Date Filed datetime64[ns]
Filename object
dtype: object

关于python - 需要帮助格式化 .txt 文件并将其放入数据框中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42012276/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com