gpt4 book ai didi

python - 空格分隔的 csv,列名和值中有空格

转载 作者:太空宇宙 更新时间:2023-11-04 04:00:06 25 4
gpt4 key购买 nike

我必须将一个 csv 文件加载到数据框,但列用单个空格分隔,并且列/值名称中也包含空格。文件看起来像这样:

'Mod Ports Card Type                              Model              Serial No.',
' 3 20 7600 ES+ 7600-ES+20G3C SAL1550Y9DL',
' 5 2 Route Switch Processor 720 (Active) RSP720-3C-GE SAL16095Q9W',
etc.

到目前为止,我最好的想法是检查列名中单词的长度,然后检查相应的值是否较低,但在某些情况下,如“Card Type”和“7600 ES+”可以可能被识别为 2 个单独的列。

重要的是这个解决方案必须是通用的,并且不仅适用于这个示例,也适用于其他示例。我的目标是将此文件读取到数据框或任何其他数据结构。

我尝试使用 pd.read_fwf() 函数,但它给出了错误的结果。我的文件的输出数据框如下所示:

wrong output

因此它不仅没有正确捕获Card type,而且将它与端口合并并创建了一些未命名的列。

最佳答案

您可以使用 read_fwf() :

df = pd.read_fwf('my_file.csv')

如果您为每列提供 widths 参数,效果会最好。

编辑

使用您提供的数据,您可以通过 colspecs 参数获得结果:

df = pd.read_fwf(a, colspecs=[(0, 4), (4, 10), (10, 49), (49, 68), (68, 1000)])
df

Mod Ports Card Type Model Serial No.
0 3 20 7600 ES+ 7600-ES+20G3C SAL1550Y9DL
1 5 2 Route Switch Processor 720 (Active) RSP720-3C-GE SAL16095Q9W

关于python - 空格分隔的 csv,列名和值中有空格,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58554269/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com