gpt4 book ai didi

python - 使用 Pandas 访问 CSV 文件中方括号内的数字?

转载 作者:行者123 更新时间:2023-11-28 22:25:17 25 4
gpt4 key购买 nike

假设我有这种文件。

data

如何访问“有用”列中的数字?我需要单独的数字。最好是我可以将它们实际存储在 helpful_1helpful_2 列中。

我可以做这样的事情。

enter image description here

但老实说我不太喜欢这种方式。我也不认为这是最佳做法。顺便说一下,这是一个相当大的文件 (~2GB),所以这可能不是最好的方法。也许有更好的方法来访问它作为数据框?有什么想法吗?

另外我想知道 CSV 中的方括号被认为是什么。它们是某种列表吗?或者它没有任何意义?

谢谢。

更新:我已经在下面回答了我的问题。但我仍然对一些新建议持开放态度,因为我不确定自己的解决方案。如果有更优雅和高效的解决方案,我真的很想知道。另外,感谢所有发表评论/回答的人,我们非常感谢您的帮助。

最佳答案

编辑处理字符串:

df_out = df.assign(**df.helpful.apply(lambda x: pd.Series(eval(x))).rename(columns={0:'helpful_1',1:'helpful_2'}))

你可以这样做:

df.assign(**df.helpful.apply(pd.Series).rename(columns={0:'helpful_1',1:'helpful_2'}))

输出:

   helpful  number  helpful_1  helpful_2
0 [0, 1] 1 0 1
1 [0, 3] 2 0 3
2 [5, 6] 3 5 6
3 [8, 10] 4 8 10
4 [2, 5] 5 2 5

关于python - 使用 Pandas 访问 CSV 文件中方括号内的数字?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45634270/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com