gpt4 book ai didi

python - 数据具有与我拆分时相同的字符

转载 作者:太空宇宙 更新时间:2023-11-04 00:17:45 25 4
gpt4 key购买 nike

抱歉这个标题,我有点不确定怎么问这个问题。

我有一个游戏评论信息数据集。信息以逗号分隔,但某些信息(如标题或类型)中包含逗号。这些都是内引。我想将其转换为一个列表,但将引号内的任何内容都保留为单个索引,而不是两个。这是一个例子。这是原始数据:

14,Amazing,Mark of the Ninja,PC,9.0,"Action, Adventure",Y,2012,9,7

我使用 .rstrip().split(',') 得到:

[14, Amazing, Mark of the Ninga, PC, 9.0, "Action, Adventure", Y, 2012, 9, 7]

但是 “Action, Adventure” 产生两个索引。我希望将其作为单个索引,但我不确定如何去做。

我对正则表达式没有太多经验,但我猜这就是我正在寻找的解决方案。

关于解决此问题的最佳方法有什么建议吗?

最佳答案

内置 csv模块将处理这个问题,唯一的问题是该库实际上是为使用文件而设计的,因此文档可能对您的情况没有帮助,因为您有一个字符串。但是 reader 对象可以使用列表,因此您可以只传入 CSV 格式的字符串列表而不是文件:

import csv
print(list(csv.reader(["""14,Amazing,Mark of the Ninja,PC,9.0,"Action, Adventure",Y,2012,9,7"""])))
# [['14', 'Amazing', 'Mark of the Ninja', 'PC', '9.0', 'Action, Adventure', 'Y', '2012', '9', '7']]

关于python - 数据具有与我拆分时相同的字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50302291/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com