gpt4 book ai didi

python - Pandas 无法将 "||"识别为要拆分的字符串

转载 作者:行者123 更新时间:2023-12-03 20:26:05 26 4
gpt4 key购买 nike

我试图将一个 DataFrame 分成两列并得到结果的左边部分,但是 pandas 不识别该字符串并给我一个空的输出。

q=['Sar || var','lol ||']
y=pd.DataFrame(q)
split_data = y[0].str.split("||", n = 1, expand = False).str[0]
print(split_data)

out

0
1
Name: 0, dtype: object

最佳答案

该方法的文档有些欺骗性。发生的情况是,对于超过 1 个字符的模式,pandas 将分隔符解释为 regular expression。 .可以看到实现 here .

您可以使用 "||" 作为文字的非正则表达式分隔符,方法是使用反斜杠:

series.str.split("\\|\\|")

请注意,python 提供了一个“原始”syntax对于可用于编写正则表达式的字符串文字,无需转义反斜杠本身:

series.str.split(r"\|\|")

您可以查阅 re 模块的文档,了解使用多字符分隔符时需要转义的特殊字符列表。或者,只需使用函数 re.escape:

import re
series.str.split(re.escape("||"))

关于python - Pandas 无法将 "||"识别为要拆分的字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60308617/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com