gpt4 book ai didi

python - 匹配 DataFrame 中两个单词之间的字符串

转载 作者:太空宇宙 更新时间:2023-11-03 14:31:20 27 4
gpt4 key购买 nike

我有一个 DataFrame,其中一列包含我想从中提取一些信息的文本。

我有两个词:“类型”和“容量”,它们之间是一串数字和非数字字符+可能有空格 - 我想将其保存到新列中。

这是我的代码

df['new'] = df['text'].apply(lambda x: re.search(r'Type (\w+) Capacity', x).group(1))
print (df['new'])

它不会给我错误,但打印出以下内容:

Series([], Name: test, dtype: object)

我不明白出了什么问题。感谢您的帮助

最佳答案

你可以使用

df['new'] = df['text'].str.extract(r'Type (\w+) Capacity')

pandas.Series.str.extract方法只会返回捕获的值(与括号模式部分匹配的值)。

如果您想确保仅返回数据帧(或False以获取Series/Index/DataFrame),并且如果您在某些行上没有匹配项,.fillna('') 可能有用。

关于python - 匹配 DataFrame 中两个单词之间的字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47266536/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com