gpt4 book ai didi

python pandas.Series.str.contains WHOLE WORD

转载 作者:太空狗 更新时间:2023-10-30 00:54:15 25 4
gpt4 key购买 nike

df( Pandas 数据框)有三行。

col_name
"This is Donald."
"His hands are so small"
"Why are his fingers so short?"

我想提取包含“is”和“small”的行。

如果我这样做

df.col_name.str.contains("is|small", case=False)

然后它也捕捉到“他的”——这是我不想要的。

下面的查询是在 df.series 中捕获整个单词的正确方法吗?

df.col_name.str.contains("\bis\b|\bsmall\b", case=False)

最佳答案

不,正则表达式 /bis/b|/bsmall/b 会失败,因为您使用的是 /b,而不是 \b意思是“单词边界”。

改变它,你会得到一个匹配。我会推荐使用

\b(is|small)\b

至少对我来说,这个正则表达式更快一点,更易读一点。记得把它放在 raw string 里(r"\b(is|small)\b") 所以你不必转义反斜杠。

关于python pandas.Series.str.contains WHOLE WORD,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39359601/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com