gpt4 book ai didi

python - 如何在 Pandas 数据框中使用带有多个表达式的 str.contains()?

转载 作者:IT老高 更新时间:2023-10-28 22:18:02 29 4
gpt4 key购买 nike

我想知道是否有更有效的方法来使用 Pandas 中的 str.contains() 函数一次搜索两个部分字符串。我想在数据框中的给定列中搜索包含“nt”或“nv”的数据。现在,我的代码如下所示:

    df[df['Behavior'].str.contains("nt", na=False)]
df[df['Behavior'].str.contains("nv", na=False)]

然后我将一个结果附加到另一个结果。我想做的是使用一行代码来搜索任何包含“nt”或“nv”或“nf”的数据。我已经尝试了一些我认为应该可行的方法,包括在术语之间插入管道,但所有这些都会导致错误。我已经检查了文档,但我不认为这是一个选项。我收到这样的错误:

    ---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-113-1d11e906812c> in <module>()
3
4
----> 5 soctol = f_recs[f_recs['Behavior'].str.contains("nt"|"nv", na=False)]
6 soctol

TypeError: unsupported operand type(s) for |: 'str' and 'str'

有没有快速的方法来做到这一点?感谢您的帮助,我是初学者,但我喜欢 pandas 来处理数据。

最佳答案

它们应该是一个正则表达式,并且应该在一个字符串中:

"nt|nv"  # rather than "nt" | " nv"
f_recs[f_recs['Behavior'].str.contains("nt|nv", na=False)]

Python 不允许您对字符串使用 or (|) 运算符:

In [1]: "nt" | "nv"
TypeError: unsupported operand type(s) for |: 'str' and 'str'

关于python - 如何在 Pandas 数据框中使用带有多个表达式的 str.contains()?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19169649/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com