作者热门文章
- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我的目标是找出某些关键字组合是否可以出现在充满文本字符串(新闻文章的标题)的列中。然后我想在条形图中绘制频率。
我使用 Pandas 数据框完成了以下操作:
pvv_news = df[df['desc'].str.contains("pvv", case=True)]
pvv_month = win.groupby(win.index.month).size()
pvv_month.index = ['January', 'February', 'March', 'April', 'May', 'June']
pvv_month.plot(kind='bar')
给出:
现在,我想不通的是如何组合 AND 和 OR 以获得更具体的结果。我想到但行不通的示例:
pvv_news = df[df['desc'].str.contains("(pvv)&(nederland|overheid)", case=True)]
我查看了以下函数,但我无法理解:
最佳答案
如果我按照你想做的去做,这应该可行:
pvv_news = df[(df['desc'].str.contains("pvv"), case = True) &
((df['desc'].str.contains("nederland"), case = True) |
(df['desc'].str.contains("overheid"), case = True)) ]
关于python - 如何在 Pandas 数据框中组合 AND 和 OR 运算符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32071753/
我是一名优秀的程序员,十分优秀!