作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用 Yake(Yet Another Keyword Extractor)从数据框中提取关键字。我只想提取二元组和三元组,但 Yake 只允许设置最大 ngram 大小而不是最小大小。您将如何删除它们?
示例 df.head(0):
正文:“哦,是的,我喃喃自语,语言过渡现在处于不确定状态。”
关键词:'[('oui', 0.04491197687864554),('语言转换', 0.09700399286574239),('咕哝', 0.15831692877998726)]'
我想从关键字列中删除 oui、mumbled 和他们的分数。
感谢您的宝贵时间!
最佳答案
如果您的问题是关键字列表包含一些字母组合,您可以简单地执行一个过滤器来忽略没有空格的单词并创建一个新列表。我给你举个例子:
keywords_without_unigrams = []
for kw in keywords:
if(' ' in kw[0]):
keywords_without_unigrams.append(kw)
for kw in keywords_without_unigrams:
print(kw)
关于python - 删除不是二元组或三元组的关键字(Yake),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68192949/
我正在使用 Yake(Yet Another Keyword Extractor)从数据框中提取关键字。我只想提取二元组和三元组,但 Yake 只允许设置最大 ngram 大小而不是最小大小。您将如何
我是一名优秀的程序员,十分优秀!