- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个单词列表,只想保留名词。
这不是 Extracting all Nouns from a text file using nltk 的重复项
在链接的问题中处理一段文本。接受的答案提出了一个标记器。我知道标记文本的不同选项(nlkt、textblob、spacy),但我无法使用它们,因为我的数据不包含句子。我只有单个单词的列表:
would
research
part
technologies
size
articles
analyzes
line
nltk
有多种语料库可供选择。我发现 verbnet
包含完整的动词列表。但到目前为止我还没有看到任何类似的名词。有没有类似字典的东西,我可以在其中查找单词是否是名词、动词、形容词等?
这可能可以通过一些在线服务来完成。例如,微软翻译在其响应中返回大量信息:https://learn.microsoft.com/en-us/azure/cognitive-services/translator/reference/v3-0-dictionary-lookup?tabs=curl但这是一项付费服务。我更喜欢 python 包。
关于单词的歧义:理想情况下,我想要一本可以告诉我单词可以具有的所有功能的字典。例如,“鱼”既是名词又是动词。 “吃”只是动词,“狗”只是名词。我知道这不是一门精确的科学。一个可行的解决方案只是删除所有不能是名词的单词。
最佳答案
尝试使用 wordnet ?
from nltk.corpus import wordnet
words = ["would","research","part","technologies","size","articles","analyzes","line"]
for w in words:
syns = wordnet.synsets(w)
print(w, syns[0].lexname().split('.')[0]) if syns else (w, None)
您应该看到:
('would', None)
('research', u'noun')
('part', u'noun')
('technologies', u'noun')
('size', u'noun')
('articles', u'noun')
('analyzes', u'verb')
('line', u'noun')
关于python文本处理: identify nouns from individual words,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53180810/
我的任务其实很简单。也许我太习惯于 C++ 而看不到我的错。我有两个类(class)和一个 list 。该列表应包括由 class1 构成的所有对象,而 class1 还包括 class2 的所有对象
我有三个简单的表:users、profile 和 watched,其中包含用户的 ID 和他们观看的电影标题。 下面的脚本显示了表watched中不同用户的匹配值: $id = $_SESSION['
我正在使用具有以下简单本体的 Protege 4.3(也尝试过 5-beta): Class: Person Class: Man SubClassOf: Person Ind
在文档中,Symfony 有一种方法可以访问 customize a Individual field ,基于小部件的名称/ID。 {% form_theme form _self %} {% blo
这似乎是一个微不足道的问题。我需要知道,如果我在值(value) 99 美元的 iOS 开发者计划:公司 下注册我的公司,我现在可以在同一家公司下添加开发者。 我的问题是,这些开发者是否还需要分别拥有
有没有办法指定 matplotlib 表中各个列的宽度? 我表中的第一列仅包含 2-3 位 ID,我希望此列比其他列小,但我似乎无法让它工作。 假设我有一张这样的表: import matplotli
我有一个应用程序,我可以在流程的一部分中以 JSON 格式将消息写入 Azure 服务总线队列。我有一个下游进程,我希望将该消息从队列中弹出,将 json 转换为对象,然后处理该对象。 我将消息推送到
我有一个程序,它告诉用户输入三个int并将每个整数转换为字符串。 即 1 = 1 ; ...等等。这里的问题是为每个用户输入定义int。我怎样才能只用一个输入来获取它并循环它以获取另一个输入,考虑到单
我已经在 unity 中工作了一段时间,并且已经通过关注 this 获得了基本的多人游戏设置。教程。但是,我想添加更多东西,其中之一是跟踪每个玩家的相机。我已经查过了,甚至找到了该教程创建者的评论。所
我有一个单词列表,只想保留名词。 这不是 Extracting all Nouns from a text file using nltk 的重复项 在链接的问题中处理一段文本。接受的答案提出了一个标
一个愚蠢的问题:假设我有一个存储在 View 状态中的对象。我将其标记为可序列化。我还在我的 WCF 服务中重复使用相同的对象。但是 Web 服务序列化并公开了一些不需要/不安全地显示给服务客户端的内
我正在编写 Rspec 测试,但它们失败了,因为 Mysql 无法识别字段列表中的 individual 列。 当我查看内部时,individual 列确实存在于数据库中。 schema.rb 将其列
将一些自定义样式应用到不符合主题默认样式的单个小部件元素的最方便的方法是什么。我仍然对装饰器的用法感到困惑。如何应用多个装饰器,例如。用于小部件元素的边框属性和背景。 我尝试过使用自定义装饰器,例如。
我正在尝试通过 Eclipse 访问本体。我使用猫头鹰 api。我在 Protegé 中创建我的本体,但是我想通过代码创建和分类新的个体。这怎么可能?我用谷歌搜索了所有内容,但找不到任何有用的信息。
我想将可配置产品的所有子项设置为“单独不可见”,并且还为可配置产品的子项激活网站下的复选框。 有办法吗? 最佳答案 如果您没有 MySQL 访问权限,我相信这也可以: $sites=Mage::app
使用 maptplotlib,我使用 scatter 方法绘制了一些点(参见下面的代码)。我想单独标记每个点。 此代码将用 labels 数组标记每个点,但我希望我的第一个点用 labels[0] 标
我目前正在用 C 语言编写嵌入式应用程序,其中性能至关重要。 目前,我正在分配大量空内存,如下所示:calloc(1, num_bytes) - 然而,我只是将 num_bytes 计算为多个项目和代
我有一个接受多个参数的程序,例如 breakfast.py --customer=vikings eggs sausage bacon 可以从特定选项列表中指定“鸡蛋”、“香肠”和“培根”。 现在我希
我想听取表单的值更改,但不是针对整个表单,而是仅针对已更改的表单控件。 例如,如果我的表单看起来像这样。 this.form = this._fb.group({ firstName: [''],
在 W3 OWL 规范中,个体的属性分为两组:数据类型属性和对象属性。定义了对象属性(正如我发现的一篇文章所说的那样): "Object properties (owl:ObjectProperty)
我是一名优秀的程序员,十分优秀!