- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想尝试根据用户在搜索框中输入的词来确定用户的个性特征。下面是一个例子:
搜索词 : “电脑”
检测到的个性/描述 : 分析的、逻辑的、系统的、有条理的
我知道这项任务非常重要。我以前使用过 WordNet,但我不确定它是否包含每个名词节点的形容词云。词性标注本身就是一个野兽,所以我不确定建立自己的语料库并搜索与关键字共存的形容词词频是最好的主意,但我将在下面解释。
我目前正在使用 Wikipedia 转储,在删除停用词(和、或、of、to、a 等...)后处理每篇文章的词频。我的想法是可能在整个语料库中搜索形容词(使用 WordNet 进行词性标注)和名词的共存(例如,形容词 逻辑 经常与名词 计算机 共存) ,并根据词干形容词的相对频率,判断它是否与名词在语义上相关。潜在的应用是巨大的。
另一个想法是对名词进行词干,搜索以该词干开头的形容词,然后搜索该形容词的同义词。例子:
搜索词 : “电脑”
阀杆 :“计算-”
带词干的形容词 : 计算
同义词 :???
问题是名词的形容词形式并不总是有形容词形式,有些名词词干会与非常错误的形容词相匹配。 *坏*示例:
搜索词 :“运行”(严格来说是动名词,但仍然是名词)
阀杆 : “跑-”
带词干的形容词 : 流鼻涕
同义词 : 不是我想要的词。想找到诸如“运动”、“上进”、“纪律严明”之类的词
这是以前做过的事情吗?你对我如何处理这个问题有什么建议吗?这几乎就像我正在寻求为文档中的“重要”词生成形容词云。
编辑:我意识到这个问题没有“正确”的答案。我将奖励任何提出具有最佳理论潜力的方法的人。
最佳答案
WordNet 没有你需要的东西——它(几乎)不包含关于不是同义词或没有分层链接(椅子->家具)等的词之间关系的信息。
只需使用 OpenNLP (http://opennlp.apache.org) 并解析大量文本 - OpenNLP 解析器将检测句子中的动词-形容词/名词-形容词,让您可以构建关系数据库。
此时剩下的就是根据预定义的形容词列表过滤数据库。
关于semantic-markup - 查找与名词输入相关的形容词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11504940/
有没有办法获得形容词的比较级/最高级的肯定形式?例如。更好->好;最大 -> 大。我使用最新版本的 NLTK。 最佳答案 我遇到了同样的问题,在网上搜索没有答案,然后发现实际上可以用 WordNet
我已经看到,对于动词,NLTK 中的 WordNet 相似性度量有时会返回“无”,但我明白这不应该发生在其他词性上。查看代码似乎很清楚,任何其他词类中的两个词对之间没有关系应该产生-1,而不是“无”。
是否可以使用 R 包 openNLP 提取 noun+noun 或 (adj|noun)+noun?也就是说,我想使用语言过滤来提取候选名词短语。你能指导我该怎么做吗?非常感谢。 感谢您的回复。这是代
是否可以使用 NLTK 的 Java 替代品来“验证”单词,正如在这个问题中看到的那样? Convert words between verb/noun/adjective forms 例如我想将 b
我是一名优秀的程序员,十分优秀!