- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
关闭。这个问题需要更多focused .它目前不接受答案。
想改善这个问题吗?更新问题,使其仅关注一个问题 editing this post .
去年关闭。
Improve this question
我需要在大量客户支持评论中计算一组给定形容词的词频。但是我不想包括那些被否定的。
例如,假设我的形容词列表是:[乐于助人、知识渊博、友好]。我想确保“友好”不包括在“代表不是很友好”这样的句子中。
我需要对文本进行完整的 NLP 解析还是有更简单的方法?我不需要超高精度。
我对 NLP 一点也不熟悉。我希望有一些没有那么陡峭的学习曲线并且不是那么处理器密集型的东西。
谢谢
最佳答案
这取决于您的数据来源。如果句子来自某种生成器,您可能可以自动拆分它们。否则你将需要 NLP,是的。
正确解析自然语言几乎是一个悬而未决的问题。它“主要”适用于英语,特别是因为英语句子倾向于坚持 SVO 顺序。例如,德语在这里很糟糕,因为不同的词序传达不同的重点(因此可以传达不同的含义,尤其是在使用反讽时)。此外,德语更倾向于使用从句。
NLP 显然是要走的路。至少需要一些基本的解析器。这也真的取决于你的任务:你需要确保每个人都是正确的,还是概率方法足够好? “疑难”案例可以丢弃或提供给人工审查吗?等等。
关于full-text-search - 计算形容词频率的技巧,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8874938/
有没有办法获得形容词的比较级/最高级的肯定形式?例如。更好->好;最大 -> 大。我使用最新版本的 NLTK。 最佳答案 我遇到了同样的问题,在网上搜索没有答案,然后发现实际上可以用 WordNet
我已经看到,对于动词,NLTK 中的 WordNet 相似性度量有时会返回“无”,但我明白这不应该发生在其他词性上。查看代码似乎很清楚,任何其他词类中的两个词对之间没有关系应该产生-1,而不是“无”。
是否可以使用 R 包 openNLP 提取 noun+noun 或 (adj|noun)+noun?也就是说,我想使用语言过滤来提取候选名词短语。你能指导我该怎么做吗?非常感谢。 感谢您的回复。这是代
是否可以使用 NLTK 的 Java 替代品来“验证”单词,正如在这个问题中看到的那样? Convert words between verb/noun/adjective forms 例如我想将 b
我是一名优秀的程序员,十分优秀!