- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在寻找一种使用 wordnet 查找特定单词的所有同义词的方法。我正在使用 JAWS。
例如:
爱(v):欣赏、奉承、依恋、着迷、为之疯狂、迷恋、着迷、着迷、喜欢、爱上与、封圣、关心、珍惜、选择、神化、喜欢、喜爱、尊重、赞扬、爱上、幻想、荣耀、追求、继续......
爱(n):同义词:奉承、感情、忠诚、和睦、多情、恋情、欣赏、热情、热情、依恋、案例*、珍惜、迷恋、喜悦、奉献、奉献、情感、着迷、享受、热情、忠诚、火焰、喜爱、友谊、渴望、偶像崇拜、倾向、迷恋、参与
在相关的 question 用户 Ram 中指出了一些代码,但这还不够,因为它只是给出了截然不同的输出:
爱,激情:任何温暖的感情或奉献的对象亲爱的,亲爱的,最亲爱的,亲爱的,爱:所爱的人;用作表达爱意的词语爱情、性爱、色情之爱:对性欲和吸引力的深刻感受爱情:网球或 Squash 得分为零性爱、做爱、做爱、爱情、爱情生活:两个人之间的性事件(通常包括性交)爱:非常喜爱或喜爱
那么我如何实现它,wordnet 适合我想做的事情吗?
最佳答案
坚持使用 WordNet,您可以尝试使用语义相似性来确定两个单词(同义词集)是否足够相似以成为同义词。下面是一个简单的例子,来自修改我在 semantic similarity using WordNet 上的另一个答案。 .
但它确实有问题:
尽管如此,它比单独使用 lemma_names
产生更多的同义词,所以我把它留在这里以防它可能有用(也许与其他东西结合使用)。
>>> from nltk.corpus import wordnet as wn
>>> def syn(word, lch_threshold=2.26):
for net1 in wn.synsets(word):
for net2 in wn.all_synsets():
try:
lch = net1.lch_similarity(net2)
except:
continue
# The value to compare the LCH to was found empirically.
# (The value is very application dependent. Experiment!)
if lch >= lch_threshold:
yield (net1, net2, lch)
>>> for x in syn('love'):
print x
上面的代码输出:
(Synset('love.n.01'), Synset('feeling.n.01'), 2.538973871058276)
(Synset('love.n.01'), Synset('conditioned_emotional_response.n.01'), 2.538973871058276)
(Synset('love.n.01'), Synset('emotion.n.01'), 2.9444389791664407)
(Synset('love.n.01'), Synset('worship.n.02'), 2.9444389791664407)
(Synset('love.n.01'), Synset('anger.n.01'), 2.538973871058276)
(Synset('love.n.01'), Synset('fear.n.01'), 2.538973871058276)
(Synset('love.n.01'), Synset('fear.n.03'), 2.538973871058276)
(Synset('love.n.01'), Synset('anxiety.n.02'), 2.538973871058276)
(Synset('love.n.01'), Synset('joy.n.01'), 2.538973871058276)
(Synset('love.n.01'), Synset('love.n.01'), 3.6375861597263857)
(Synset('love.n.01'), Synset('agape.n.02'), 2.9444389791664407)
(Synset('love.n.01'), Synset('agape.n.01'), 2.9444389791664407)
(Synset('love.n.01'), Synset('filial_love.n.01'), 2.9444389791664407)
(Synset('love.n.01'), Synset('ardor.n.02'), 2.9444389791664407)
(Synset('love.n.01'), Synset('amorousness.n.01'), 2.9444389791664407)
(Synset('love.n.01'), Synset('puppy_love.n.01'), 2.9444389791664407)
(Synset('love.n.01'), Synset('devotion.n.01'), 2.9444389791664407)
(Synset('love.n.01'), Synset('benevolence.n.01'), 2.9444389791664407)
(Synset('love.n.01'), Synset('beneficence.n.01'), 2.538973871058276)
(Synset('love.n.01'), Synset('heartstrings.n.01'), 2.9444389791664407)
(Synset('love.n.01'), Synset('lovingness.n.01'), 2.9444389791664407)
(Synset('love.n.01'), Synset('warmheartedness.n.01'), 2.538973871058276)
(Synset('love.n.01'), Synset('loyalty.n.02'), 2.9444389791664407)
(Synset('love.n.01'), Synset('hate.n.01'), 2.538973871058276)
(Synset('love.n.01'), Synset('emotional_state.n.01'), 2.538973871058276)
(Synset('love.n.02'), Synset('content.n.05'), 2.538973871058276)
(Synset('love.n.02'), Synset('object.n.04'), 2.9444389791664407)
(Synset('love.n.02'), Synset('antipathy.n.02'), 2.538973871058276)
(Synset('love.n.02'), Synset('bugbear.n.02'), 2.538973871058276)
(Synset('love.n.02'), Synset('execration.n.03'), 2.538973871058276)
(Synset('love.n.02'), Synset('center.n.06'), 2.538973871058276)
(Synset('love.n.02'), Synset('hallucination.n.03'), 2.538973871058276)
(Synset('love.n.02'), Synset('infatuation.n.03'), 2.538973871058276)
(Synset('love.n.02'), Synset('love.n.02'), 3.6375861597263857)
(Synset('beloved.n.01'), Synset('person.n.01'), 2.538973871058276)
(Synset('beloved.n.01'), Synset('lover.n.01'), 2.9444389791664407)
(Synset('beloved.n.01'), Synset('admirer.n.03'), 2.538973871058276)
(Synset('beloved.n.01'), Synset('beloved.n.01'), 3.6375861597263857)
(Synset('beloved.n.01'), Synset('betrothed.n.01'), 2.538973871058276)
(Synset('beloved.n.01'), Synset('boyfriend.n.01'), 2.538973871058276)
(Synset('beloved.n.01'), Synset('darling.n.01'), 2.538973871058276)
(Synset('beloved.n.01'), Synset('girlfriend.n.02'), 2.538973871058276)
(Synset('beloved.n.01'), Synset('idolizer.n.01'), 2.538973871058276)
(Synset('beloved.n.01'), Synset('inamorata.n.01'), 2.538973871058276)
(Synset('beloved.n.01'), Synset('inamorato.n.01'), 2.538973871058276)
(Synset('beloved.n.01'), Synset('kisser.n.01'), 2.538973871058276)
(Synset('beloved.n.01'), Synset('necker.n.01'), 2.538973871058276)
(Synset('beloved.n.01'), Synset('petter.n.01'), 2.538973871058276)
(Synset('beloved.n.01'), Synset('romeo.n.01'), 2.538973871058276)
(Synset('beloved.n.01'), Synset('soul_mate.n.01'), 2.538973871058276)
(Synset('beloved.n.01'), Synset('squeeze.n.04'), 2.538973871058276)
(Synset('beloved.n.01'), Synset('sweetheart.n.01'), 2.538973871058276)
(Synset('love.n.04'), Synset('desire.n.01'), 2.538973871058276)
(Synset('love.n.04'), Synset('sexual_desire.n.01'), 2.9444389791664407)
(Synset('love.n.04'), Synset('love.n.04'), 3.6375861597263857)
(Synset('love.n.04'), Synset('aphrodisia.n.01'), 2.538973871058276)
(Synset('love.n.04'), Synset('anaphrodisia.n.01'), 2.538973871058276)
(Synset('love.n.04'), Synset('passion.n.05'), 2.538973871058276)
(Synset('love.n.04'), Synset('sensuality.n.01'), 2.538973871058276)
(Synset('love.n.04'), Synset('amorousness.n.02'), 2.538973871058276)
(Synset('love.n.04'), Synset('fetish.n.01'), 2.538973871058276)
(Synset('love.n.04'), Synset('libido.n.01'), 2.538973871058276)
(Synset('love.n.04'), Synset('lecherousness.n.01'), 2.538973871058276)
(Synset('love.n.04'), Synset('nymphomania.n.01'), 2.538973871058276)
(Synset('love.n.04'), Synset('satyriasis.n.01'), 2.538973871058276)
(Synset('love.n.04'), Synset('the_hots.n.01'), 2.538973871058276)
(Synset('love.n.05'), Synset('bowling_score.n.01'), 2.538973871058276)
(Synset('love.n.05'), Synset('football_score.n.01'), 2.538973871058276)
(Synset('love.n.05'), Synset('baseball_score.n.01'), 2.538973871058276)
(Synset('love.n.05'), Synset('basketball_score.n.01'), 2.538973871058276)
(Synset('love.n.05'), Synset('number.n.02'), 2.538973871058276)
(Synset('love.n.05'), Synset('score.n.03'), 2.9444389791664407)
(Synset('love.n.05'), Synset('stroke.n.06'), 2.538973871058276)
(Synset('love.n.05'), Synset('birdie.n.01'), 2.538973871058276)
(Synset('love.n.05'), Synset('bogey.n.02'), 2.538973871058276)
(Synset('love.n.05'), Synset('deficit.n.03'), 2.538973871058276)
(Synset('love.n.05'), Synset('double-bogey.n.01'), 2.538973871058276)
(Synset('love.n.05'), Synset('duck.n.02'), 2.538973871058276)
(Synset('love.n.05'), Synset('eagle.n.02'), 2.538973871058276)
(Synset('love.n.05'), Synset('double_eagle.n.01'), 2.538973871058276)
(Synset('love.n.05'), Synset('game.n.06'), 2.538973871058276)
(Synset('love.n.05'), Synset('lead.n.07'), 2.538973871058276)
(Synset('love.n.05'), Synset('love.n.05'), 3.6375861597263857)
(Synset('love.n.05'), Synset('match.n.05'), 2.538973871058276)
(Synset('love.n.05'), Synset('par.n.01'), 2.538973871058276)
(Synset('sexual_love.n.02'), Synset('bondage.n.03'), 2.538973871058276)
(Synset('sexual_love.n.02'), Synset('outercourse.n.01'), 2.538973871058276)
(Synset('sexual_love.n.02'), Synset('safe_sex.n.01'), 2.538973871058276)
(Synset('sexual_love.n.02'), Synset('sexual_activity.n.01'), 2.9444389791664407)
(Synset('sexual_love.n.02'), Synset('conception.n.02'), 2.538973871058276)
(Synset('sexual_love.n.02'), Synset('sexual_intercourse.n.01'), 2.538973871058276)
(Synset('sexual_love.n.02'), Synset('pleasure.n.05'), 2.538973871058276)
(Synset('sexual_love.n.02'), Synset('sexual_love.n.02'), 3.6375861597263857)
(Synset('sexual_love.n.02'), Synset('carnal_abuse.n.01'), 2.538973871058276)
(Synset('sexual_love.n.02'), Synset('coupling.n.03'), 2.538973871058276)
(Synset('sexual_love.n.02'), Synset('reproduction.n.05'), 2.538973871058276)
(Synset('sexual_love.n.02'), Synset('foreplay.n.01'), 2.538973871058276)
(Synset('sexual_love.n.02'), Synset('perversion.n.02'), 2.538973871058276)
(Synset('sexual_love.n.02'), Synset('autoeroticism.n.01'), 2.538973871058276)
(Synset('sexual_love.n.02'), Synset('promiscuity.n.01'), 2.538973871058276)
(Synset('sexual_love.n.02'), Synset('lechery.n.01'), 2.538973871058276)
(Synset('sexual_love.n.02'), Synset('homosexuality.n.01'), 2.538973871058276)
(Synset('sexual_love.n.02'), Synset('bisexuality.n.02'), 2.538973871058276)
(Synset('sexual_love.n.02'), Synset('heterosexuality.n.01'), 2.538973871058276)
(Synset('sexual_love.n.02'), Synset('bestiality.n.02'), 2.538973871058276)
# ...
关于nlp - Wordnet 查找同义词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15730473/
我正在尝试为 WOLF(Wordnet Libre du Français,免费法语 Wordnet)创建一个界面。目标是为阿拉伯语 Wordnet (http://www.talp.upc.edu/
我正在尝试将 Wordnet 3.0 同义词集映射到 Wordnet 3.1例如:purl.org/vocabularies/princeton/wn30/synset-embrace-verb-2
虽然我拥有 EE 背景,但我没有机会参加自然语言处理类(class)。 我想为土耳其语构建情感分析工具。我认为最好创建一个土耳其语 wordnet 数据库,而不是将文本翻译成英语,然后使用提供的工具用
我对 WordNet 数据文件格式有疑问。 wndb(5) 手册页部分内容如下: The source/target field distinguishes lexical and semantic
一些相似度得分介于 0 和 1 之间,例如最短路径和 WuP。因此汽车与汽车之间的相似度将为 1,但 LCh 等其他度量将为 lch( car, automobile ) = 3.6889 我想知道这
是否有可用于 wordnet 3.0 同义词集到其他本体的映射,如 Cyc , YAGO和 EuroWordNet喜欢SUMO ? 最佳答案 Yago 是 linked to Wordnet , 以及
我正在尝试在 OSX 10.8 的 Mac 上安装 Wordnet 3.0。 我已经配置好了,但是当我尝试 make 时, 我收到一堆错误... ..... /usr/include/tkDecls.
想了解WordNet的文件格式,主要文档是WNDB和 WNINPUT .正如我在 WNDB 中所了解的,有名为 index.something 的文件和 data.something ,这里somet
如何使用 wordnet 按单词类别标记文本(java 作为接口(interface))? 示例 考虑以下句子: 1) 计算机需要键盘、显示器、CPU 才能工作。 2)汽车使用齿轮和离合器。 现在我的
我在java中使用wordnet,使用一些已知的api(JAWS、JWNL)。我想使用相同类型的 API 在 Wordnet Affect (WNA) 中进行搜索,但 Internet 上没有关于 W
我正在使用 WordNet 2.1 工具 并通过 JAWSpro-grammatically 访问它(Java用于 WordNet 搜索的 API)。 今天我遇到了一个名为 WordNet 域 的新事
我一直在分析 WordNet 3.0 MySql 数据库文件,我从以下位置下载了这些文件: http://www.princeton.edu/wordnet/download/current-vers
我正在尝试用 python 编写一个程序,它将记录我输入的段落。它将对该段落的第一句和最后一句以及带有日期和数字的句子进行排序。然后它会用同义词替换一些单词,并去掉无用的形容词。我知道 python
因此,我第一次尝试使用 wordnet 为我正在开发的基于小型文本的冒险游戏项目构建文本识别脚本。现在,我有这段代码来尝试构建一个对象,该对象由每个单词作为键以及该单词的每个同义词作为附加到该键的数组
我正在尝试编写一个程序来查找两个文档之间的相似性,并且由于我只使用英语,所以我决定使用 wordnet,但是我找不到将 wordnet 与 php 链接的方法,我找不到任何 wordnet api P
我用了rita使用 Java 框架 WordNet .它工作正常,但我如何在 android 中使用它?是否有任何框架/API 可以从 android 访问 WordNet? JAWS 要求安装 Wo
我一直在寻找一些 Java 库,它可以提供有关同义词集“频率计数”的信息。我检查了 JWNL 和 JWI,他们不提供此类信息。有人知道其他 Java WordNet API 吗? 最佳答案 我相信这也
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的,因为
我有一个项目,我需要获得一个单词的词汇含义。我正在考虑使用 WordNet,因为它有自己的词典编纂者类,也称为超感官。我刚刚下载了 MIT JWI 并试图查看这个 JWI 是否支持它。该手册没有说明返
假设我有两个句子中每对单词的单词相似度分数,根据这些分数确定整体句子相似度的合适方法是什么? 单词分数是使用代表每个单词的向量的余弦相似度计算的。 既然我有了单词得分,那么把单词得分加起来除以两个句子
我是一名优秀的程序员,十分优秀!