gpt4 book ai didi

mysql - Wordnet SQL 说明

转载 作者:IT老高 更新时间:2023-10-28 23:45:58 26 4
gpt4 key购买 nike

我正在尝试启动并运行一个简单的同义词数据库,以便我可以找到用户输入的单词的同义词(没有别的!)。为此,我获取了 Wordnet sql 词库 ( http://wnsql.sourceforge.net/ ) 的副本,但现在我看到了所有这些表格,但我无法在任何地方找到对其内容的任何简单解释:

adjpositions
adjpositiontypes
casedwords
lexdomains
lexlinks
linktypes
morphmaps
morphs
postypes
samples
semlinks
senses
synsets
vframemaps
vframes
vframesentencemaps
vframesentences
words

有人可以告诉我这些表包含什么以及我需要哪些,因为我无法根据他们的数据破译他们的内容。

最佳答案

WordNet 是一个 super 酷的词数据库。我自己一直在研究。我将在下面列出我的发现 - 希望它能帮助您更好地理解这些表格。

同义词表
Synsets 表是数据库中最重要的表之一。它负责容纳 WordNet 中的所有定义。 synset 表中的每一行都有一个 synsetid、一个定义、一个 pos(词性字段)和一个 lexdomainid(链接到 lexdomain 表)
WordNet 数据库中有 117373 个同义词集。

单词表
WordNet 也有一个“words”表,它只有两个字段:wordid 和“lemma”。词表负责容纳 Wordnet 数据库中的所有引理(基本词)。
此表中有 146625 个条目

那么..这两个表是如何链接的?答案?感觉表!

感应表
意义表负责将单词(在单词表中)与定义(在同义词表中)链接在一起。
词义表中的条目被称为“词义对”——因为 wordid 与同义词集的每个配对都是词的一个完整含义——“词义”。
WordNet 数据库中共有 206,354 个词义。

Lexdomains 表
Lexdomains 表由词义表引用,用于定义词义对所属的词法域。 lexdomains 表中有 45 个词法域。
因此,词法域表是 WordNet 的“标记”词义对的方式。然而,它是非常有限的,因为一个词义对只能属于一个词法域。

45 个词汇域包括:

形容词:
全部,佩特

副词
全部

名词
上衣、行为、动物、工件、属性、 body 、认知、通信、事件、感觉、食物、组、位置、动机、对象、人、现象、植物、拥有、过程、数量、链接定义、形状、状态、物质,时间,

动词
body 、变化、认知、交流、竞争、消费、接触、创造、情感、运动、感知、占有、社会、静态、天气、人

词表
单词表中的一些单词自然首字母大写,例如:“A-team”。由于 words 表将所有单词存储为小写,因此 WordNet 使用此表来指定单词的大写版本。
此表中有 40313 个条目。

WordNet DB 中还有很多其他的表,等我研究好之后再发。

查找同义词
要回答有关同义词的问题 - 您需要执行以下操作。

假设您要查找单词“Carry”的同义词。为此,您首先要在单词表中搜索与单词“carry”匹配的引理。这将产生 wordid 21253。然后您将搜索词义表,以查找词进位的所有词义对。这会产生 41 个结果 - 每个结果列出 wordid 21253,以及一个 senseid(它是 word-sense 对的索引)和一个 synsetid。

现在,您需要查询每个返回的synsetid 的synset 表,以便您可以访问synset 表中的关联定义字段。

最后,要查找列出的每个同义词集的同义词,您只需在词义表中搜索共享相同同义词集的其他词义对。

例子:
下面列出了“carry”这个词的 41 个词义对之一:
wordsense example
如果我们查找这个synsetid 202083512的定义,你会发现“传输或作为传输的媒介”

要查找此定义的所有同义词,您将在词义表中搜索相同的 synsetid 202083512。这将产生同义词:channel、conduct、envy、invert 和 transfer
(注意:您需要离开加入 words 表才能获得实际的引理)

我希望这有助于为您揭开 WordNet 的神秘面纱……我发现它很酷……

关于mysql - Wordnet SQL 说明,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18278219/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com