gpt4 book ai didi

python - 将单词添加到 WordNet 的本地副本

转载 作者:太空狗 更新时间:2023-10-30 01:34:20 25 4
gpt4 key购买 nike

我正在使用通过 Python 的 NLTK 访问的 WordNet 来比较来自社交媒体的单词的同义词集。其中许多词不在 NLTK 连接到的 WordNet 版本中。

当我说我单词时,我指的是特定领域的术语,而不是缩写或表情符号。

我已经编制了这些单词的列表,并想将该列表与 WordNet 合并。

搜索先前的努力结果是尝试开发自动更新 WordNet 的方法。

我想象的步骤是:

  1. 克隆 WordNet 数据库
  2. 编写查找本地副本的 WordNet 模块的扩展
  3. 更新本地副本。

这听起来有多合理?

最佳答案

我自己还没有更改 WordNet,但我在使用 Multilingual Central Repository 方面有很好的经验,我相信您应该能够使用它做您想做的事。

它包含包括英语在内的多种语言的 WordNet 3.0 数据文件,这些语言通过所谓的跨语言索引 (ILI) 相互关联。数据文件可以加载到 MySQL 或 PostgreSQL 数据库表中,从这一点来看,不仅可以使用 SQL 命令查询它,还可以相对容易地插入新项目,维护表之间的对应关系。您当然也可以导出更改后的数据库,例如如果使用 SQL 不足以满足您的目的,则将其转换为 CSV 文件。

关于python - 将单词添加到 WordNet 的本地副本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20749730/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com