gpt4 book ai didi

c# - 如何从给定的 hunspell 字典中获取所有可能的单词?

转载 作者:行者123 更新时间:2023-12-04 11:53:27 40 4
gpt4 key购买 nike

我想解析支持 hunspell 格式的开放式办公室 affdic文件。

英文affdic文件可以从这里下载,例如:http://extensions.openoffice.org/en/project/english-dictionaries-apache-openoffice

我想扫描给定 .dic 的每一行文件并使用提供的 .aff 生成每行的每个可能的单词文件

我怎样才能做到这一点?

我已经安装了 NHunspell 框架,但它没有这个功能:https://www.nuget.org/packages/NHunspell/

例如对于英语让我们考虑

make/UAGS

制作可 make, made, makes, making等等

现在我需要解析器给我所有这些组合。我怎样才能获得它们?非常喜欢

所以基本上我想扫描字典的每一行并从该行的单词中生成所有可能的单词,我不知道我该怎么做

我也可以编写自己的解析器,但在我看来规则非常复杂,并且没有关于此的详细和简单的文档

这里我想要的基本上。图片解释的很清楚

捐赠 analyze/ADSG , en.dicen.aff文件并获取以下所有单词
analyze, analyzes, analyzing, analyzed, reanalyze, reanalyzes, reanalyzing, reanalyzed

enter image description here

最佳答案

如果你想要整个数据库,你可以执行 unmunch :

unmunch dictionary.dic dictionary.aff

请注意,当前 hunspell 中 unmunch 的实现有最大单词数、affs 和生成单词长度的限制。因此,如果目标语言超出了 unmunch 的限制,则 unmunch 可能会失败。

如果您只想要可以从条目中生成的可能单词列表,您可以使用 wordforms :
wordforms dictionary.aff dictionary.dic word

关于c# - 如何从给定的 hunspell 字典中获取所有可能的单词?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42566916/

40 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com