aspell - Hunspell/Aspell 数据转换为人类可读的屈折列表-6ren

aspell - Hunspell/Aspell 数据转换为人类可读的屈折列表

转载作者：行者123 更新时间：2023-12-02 03:44:45

27

4

有没有一种简单的方法可以从 Hunspell/Aspell 字典数据文件中生成人类可读的屈折列表？

例如，我想生成以下输出(针对不同的语言):

...

书，书

预订，预订，预订，预订

...

去，去，去，去，去

...

我查看了 Hunspell/Aspell 文档，但找不到可以执行此操作的 API 调用。

最佳答案

有一种命令行可以执行的方法，但它的输出格式与您要查找的格式不同。如果您愿意，您也可以手动执行此操作，只需使用正则表达式编写一些简单的脚本即可。

每组词缀的格式是

TYPE TAG REMOVE REPLACE MATCH

这样哪里 TAG匹配后面的内容 /在给定的词中 .dic文件，您可以执行以下操作(假设您已经删除了 /... 的单词):

if($word =~/$match$/) $word =~ s/$remove$/$replace/;

请注意 $那里匹配行尾/单词。用 ^ 调整如果是前缀。

有以下三个注意事项:

$match 直接来自 .aff文件几乎在所有情况下都等同于标准正则表达式。有一些细微的变化，例如如果匹配类似于 [abc-gh] ，你最好把它改成(a|b|c|-|g|h)或 [abcgh-] (hunspell 不使用连字符作为元字符)否则它会被解释为 [abcdefgh] (标准正则表达式)。对于否定字符类，您的选择是手动移动 -到表达式的末尾(例如 [^a-df] 到 [^adf-] 或使用否定的后视。

如果 $replace 为 0，那么您应该将其更改为空字符串。

如果您的结果以 /... 结尾，你需要重新处理它，因为它有一个双词缀。

当心。根据我的粗略计算，我正在编写的字典可能有超过 5000 万个单词(如果超过 1 亿，我不会感到惊讶)。

关于aspell - Hunspell/Aspell 数据转换为人类可读的屈折列表，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/17831145/

27

4

0

文章推荐： C++ 中的 Firefox 附加组件

文章推荐： sql - 查询自由文本字段

文章推荐： richfaces - JSF1.2 - richFaces progressBar - 简单的演示不工作

文章推荐： ajax - jsf primefaces fileupload 提交

python - pip 安装 hunspell : Cannot open include file: 'hunspell.h' : No such file or directory
我正在尝试在我的 Windows 10 x64 机器上pip install hunspell，但出现以下错误: C:\Users\a>pip install hunspell Collecting
python - pip 安装 hunspell : Cannot open include file: 'hunspell.h' : No such file or directory
我正在尝试在我的 Windows 10 x64 机器上pip install hunspell，但出现以下错误: C:\Users\a>pip install hunspell Collecting
Hunspell C++ 和俄语
我在使用 hunspell 拼写检查器和俄语词典时遇到了一些问题。问题是我的项目与英语配合良好，但如果我要连接俄语并尝试检查我的单词的拼写，它总是返回 0(意味着没有结果)。这是我的代码(适用于英语)
elasticsearch - Hunspell for Elasticsearch
我正在尝试在ES 2.3，Ubuntu 16.4上安装Hunspell。从http://download.services.openoffice.org/contrib/dictionaries/下
c++ - Hunspell:有什么具体的例子吗？
我已经很好地下载并编译了hunspell。现在我想在 wxWidgets 上制作一个测试应用程序，我开始寻找示例或教程。到目前为止我还没有找到。我可以找到“示例”可执行文件但没有代码(可能隐藏在某个地
linux - 在所有子目录中运行 Hunspell
我想在所有子目录中运行 Hunspell 并检查其中的所有 markdown 文件。简单吧？所以我写道:find ./-type f -exec hunspell -l *.md {}\; 当我运
c# - hunspell 拼写检查
我有一个特定的问题重新排序 hunspell 返回的拼写错误的建议词。这些词似乎以字母顺序返回。我想按相关性对建议进行排序，即最接近的匹配应该首先出现。我无法通过 hunspell api 找到任何方
ubuntu - 未能为语言环境加载 hunspell 字典
我正在尝试为斯洛伐克语支持设置弹性字典，但弹性找不到 hunspell 文件。使用 Ubuntu 19.04 服务状态询问上传的字典我无法摆脱这个问题。帮助表示赞赏:) 最佳答案问题解决了，
nlp - Hunspell 词缀条件正则表达式格式。有什么方法可以匹配开始吗？
美好的一天。我正在尝试在我的应用程序中使用 Hunspell 作为词干分析器。我不太喜欢 porter 和 snowball 词干提取，因为它们的“切碎”词结果如“abus”、“exampl”。 L
c# - 如何从给定的 hunspell 字典中获取所有可能的单词？
我想解析支持 hunspell 格式的开放式办公室 aff和 dic文件。英文aff和 dic文件可以从这里下载，例如:http://extensions.openoffice.org/en/pro
thread-safety - Hunspell 线程安全吗？
Hunspell 拼写库线程安全吗？最佳答案答案是不，一个简单的多线程测试应用程序显示 Hunspell 使用每个实例的资源进行拼写过程，因此任何时候只有一个线程可以使用它 - 使用锁/工作队列
dictionary - 如何为 Hunspell 制作自定义词典
我有一个关于为 hunspell 构建自定义词典的问题。我现在正在使用通用英语词典和词缀文件。如何为我的每个用户将用户指定的单词添加到该词典？最佳答案如果您的语言不存在，请为您的语言创建您自己的
Hunspell - 无法打开名为 en_US 的字典的词缀或字典文件
我想使用 hunspell 对我的 repo 进行拼写检查。但是，当我尝试运行它时，出现以下错误: Can't open affix or dictionary files for dictionar
python - 安装 hunspell 包
我期待使用 pip 安装 hunspell 包，但它抛出以下错误: Collecting hunspell Using cached hunspell-0.4.1.tar.gz Building
aspell - Hunspell/Aspell 数据转换为人类可读的屈折列表
有没有一种简单的方法可以从 Hunspell/Aspell 字典数据文件中生成人类可读的屈折列表？例如，我想生成以下输出(针对不同的语言): ... 书，书预订，预订，预订，预订 ... 去，去，
c# - 如何在不区分大小写的情况下检查 Hunspell 中的拼写
您好，我正在制作一个桌面应用程序 (C#)，用于检查输入单词的拼写。我正在使用 Hunspell，它是我使用 NuGet 添加到我的项目中的。我有 2 个文件 aff 文件和 dic 文件。 usin
c++ - 处理带有特殊字符的 Hunspell 建议
我已经集成了 Hunspell在 Windows 7 上使用 Visual Studio 2010 的非托管 C++ 应用程序中。我有适用于英语的拼写检查和建议，但现在我正试图让这些东西适用于西类牙
c - 使用 hunspell 库编译源代码时出现链接器问题
我正在尝试在 Ubuntu 10.10 上编译这个使用 hunspell 库和 gcc(版本 4.6.3)的纯 C 源代码: #include #include #include int mai
android - Android 上的 Hunspell
有人在 Android 平台上成功实现了 Hunspell 拼写检查器吗？有可能吗？你试过了吗？结果呢？提前致谢。最佳答案我使用 Hunspell 创建了 SpellCheckerService
c# - 拼写检查器有什么用？谷歌拼写检查器或 Hunspell
对于我的 asp.net 网站，我需要拼写检查功能。我找到了一些有趣的解决方案。 1. Google 拼写检查器 2. Hunspell。两者都是免费的。据我了解，我意识到这两种方法都有一些缺点和优

首页

博学

6Ren·AI

商城

aspell - Hunspell/Aspell 数据转换为人类可读的屈折列表