gpt4 book ai didi

python - 使用 *.dic *.aff 的 Python 形态文本分析

转载 作者:太空宇宙 更新时间:2023-11-04 03:45:26 25 4
gpt4 key购买 nike

我有 2 个乌克兰语 hunspell 格式的文件(.dic 和 .aff)。我的程序必须获得输入词的基本形式。因此,它可以使用 .dic 文件中的 word 形式和 .aff 文件中的 offices。即使使用 Hunspell util,我也不知道如何实现这一点,但假设这是可能的。

哪些 python 库可以使用 .dic 和 .aff 文件获取单词的基本形式?

最佳答案

如前所述,hunspell 是您需要的库。来自 https://code.google.com/p/pyhunspell/wiki/UsingPyHunspell 的示例:

import hunspell
hobj = hunspell.HunSpell('/usr/share/myspell/en_US.dic', '/usr/share/myspell/en_US.aff')
hobj.spell('spookie')
>>>>False

hobj.suggest('spookie')
>>>>['spookier', 'spookiness', 'spooky', 'spook', 'spoonbill']

hobj.spell('spooky')
>>>>True

hobj.analyze('linked')
>>>>[' st:link fl:D']
hobj.stem('linked')
>>>>['link']

关于python - 使用 *.dic *.aff 的 Python 形态文本分析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24098658/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com