gpt4 book ai didi

python - 我可以使用 python 将什么词形还原器用于阿拉伯语文本?

转载 作者:行者123 更新时间:2023-12-02 17:31:11 26 4
gpt4 key购买 nike

我怎样才能得到阿拉伯语单词的引理?我尝试了 NLTK 的 ISRI Arabic Stemmer,但它返回词根:

from nltk.stem.isri import ISRIStemmer
st = ISRIStemmer()
print st.stem(u'اعلاميون')

它返回根 علم 并且我想要引理 اعلامي

最佳答案

最先进的是 Farasa Lemmatizer .

Farasa Lemmatizer 在准确性方面优于 MADAMIRA Lemmatizer。它在词形还原任务中相对于 MADAMIRA 提供了 +7% 的准确度相对增益。

您可以从以下链接阅读有关 Farasa Lemmatizer 的更多信息: https://arxiv.org/pdf/1710.06700.pdf

关于python - 我可以使用 python 将什么词形还原器用于阿拉伯语文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33073805/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com