gpt4 book ai didi

algorithm - 在 Porter Stemming 算法中,包含 SS -> SS 等身份规则的目的是什么?

转载 作者:塔克拉玛干 更新时间:2023-11-03 03:13:53 32 4
gpt4 key购买 nike

Porter Stemmer algorithm 的意义何在?是否有将 SS 转换为 SS 的规则?

最佳答案

假设规则 SS->SS 不在算法中。然后像 caress 这样的词根本不会被识别,而且算法似乎无法做任何事情来将它简化为一个词干。然而,使用规则 SS->SS 词干分析器说:“我识别出 caress 这个词,并将其简化为 caress。我是完毕”。另一种选择是:“我无能为力”。当然这是虚构的工作,但重要的是它提高了词干分析器的精度。您可以在完成算法测试时看到。如果这个规则不在词干分析器中,结果就会不同(更糟)。看词表[可笑,爱抚]

Case 1. 算法中的规则SS->SS

词干提取:

caress (Step 1a)-> caress OK
ridiculousness (Step 2)-> ridiculous (step 4) -> ridicul OK
Success rate: 100%

情况 2. 规则 SS->SS 不在算法中。

词干提取:

caress -> fail OK
ridiculousness (Step 2)-> ridiculous (step 4) -> ridicul OK
Success rate: 50%

从实用的角度来看,这条规则并不重要。这只是一种形式主义。

关于algorithm - 在 Porter Stemming 算法中,包含 SS -> SS 等身份规则的目的是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32997877/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com