gpt4 book ai didi

text - 词干会损害文本分类的精度吗?

转载 作者:行者123 更新时间:2023-12-01 09:34:44 25 4
gpt4 key购买 nike

我读过词干会损害精度,但会提高文本分类的召回率。这是怎么发生的?当您停止时,您会增加查询和示例文档之间的匹配数,对吗?

最佳答案

它总是一样的,如果你提高记忆,你做一个概括。因此,您正在失去精确度。词干将单词合并在一起。

On the one hand, words which ought to be merged together (such as "adhere" and "adhesion") may remain distinct after stemming; on the other, words which are really distinct may be wrongly conflated (e.g., "experiment" and "experience"). These are known as understemming errors and overstemming errors respectively.



Overstemming 会降低准确率,understemming 会降低召回率。因此,由于根本没有词干意味着没有过度但最大的词干不足错误,因此您的召回率很低,精度很高。

顺便说一句,精度意味着您找到的“文档”中有多少是您正在寻找的。召回意味着您收到了多少正确的"file"。

关于text - 词干会损害文本分类的精度吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10369479/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com