gpt4 book ai didi

mahout - apache mahout 中的 nGram

转载 作者:行者123 更新时间:2023-12-02 03:50:24 25 4
gpt4 key购买 nike

我正在通过 apache mahout 运行朴素贝叶斯分类器算法。我们可以选择在训练和运行算法实例时设置克大小。

将 n-Gram 大小从 1 更改为 2,会极大地改变最终的分类。为什么会出现这种情况? n-Grams 大小如何使结果发生巨大变化?

最佳答案

1-gram 是单词。 2-gram(或二元词组)是单词对。这就像根据“United”和“States”或“United States”的存在对文档进行分类。使用二元模型可能会产生一些空间和性能影响,但可能会比 1 元模型提供更好的结果。

关于mahout - apache mahout 中的 nGram,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8573882/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com