gpt4 book ai didi

machine-learning - NLTK的朴素贝叶斯分类器适合商业应用吗?

转载 作者:行者123 更新时间:2023-11-30 08:41:56 25 4
gpt4 key购买 nike

我需要在两个由大约组成的语料库上训练朴素贝叶斯分类器。每人 15,000 个代币。我正在使用带有二进制标签的基本词袋特征提取器,我想知道 NLTK 是否足够强大,可以处理所有这些数据,而不会显着减慢运行时间(如果此类应用程序要获得许多用户)。该程序基本上会对来自潜在数千名用户的常规文本消息流进行分类。如果 NLTK 不合适,您是否建议与其他机器学习包集成?

最佳答案

您的语料库不是很大,因此 NLTK 应该可以完成这项工作。然而,我一般不推荐它,它非常慢并且在某些地方有错误。 Weka是一个更强大的工具,但事实上它可以做更多的事情,这使得它更难理解。如果您计划使用朴素贝叶斯,那么您自己编写代码可能是最快的。

编辑(很久以后):

尝试scikit-learn ,非常容易使用。

关于machine-learning - NLTK的朴素贝叶斯分类器适合商业应用吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7531812/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com