gpt4 book ai didi

python - 如何对消息数组使用 fit 方法

转载 作者:太空宇宙 更新时间:2023-11-03 20:54:56 25 4
gpt4 key购买 nike

我正在尝试在数据集上训练和测试多项式贝叶斯,并进行相应的分割。处理数据后,我有一组消息和一组标签。我尝试对这些数据使用 .fit() 和 .predict() 但它不起作用。

我的数据如下:

emails = ['example mail', 'another example mail', ..]
labels = ['ham', 'spam', ..]

这是我目前正在尝试的:

bayes = sklearn.linear_model.MultinomialNB().fit(emails, labels)

最佳答案

在训练模型之前,您需要对数据进行更多处理。该模型不能直接在纯字符串上运行。您可以使用任何 nlp 库(我推荐 Spacy 或 nltk stanford)来处理数据(例如:标记化、词形还原和了解段落的总体思路...)我建议你添加一个热编码get_dummies()

关于python - 如何对消息数组使用 fit 方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56080001/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com