gpt4 book ai didi

python - 如何持久化 Python TextBlob 的模型?

转载 作者:太空宇宙 更新时间:2023-11-03 15:01:41 24 4
gpt4 key购买 nike

如何在 TextBlob 中保留模型结果以供下次更新?

可以在此处找到文档引用 https://github.com/sloria/TextBlob

我注意到文档指定了如何更新训练数据,但我没有看到保存上次 session 数据的方法或方式。

如何更新: https://textblob.readthedocs.io/en/dev/classifiers.html#updating-classifiers-with-new-data

我特别指的是文本分类。我确实觉得我在这个特定的主题上很愚蠢,因为我总是发现很难知道这些培训类(class)在任何人工智能示例中持续在哪里。

您不想再次运行整个过程,对吗?您希望从上次停下的地方开始,不断迭代地改进它。

我想这样做:

  1. 如果存在过去的训练结果,请将其加载到模型中
  2. 更新或举办新的培训类(class)
  3. 保存培训类(class)
  4. 稍后根据需要重复

最佳答案

模型和训练可以使用picklingunpickling来持久化。

>>> from textblob.classifiers import NaiveBayesClassifier
>>> train = [('love the weather','pos'),('love the world','pos'),('horrible place','neg')]
>>> cl = NaiveBayesClassifier(train)
>>> [cl.prob_classify("love food").prob('pos'),cl.prob_classify("love food").prob('neg')]
[0.8590880780051973, 0.14091192199480246]
>>> import cPickle
>>> save_training = open('/tmp/save_training.pickle','wb')
>>> cPickle.dump(cl,save_training) # SAVE TRAINED CLASSIFIER
>>> save_training.close()
>>>
>>> load_training = open('/tmp/save_training.pickle','rb')
>>> new_cl = cPickle.load(load_training) # LOAD TRAINED CLASSIFIER
>>> [new_cl.prob_classify("love food").prob('pos'),new_cl.prob_classify("love food").prob('neg')]
[0.8590880780051973, 0.14091192199480246]

关于python - 如何持久化 Python TextBlob 的模型?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45037610/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com