gpt4 book ai didi

python - 将训练数据添加到现有的 LinearSVC

转载 作者:行者123 更新时间:2023-11-30 09:00:49 25 4
gpt4 key购买 nike

我正在抓取大约 200,000 个网站,寻找小型企业网站上发布的某些类型的媒体。我有一个腌制的 LinearSVC,我已经训练它来预测网页上找到的链接包含我正在寻找的类型的媒体的概率,并且它的性能相当好(总体准确度约为 95%)。但是,我希望抓取工具在抓取时定期使用新数据更新分类器。

所以我的问题是,如果我加载了一个pickled sklearn LinearSVC,有没有办法添加新的训练数据而无需重新训练整个模型?或者我是否必须加载所有以前的训练数据,添加新数据并训练一个全新的模型?

最佳答案

您无法将数据添加到 SVM 并获得与将其添加到原始训练集相同的结果。您可以从以前的解决方案开始使用扩展训练集进行重新训练(应该更快),也可以仅使用新数据进行训练并完全不同于以前的解决方案。

只有少数模型可以实现您想要实现的目标 - 例如岭回归或线性判别分析(及其核化 - 核岭回归或核费舍尔判别,或“极端”对应 - ELM 或EEM),它具有能够“即时”添加新训练数据的特性。

关于python - 将训练数据添加到现有的 LinearSVC,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38984069/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com