gpt4 book ai didi

scikit-learn - 仅具有正和未标记数据集的二进制半监督分类

转载 作者:行者123 更新时间:2023-12-01 16:19:00 24 4
gpt4 key购买 nike

我的数据由评论组成(保存在文件中),其中很少有被标记为正面的。我想使用半监督和 PU classification 将这些评论分为正面和负面两类。我想知道在 python (scikit-learn) 中是否有任何半监督和 PU 实现的公共(public)实现?

最佳答案

您可以尝试训练单类 SVM,看看会得到什么样的结果。 PU纸没听说过。我认为出于所有实际目的,您最好标记一些点然后使用半监督方法。如果很难找到负点,我会尝试使用启发式方法来找到假定的负点(我认为这类似于 PU 论文中的技术)。您可以对未标记的和正的进行分类,然后只查看未标记的得分高的那些,或者学习一类 SVM 或类似的,然后在异常值中寻找负点。

如果您有兴趣实际解决任务,我宁愿花时间手动标记,也不愿实现花哨的方法。

关于scikit-learn - 仅具有正和未标记数据集的二进制半监督分类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25700724/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com