gpt4 book ai didi

algorithm - 机器学习算法仅对正数据和未标记数据进行分类

转载 作者:塔克拉玛干 更新时间:2023-11-03 03:43:36 25 4
gpt4 key购买 nike

我正在尝试对仅具有积极特征和未标记数据的文本进行分类。我只想让算法识别正面数据,并将其他所有内容标记为负面数据。什么是对此类数据进行分类的良好机器学习算法?我尝试在 Weka 中使用不同的算法,但几乎所有分类器都会给出很多误报。

最佳答案

如果您认为未标记的数据大部分是负数,那么最好的办法可能是将所有未标记的数据标记为“负数”并运行您选择的分类器。请注意,如果您获得预测为阳性的未标记测试数据点,这并不意味着答案是错误的。您的一些未标记数据可能是积极的。因此很难判断您的分类器在您的设置中的表现如何。如果您认为您的未标记数据可能偏向正面,那么您最好对正面数据使用所谓的“一类分类器”,有一些流行的例子,包括一类 SVM。

关于algorithm - 机器学习算法仅对正数据和未标记数据进行分类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22872898/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com