gpt4 book ai didi

machine-learning - StackOverflow 标签预测器…请推荐一种机器学习方法?

转载 作者:行者123 更新时间:2023-11-30 08:47:15 24 4
gpt4 key购买 nike

我正在尝试预测 stackoverflow 问题的标签,但无法确定哪种机器学习算法是正确的方法。

输入:作为我挖掘了 stackoverflow 问题的数据集,我对数据集进行了标记,并从该数据中删除了停用词和标点符号。

我尝试过的事情:

  1. TF-IDF
  2. 在数据集上训练朴素贝叶斯,然后提供用户定义的输入来预测标签,但它无法正常工作
  3. 线性支持向量机

我应该使用监督式或无监督式哪种机器学习算法?如果可能的话,请从头开始提出正确的机器学习方法。 PS:我有 StackOverflow 上所有标签的列表,所以这会有帮助吗?谢谢

最佳答案

我会尝试 MLP。首先,我将选择一组相当小的关键字进行输入并对它们进行编码 [例如 1..100],并训练一组相当小的输出标签。

PS:一般来说,无监督学习对于此任务是不利的,因为许多引用不同标签的问题具有非常相似的内容,并且很可能聚集在一起。

关于machine-learning - StackOverflow 标签预测器…请推荐一种机器学习方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32324813/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com