gpt4 book ai didi

java - 如何在Java中使用spark ml执行多标签分类

转载 作者:行者123 更新时间:2023-12-02 02:16:42 25 4
gpt4 key购买 nike

我构建了一个模型,根据主题(特征)中的关键字将电子邮件分类为 10 个不同的 work_categories(标签)。但是,此任务可能包括将电子邮件分类到多个标签中的可能性。

例如:主题为“服务证书并转移它们”的电子邮件应分为两个标签,即 Servicing Worktype(标签 1)和 Transfer Worktype (标签 2)。在我当前的程序中,它仅分配给标签 1 。无论如何,我可以使用java中的spark ml将电子邮件分类到两个标签吗?

我一直在关注https://github.com/apache/spark/tree/master/examples/src/main/java/org/apache/spark/examples/ml寻求指导,但没有关于多标签分类的信息。

如果您有任何建议或文档可以帮助我,请告诉我。谢谢

最佳答案

LogisticRegressionWithLBFGSLogisticRegressionWithSGD都支持多标签分类:

<强> LogisticRegressionWithLBFGS

Train a classification model for Multinomial/Binary Logistic Regression using Limited-memory BFGS. Standard feature scaling and L2 regularization are used by default.

<强> LogisticRegressionWithSGD :

Train a classification model for Binary Logistic Regression using Stochastic Gradient Descent. By default L2 regularization is used, which can be changed via LogisticRegressionWithSGD.optimizer.

Using LogisticRegressionWithLBFGS is recommended over this.

关于java - 如何在Java中使用spark ml执行多标签分类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57297896/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com