gpt4 book ai didi

hadoop - 在Mahout中使用Logistic回归

转载 作者:行者123 更新时间:2023-12-02 21:48:23 24 4
gpt4 key购买 nike

我在CSV文件中有大约11000行数据,其中包含“文本”和“类”列。文本是推特消息,并且在类中为每个消息分配了对或错。我使用这两个命令使用逻辑回归模型来训练和测试此数据,但使用AUC 0.52效果不佳。我不太了解--rate --features--lambda等一些参数,因此有人可以通过更合适的命令为我提供帮助吗?非常感谢!

$ bin/mahout trainLogistic --passes 100 --rate 50 --lambda 0.001 --input twitter.csv --features 10000 --output twitter.model --target Class --categories 2 --predictors Text --types t

$ bin/mahout runlogistic --input twitter.csv --model twitter.model --AUC --confusion

数据文件的链接: twitter.csv

最佳答案

这是用于训练模型的参数。

"input" : training data
"output" : path to the file where model will be written.
"target" : dependent variable which is to be predicted
"categories" : number of unique possible values that target can be assigned
"predictors" : list of field names that are to be used to predict target variable
"types" : datatypes for the items in predictor list
"passes" : number of passes over the input data
"features" : size of internal feature vector
"lambda" : amount of co-efficient decay to use
"rate" : initial learning rate

您可以引用 Logistic Regression in Mahout帖子以获取详细描述。

关于hadoop - 在Mahout中使用Logistic回归,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23208799/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com