gpt4 book ai didi

machine-learning - 必须使用复杂的还是几个简单的模型?

转载 作者:行者123 更新时间:2023-11-30 09:47:05 24 4
gpt4 key购买 nike

我无法理解模型是如何组织的。

我想尝试创建一些算法来帮助分析产品名称(描述)并获取产品属性(类别、一些参数)。

我有树形结构数据:

Category (name, null parent)
|Category (name, parent)
|Product (name+description)
|Param(key-value)
|Param(key-value)
|Param(key-value)
|...

我使用的模型将对产品的顶级类别进行分类,然后使用另一个模型对属于分类的顶级类别的产品进行训练(因此我可以对二级类别进行分类)。对于下一步,我对每个param key使用自己的模型来进行param value分类

一般来说,我的树结构的每个叶子都需要一个模型来进行下一步分类吗?

我的想法对吗?

最佳答案

这是一种处理方式。然而我在该方法中遇到了两个问题:

首先,您对训练数据进行分段,最终的分类器可能没有足够的数据进行训练。

其次,我猜想 Param Key-Value 可以在不同的类别和产品之间重复。因此,由于训练数据分段,您在不同产品和类别上为相同的事物训练不同的分类器可能不是一个好主意。

它是有一个类别分类器和一个产品分类器。但为每个属性设置一个分类器可能太多了。我建议您查看多类分类。这些算法可以为每个输入处理多个类别。因此您可以使用它们来建模所有参数键值

http://scikit-learn.org/stable/modules/multiclass.html

如果您确实有大量叶子,那么您可以尝试Extreme Multi Label

"extreme multi label learning text classification"

关于machine-learning - 必须使用复杂的还是几个简单的模型?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51186142/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com