gpt4 book ai didi

machine-learning - 通过搜索词预测产品类别

转载 作者:行者123 更新时间:2023-11-30 09:10:05 24 4
gpt4 key购买 nike

问题:用户使用搜索词执行产品搜索,我们应该定义与该搜索词最相关的类别(类别按降序排列)。

给定:产品集,大约 50000 个(可能是十倍以上)产品。产品包含标题、描述及其所属类别列表。

型号:

预处理 从产品标题和描述中执行词干提取并删除停用词。将所有唯一的词干单词放入大小为 N 的 WORDS 列表中。将所有类别放入大小为 M 的 CATEGORIES 列表中。

拟合使用具有 N 个输入神经元和 M 个输出的神经网络。

训练 对于包含单词 w1、w3、w4、w6 的产品,输入将为 x=[1 0 1 1 0 1 ...],其中索引对应于其中的单词索引的元素WORDS 将设置为 1。如果产品属于类别 c1、c3、c25,则对应于 y =[1 0 1 ... 1(第 25 个位置)...] 预测步骤。作为输入,将用户搜索词词干标记作为输出,为我们提供最相关类别的预测。

这个模型是解决此类问题的正确方法吗?隐藏神经网络层配置的建议是什么。任何建议都会有帮助,我对机器学习完全陌生。

谢谢!

最佳答案

我认为这是解决问题的正确方法,因为您正在处理多标签分类问题。也就是说,一个样本可以同时属于多个类,也可以属于单个类,也可以不属于任何类(类别)。

这是一个关于 Python 的很好的例子:multi-label classification 。您可以获取更多详情here .

对于隐藏层配置,第一种方法是使用交叉验证来测试测试集上的准确性。但如果你想更进一步,请阅读this .

关于machine-learning - 通过搜索词预测产品类别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41860605/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com