gpt4 book ai didi

algorithm - 哪些 ML 算法或模式适合识别内容的类别和子类别?

转载 作者:塔克拉玛干 更新时间:2023-11-03 05:16:46 26 4
gpt4 key购买 nike

根据特定的一般主题(在我的示例中为宠物)的当前数据集,我手动搜索高级主题或类别,然后进一步分割。

我想使用机器学习来完成有关各种主题的这项任务。

对于第一个用例,我们可以使用宠物。内容基于各种文本关键字:狗、猫、乌龟、鱼、兔子。

类别:猫品种、狗品种、猫家具、猫玩具、狗玩具等

子类别:基于类别非常明显。

但是,这些需要基于内容并从内容量从多到少排列。我还想为每个级别生成的类别和子类别的数量设置一个阈值。

有人告诉我这类似于分类算法并查看 Word2Vec,但我正在寻找有经验的人的建议。

我可能需要添加更多详细信息。请评论,我会回复。

最佳答案

您可以使用 word2vec 探索单词的语义关系,这可能会提供与常见类别相关的子类别的线索。

您可以探索的另一种方法是在链接文本标签的现有本体上使用(例如,基于 WordNet similarity 基于 Sentence Similarity Based on Semantic Nets and Corpus Statistics )。这个可能更容易开始。您可以使用此指标为子类别分配通用类别并对相似的子类别进行分组。

关于algorithm - 哪些 ML 算法或模式适合识别内容的类别和子类别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44171580/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com