gpt4 book ai didi

text - 需要体育、娱乐、健康等类别以及所有子类别的训练数据

转载 作者:行者123 更新时间:2023-11-30 09:27:43 25 4
gpt4 key购买 nike

我正在尝试 ML 中的分类算法,并正在寻找一些语料库来训练我的模型以区分不同的类别,例如体育、天气、技术、足球、板球等,

我需要一些关于在哪里可以找到具有这些类别的数据集的指示,

对我来说,另一个选择是抓取维基百科以获取 30 多个类别的数据,但如果有更好的方法来做到这一点,我想要一些集思广益和意见。

编辑

使用词袋方法针对这些类别训练模型测试 - 根据网页内容将新/未知网站分类到这些预定义类别。

最佳答案

UCI machine learning repository包含用于监督学习的可搜索数据集文件。

如果您提供有关理想数据集应具有哪些输入和输出的更具体信息,您可能会得到更好的答案。

编辑:

关于text - 需要体育、娱乐、健康等类别以及所有子类别的训练数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8312740/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com