gpt4 book ai didi

dataset - Google 代码之夏 : web classification dataset

转载 作者:行者123 更新时间:2023-11-30 08:44:40 31 4
gpt4 key购买 nike

我听说 Google 主办(或将举办)一场网络分类竞赛,他们提供了一个大型(170k+ 文档)网站数据集,这些网站被分为多个类别(体育、计算机、科学等),我尝试环顾四周在他们的 2009 年到 2011 年的 Summer of Code 网站上,但没有找到任何东西。有人知道我在哪里可以获得该数据集吗?

最佳答案

我想我找到了(虽然我不确定这些数据是否是由google提供的):the ECML/PKDD 2010 Discovery Challenge Data Set包含 22 个训练标签(即有关内容的标签)、URL 和超链接、基于内容和基于链接的网络垃圾邮件功能、术语频率和自然语言处理功能。

关于dataset - Google 代码之夏 : web classification dataset,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5394653/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com