gpt4 book ai didi

data-mining - 推荐系统的数据集

转载 作者:行者123 更新时间:2023-12-04 17:36:02 25 4
gpt4 key购买 nike

我想创建自己的简单推荐系统,关于书籍。但是有一些问题 - 一个人不可能(至少,非常困难)为算法组织训练数据集。

那么,是否有任何免费的数据集或测验,其中包含有关人们投票的信息、哪些书籍以及他们喜欢多少?

第二个问题是关于书的参数。对于一些基于项目的预测,确实必须使用书籍的评分(例如语言,平均单词长度,段落中的平均单词数,我已经计算了大约 30 个类似的参数)及其权重(例如,书籍的语言被评分1分,平均单词长度为0.314)。那么,是否有任何准备好的信息?

事实上,如果我得到第一个问题的答案,我可以找到第二个问题的解决方案,但我确信,所需的信息存在。

另外,我正在阅读推荐系统手册,它提供了完整的信息(带引用资料),但很难阅读。在这种情况下,你能建议一些额外的书吗?

最佳答案

你可以查看 Books.txt.gz 吗?
https://snap.stanford.edu/data/web-Amazon.html
其中包括来自亚马逊的图书评分。它还具有产品名称、价格、评论摘要等。

bookcrossing 数据集也可能有用
http://grouplens.org/datasets/book-crossing/

我猜你的第二个问题是特征选择问题,每个数据集的权重都会不同。

Coursera 的这门类(class)提供了推荐系统的简要信息,并且还有一个阅读部分。不幸的是测验不再可用

类(class):https://www.coursera.org/course/recsys

读数:http://recsys.cs.umn.edu/readings.html

编辑:
另一个书籍数据集。

好书:

http://fastml.com/goodbooks-10k-a-new-dataset-for-book-recommendations/

关于data-mining - 推荐系统的数据集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18231027/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com