- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
问题是如何存储(和搜索)用户喜欢和不喜欢的一组项目。虽然每个用户在他们的集合中可能有 2-100 个项目,但项目的可能值数以万计(并且还在扩大)。
与每个项目相关联的是从 10(喜欢)到 0(中立)到 -10(不喜欢)的值。
那么给定具有特定集合的用户,如何找到具有相似集合的用户(比如交叉点上的重叠百分比)?理想情况下,可以通过只包含喜欢/不喜欢值在一定百分比内的项目的过滤器来减少匹配集。
我不知道如何为此使用键/值或列存储,并且为每个用户遍历项目关系表似乎会消耗太多资源。将集合制作成文档似乎会失去清晰度。
Web 应用程序使用 Java。我搜索了 ORMS、NoSQL、ElasticSearch 以及相关的工具和数据库。有什么建议吗?
最佳答案
好吧,这似乎实际存储不是问题,但您想根据喜欢/不喜欢制作一个建议系统。
重点是您可以随心所欲地存储内容,即使在 SQL 中,大多数 SQL RDBMS 都足以满足您的数据存储需求,但您当然也可以使用任何您想要的其他内容。关键是,没有任何 SQL 解决方案(据我所知)会给你带来好的结果。您正在寻找的是一个基于人工智能的建议系统,而分布式系统的最佳建议系统是 Apache Mahout,它们实现了许多库。 .
根据我目前对它的了解,它基本上可以开箱即用。我知道它基于 Hadoop 和 Yarn,但我不确定您是否可以从任何地方导入数据,或者是否需要将其保存在 HDFS 中。
另一种选择是自己实现机器学习算法,该算法只能在一台机器上运行,但您不会在任何 sql 系统中通过简单查询获得所需的结果。
在大多数情况下,您需要机器学习算法和一些数字的查询是不够的,原因是您所面对的用户的多样性......如果您有一个用户 B,他喜欢/不喜欢他所拥有的一切与用户 A 的方式相同——但覆盖率仅为 15%。另一方面,您的用户 C 与 A 非常相似(虽然不是 100%,方向几乎相同)并且 C 标记了超过 90% 的内容,A 也标记了这些内容。在这种情况下,C 比 B 更接近 A,但 B 具有 100% 的覆盖率。在许多其他场景中,最简单的百分比是不够的,这就是为什么许多拥有建议系统(亚马逊、Netflix、Spotify 等)的公司使用 Apache Mahout 和类似系统来完成这些任务的原因。
关于java - 在数据库中存储和搜索集(具有许多可能的值)(来自 Java),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24092079/
我的问题是如何在 python 中创建一个简单的数据库。我的例子是: User = { 'Name' : {'Firstname', 'Lastname'}, 'Address' : {'Street
我需要创建一个与远程数据库链接的应用程序! mysql 是最好的解决方案吗? Sqlite 是唯一的本地解决方案吗? 我使用下面的方法,我想知道它是否是最好的方法! NSString *evento
给定两台 MySQL 服务器,一台本地,一台远程。两者都有一个包含表 bohica 的数据库 foobar。本地服务器定义了用户 'myadmin'@'%' 和 'myadmin'@'localhos
我有以下灵活的搜索查询 Select {vt:code},{vt:productcode},{vw:code},{vw:productcode} from {abcd AS vt JOIN wxyz
好吧,我的电脑开始运行有点缓慢,所以我重置了 Windows,保留了我的文件。因为我的大脑还没有打开,所以我忘记事先备份我的 MySQL 数据库。我仍然拥有所有原始文件,因此我实际上仍然拥有数据库,但
如何将我的 Access 数据库 (.accdb) 转换为 SQLite 数据库 (.sqlite)? 请,任何帮助将不胜感激。 最佳答案 1)如果要转换 db 的结构,则应使用任何 DB 建模工具:
系统检查发现了一些问题: 警告:?:(mysql.W002)未为数据库连接“默认”设置 MySQL 严格模式 提示:MySQL 的严格模式通过将警告升级为错误来修复 MySQL 中的许多数据完整性问题
系统检查发现了一些问题: 警告:?:(mysql.W002)未为数据库连接“默认”设置 MySQL 严格模式 提示:MySQL 的严格模式通过将警告升级为错误来修复 MySQL 中的许多数据完整性问题
我想在相同的 phonegap 应用程序中使用 android 数据库。 更多说明: 我创建了 phonegap 应用程序,但 phonegap 应用程序不支持服务,所以我们已经在 java 中为 a
Time Tracker function clock() { var mytime = new Date(); var seconds
我需要在现有项目上实现一些事件的显示。我无法更改数据库结构。 在我的 Controller 中,我(从 ajax 请求)传递了一个时间戳,并且我需要显示之前的 8 个事件。因此,如果时间戳是(转换后)
我有一个可以收集和显示各种测量值的产品(不会详细介绍)。正如人们所期望的那样,显示部分是一个数据库+建立在其之上的网站(使用 Symfony)。 但是,我们可能还会创建一个 API 来向第三方公开数据
我们将 SQL Server 从 Azure VM 迁移到 Azure SQL 数据库。 Azure VM 为 DS2_V2、2 核、7GB RAM、最大 6400 IOPS Azure SQL 数据
我正在开发一个使用 MongoDB 数据库的程序,但我想问在通过 Java 执行 SQL 时是否可以使用内部数据库进行测试,例如 H2? 最佳答案 你可以尝试使用Testcontainers Test
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 已关闭 9 年前。 此问题似乎与 a specific programming problem, a sof
我正在尝试使用 MSI 身份验证(无需用户名和密码)从 Azure 机器学习服务连接 Azure SQL 数据库。 我正在尝试在 Azure 机器学习服务上建立机器学习模型,目的是我需要数据,这就是我
我在我的 MySQL 数据库中使用这个查询来查找 my_column 不为空的所有行: SELECT * FROM my_table WHERE my_column != ""; 不幸的是,许多行在
我有那个基地:http://sqlfiddle.com/#!2/e5a24/2这是 WordPress 默认模式的简写。我已经删除了该示例不需要的字段。 如您所见,我的结果是“类别 1”的两倍。我喜欢
我有一张这样的 table : mysql> select * from users; +--------+----------+------------+-----------+ | userid
我有表: CREATE TABLE IF NOT EXISTS `category` ( `id` int(11) NOT NULL, `name` varchar(255) NOT NULL
我是一名优秀的程序员,十分优秀!