- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我有一个随机产品列表(1000 个),每个产品都有一个 ID,我正在随机显示它们。我希望这些项目不重复。目前我正在做的是:
select * from products where product_id <> previous_product_id order by rand() limit 1;
我确保不会在之后直接出现相同的产品。重复产品通常出现得比我想要的要早得多(我相信我说这是 birthday problem 是对的)。我不知道以非重复方式获取随机数据的最有效方法是什么。我想到了一种我认为非常低效的方法:
我会为用户分配一个 ID(例如 foo),然后当他们看到一个项目时,将其添加到一个字符串中,该字符串将是 product_id_1 AND product_id_2 AND product_id_3 AND product_id_n
。我会用 timestamp(进一步解释)
存储这些数据。
+--------------------------------------------------------------------------------------------+
|user_id |timestamp | product_seen_string |
|--------------------------------------------------------------------------------------------|
|foo |01-01-14 12:00:00 |product_id_1 AND product_id_2 AND product_id_3 AND product_id_n |
+--------------------------------------------------------------------------------------------+
有了这个 product_seen_string
,我会继续添加到看到的产品(我也会更新时间戳),然后在查询中我会根据 user_id
进行第一次查询> 获取此字符串,然后将返回的字符串添加到获取随机产品的主查询中,如下所示:
select * from products where product_id <> product_id_1 AND product_id_2 AND product_id_3 AND product_id_n order by rand() limit 1;
我还会写到,如果没有产品被退回,那么数据将被删除,这样循环就可以重新开始。除了有一个每十分钟运行一次的 cron 作业以查看时间戳是否早于一个小时,我会删除它。
我使用的脚本语言是PHP
最佳答案
选择随机行总是很棘手,没有不涉及一些妥协的完美解决方案。要么妥协性能,要么妥协甚至随机分布,要么妥协选择重复的机会等。
作为@Giacomo1968 mentions in their answer ,任何带有 ORDER BY RAND()
的解决方案都无法很好地扩展。随着表中的行数越来越大,在文件排序中对整个表进行排序的成本越来越差。 Giacomo1968 是正确的,当排序顺序是随机的时候查询不能被缓存。但我不太关心这个,因为我通常无论如何都会禁用查询缓存(它有自己的可伸缩性问题)。
下面是通过创建一个 rownum 列并分配唯一的连续值来预先随机化表中行的解决方案:
ALTER TABLE products ADD COLUMN rownum INT UNSIGNED, ADD KEY (rownum);
SET @rownum := 0;
UPDATE products SET rownum = (@rownum:=@rownum+1) ORDER BY RAND();
现在您可以通过索引查找获得随机行,无需排序:
SELECT * FROM products WHERE rownum = 1;
或者你可以获得下一个随机行:
SELECT * FROM products WHERE rownum = 2;
或者您可以一次获得 10 个随机行,或者您想要的任何其他数字,没有重复:
SELECT * FROM products WHERE rownum BETWEEN 11 and 20;
您可以随时重新随机化:
SET @rownum := 0;
UPDATE products SET rownum = (@rownum:=@rownum+1) ORDER BY RAND();
进行随机排序的成本仍然很高,但现在您不必对每个 SELECT 查询都进行随机排序。您可以按计划进行,最好是在非高峰时间。
关于mysql - 从 MySQL 数据库中获取随机数据但不重复数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24046003/
我的问题是如何在 python 中创建一个简单的数据库。我的例子是: User = { 'Name' : {'Firstname', 'Lastname'}, 'Address' : {'Street
我需要创建一个与远程数据库链接的应用程序! mysql 是最好的解决方案吗? Sqlite 是唯一的本地解决方案吗? 我使用下面的方法,我想知道它是否是最好的方法! NSString *evento
给定两台 MySQL 服务器,一台本地,一台远程。两者都有一个包含表 bohica 的数据库 foobar。本地服务器定义了用户 'myadmin'@'%' 和 'myadmin'@'localhos
我有以下灵活的搜索查询 Select {vt:code},{vt:productcode},{vw:code},{vw:productcode} from {abcd AS vt JOIN wxyz
好吧,我的电脑开始运行有点缓慢,所以我重置了 Windows,保留了我的文件。因为我的大脑还没有打开,所以我忘记事先备份我的 MySQL 数据库。我仍然拥有所有原始文件,因此我实际上仍然拥有数据库,但
如何将我的 Access 数据库 (.accdb) 转换为 SQLite 数据库 (.sqlite)? 请,任何帮助将不胜感激。 最佳答案 1)如果要转换 db 的结构,则应使用任何 DB 建模工具:
系统检查发现了一些问题: 警告:?:(mysql.W002)未为数据库连接“默认”设置 MySQL 严格模式 提示:MySQL 的严格模式通过将警告升级为错误来修复 MySQL 中的许多数据完整性问题
系统检查发现了一些问题: 警告:?:(mysql.W002)未为数据库连接“默认”设置 MySQL 严格模式 提示:MySQL 的严格模式通过将警告升级为错误来修复 MySQL 中的许多数据完整性问题
我想在相同的 phonegap 应用程序中使用 android 数据库。 更多说明: 我创建了 phonegap 应用程序,但 phonegap 应用程序不支持服务,所以我们已经在 java 中为 a
Time Tracker function clock() { var mytime = new Date(); var seconds
我需要在现有项目上实现一些事件的显示。我无法更改数据库结构。 在我的 Controller 中,我(从 ajax 请求)传递了一个时间戳,并且我需要显示之前的 8 个事件。因此,如果时间戳是(转换后)
我有一个可以收集和显示各种测量值的产品(不会详细介绍)。正如人们所期望的那样,显示部分是一个数据库+建立在其之上的网站(使用 Symfony)。 但是,我们可能还会创建一个 API 来向第三方公开数据
我们将 SQL Server 从 Azure VM 迁移到 Azure SQL 数据库。 Azure VM 为 DS2_V2、2 核、7GB RAM、最大 6400 IOPS Azure SQL 数据
我正在开发一个使用 MongoDB 数据库的程序,但我想问在通过 Java 执行 SQL 时是否可以使用内部数据库进行测试,例如 H2? 最佳答案 你可以尝试使用Testcontainers Test
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 已关闭 9 年前。 此问题似乎与 a specific programming problem, a sof
我正在尝试使用 MSI 身份验证(无需用户名和密码)从 Azure 机器学习服务连接 Azure SQL 数据库。 我正在尝试在 Azure 机器学习服务上建立机器学习模型,目的是我需要数据,这就是我
我在我的 MySQL 数据库中使用这个查询来查找 my_column 不为空的所有行: SELECT * FROM my_table WHERE my_column != ""; 不幸的是,许多行在
我有那个基地:http://sqlfiddle.com/#!2/e5a24/2这是 WordPress 默认模式的简写。我已经删除了该示例不需要的字段。 如您所见,我的结果是“类别 1”的两倍。我喜欢
我有一张这样的 table : mysql> select * from users; +--------+----------+------------+-----------+ | userid
我有表: CREATE TABLE IF NOT EXISTS `category` ( `id` int(11) NOT NULL, `name` varchar(255) NOT NULL
我是一名优秀的程序员,十分优秀!