- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我遇到了一个与数据相关的问题,我无法解决。我认为最简单的方法是提供一些示例数据和预期输出来澄清我的问题。
我正在尝试计算 Jaccard coefficient使用购买历史记录。为此,我需要找到一起购买的产品以及购买的次数。
我有以下数据可以这样做:
category_id 和 item_id 一起使产品具有唯一可识别性。我将下面的查询附加到带有一些示例数据的 SQL 导出。具有以下数据:
期望的结果是:
i1.cat_id : i1.item_id : i2.cat_id : i2:item_id : count
1 : 1 : 2 : 2 : 2
1 : 1 : 1 : 3 : 1
1 : 1 : 1 : 5 : 1
2 : 2 : 1 : 3 : 2
2 : 2 : 2 : 4 : 1
2 : 2 : 3 : 6 : 1
重复出现项目颠倒的情况不是问题,甚至可能是需要的。
示例数据
CREATE TABLE `test_020516_01` (
`cat_id` int(11) NOT NULL,
`item_id` int(11) NOT NULL,
`visit_id` varchar(2) COLLATE utf8_unicode_ci NOT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci;
INSERT INTO `test_020516_01` (`cat_id`, `item_id`, `visit_id`) VALUES
(1, 1, 'A'),
(2, 2, 'A'),
(1, 3, 'A'),
(2, 2, 'B'),
(1, 3, 'B'),
(2, 4, 'B'),
(3, 6, 'B'),
(1, 1, 'C'),
(2, 2, 'C'),
(1, 5, 'C');
以下是我的最佳尝试,但尚未得到返回。对于某些组合,计数总计为 4,在这种情况下永远不会超过 3。
SELECT STAT.cat_id, STAT.item_id, STAT1.cat_id, STAT1.item_id, COUNT(*)
FROM test_020516_01 STAT
JOIN (
SELECT
cat_id, item_id, visit_id AS visit, count(*) AS count
FROM
test_020516_01
WHERE
cat_id != 0
AND
visit_id IS NOT NULL
GROUP BY
cat_id, item_id, visit_id
ORDER BY
count DESC
) STAT1
ON STAT.cat_id != STAT1.cat_id
AND STAT.item_id != STAT1.item_id
AND visit_id != STAT1.visit
GROUP BY
STAT.cat_id, STAT.item_id, STAT1.cat_id, STAT1.item_id;
提前感谢您的帮助:)
最佳答案
我无法理解为什么你将结果总结为 STAT1,或者你到底想要什么,但也许下面的查询会为你指明正确的方向(因为它的结果与你的预期结果相匹配,尽管它包括您遗漏的一些组合,我不能说是为了简洁还是因为某些我不理解的要求):
# non-permutable couples within same visitor
SELECT i1.cat_id, i1.item_id, i2.cat_id, i2.item_id, COUNT(*)
FROM test_020516_01 i1
JOIN test_020516_01 i2 ON (i2.visit_id = i1.visit_id AND
CONCAT(i1.cat_id, ';', i1.item_id) < CONCAT(i2.cat_id, ';', i2.item_id))
GROUP BY i1.cat_id, i1.item_id, i2.cat_id, i2.item_id
ORDER BY 1, 2, 3, 4
关于mysql - 确定哪些商品被一起购买(杰卡德系数),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36977593/
我已经训练了一个线性回归模型来以多输出方式进行预测。这是一个时间序列预测问题,根据一组输入来估计 future 12 个月的需求。在过去 - 如果我只预测一个输出值 - 我会简单地调用以下命令来访问模
我的应用程序对原始音频信号执行FFT(所有麦克风读数均为values中的16位整数值,即1024个单元)。它首先根据16位对读数进行归一化。然后提取频率为400Hz的幅度。 int sample_ra
我从包含相同语音内容的两个大约 30 秒的音频文件中提取了两个系列 MFCC 系数。音频文件从不同来源录制在同一位置。应该估计音频是否包含相同的对话或不同的对话。目前我已经测试了两个Mfcc系列的相关
我正在尝试使用两个自变量(批处理和方法)和一个因变量 (conc) 运行线性回归。当我运行回归时,我得到一个系数的 NA 值。当我更改模型中自变量的顺序时,NA 值显示为不同的变量。这是一个可重现的数
我想要的,大图:我想知道如何在 Java 中模仿 Mathematica 的 ExtendedGCD[...] 功能。有关该功能的信息可以在 here 中找到,但为了完整起见,我将对其进行简要描述。
我用 R 编写了这个套索代码,并且得到了一些 beta 值: #Lasso library(MASS) library(glmnet) Boston=na.omit(Boston) x=model.m
我有一个幅频响应点列表。振幅以分贝为单位给出。 任务是将此 AFR 列表导出为某些硬件 DSP 设备的一组系数。我知道此设备的文件格式。该设备的规范表明它需要 12288 个系数,并且 DSP 有 2
是否可以替换 lm 对象中的系数? 我认为以下会起作用 # sample data set.seed(2157010) x1 <- 1998:2011 x2 <- x1 + rnorm(length(
我正在尝试使用 lm.ridge 方法执行岭回归。我的问题是如何获得拟合模型的系数?我从调用中得到不同的结果: 模型$coef 系数(模型) 哪个是正确的?另外,为什么我从调用中得到不同的结果: co
以下代码片段死于 Eigen 断言: MatrixXd L; VectorXd x, b; ... ASSERT_MATRIX_EQ(L*x, b); 与, template void ASSERT
有没有办法从编码的图像和视频中轻松提取 DCT 系数(和量化参数)?任何解码器软件都必须使用它们来解码 block DCT 编码的图像和视频。所以我很确定解码器知道它们是什么。有没有办法将它们暴露给使
如何找到矢量 w 是多少,即垂直于分离平面? 最佳答案 我就是这样做的here .如果我没记错的话,这是基于 dual form 的SVM 优化的结果。 model = svmtrain(...);
我是 FFMPEG 的新手。我知道如何提取关键帧, 但现在我想提取那些 I 帧的 DC 系数。 您能否帮助编写 FFMPEG 命令的正确语法以获取 DC 系数? 问候 最佳答案 FFmpeg 命令不会
任何人都可以共享任何代码或可调用以从 HEVC 比特流中提取变换系数 (DCT/DST) 的函数吗? 我检查了 HM 16.0 的源代码。文件\source\Lib\TLibCommon\TComTr
我需要从 MPEG4 视频中提取有关运动矢量和 DC 系数的信息。我搜索了相关站点和主题,发现一个好的解决方案是使用 ffmpeg 编解码器的代码。尤其是 libavcodec/mpegvideo.c
我想删除sympy符号表达式中等于1的任何系数,例如:我希望 1.0x**2 成为 x**2 ,有办法做到吗?另外,如果可能的话,可以对整数进行舍入,例如将 2.0x**2 变为 2*x**2 最佳答
我想删除sympy符号表达式中等于1的任何系数,例如:我希望 1.0x**2 成为 x**2 ,有办法做到吗?另外,如果可能的话,可以对整数进行舍入,例如将 2.0x**2 变为 2*x**2 最佳答
我最近的任务是将 PMML 解析回 R 模型。 (我进行了广泛搜索,没有库可以为您进行这种转换。)我正在尝试将包含多项逻辑回归的 PMML 转换回 R 模型,但我不知道如何转换任何PMML 文档中保存
当使用 pandas statsmodels 的 .summary() 函数时,OLS 回归结果包括以下字段。 coef std err t P>|t| [
我正在 STM32F4 微 Controller 上使用 CMSIS 库开发 PID Controller 。我实在无法理解PID参数的归一化。现在我有了 PID Controller 的三个 Kp、
我是一名优秀的程序员,十分优秀!