作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想创建一个频率分布矩阵
1.Create a matrix.**Is it possible to get this in separate columns**
customer1 p1 p2 p3
customer 2 p2 p3
customer 3 p2 p3 p1
customer 4 p2 p1
2. Then I have to count the number of products that come together the most
For eg
p2 and p3 comes together 3 times
p1 p3 comes 2 times
p1 p2 comes 2 times
I want to recommend products to customers ,frequency of products that comes together
select customerId,product,count(*) from sales group by customerId,product
最佳答案
如果要客户购买的成对产品,则可以使用自我联接:
select s1.product, s2.product, count(*) as cnt
from sales s1 join
sales s2
on s1.customerId = s2.customerId
where s1.product < s2.product
group by s1.product, s2.product
order by cnt desc;
关于SQL查询产品的频率分布矩阵,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42749016/
我一直在关注可以在这里找到的风格测量教程(programminghistorian.com)。这使用 matplotlib 绘制某些文本的频率分布。相关代码如下: for author in auth
我的目标是在大型平面文件(1GB+)中创建每个字符的频率分布,以便以后导入数据库。理想情况下,输出是一个 ASCII 字符列表,每个字符后跟一个计数。 我目前正在使用 HashMap 来创建字符串中每
我正在尝试将单词列表(标记化字符串)分解为每个可能的子字符串。然后我想在每个子字符串上运行 FreqDist,以找到最常见的子字符串。第一部分工作正常。但是,当我运行 FreqDist 时,出现错误:
我是一名优秀的程序员,十分优秀!