- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个包含客户、产品和类别的购买数据集。
customer product category sales_value
A aerosol air_care 10
B aerosol air_care 12
C aerosol air_care 7
A perfume air_care 8
A perfume air_care 2
D perfume air_care 11
C burger food 13
D fries food 6
C fries food 9
我想要了解每种产品在该产品上花费的销售值(value)与至少购买该产品一次的客户在该产品类别上花费的销售值(value)之间的比率。
另一种说法:选取至少购买过一次薯条
的客户,计算所有这些人的 A) 花在薯条
上的销售值(value)总和以及B) 花在食品
上的销售值(value)总和。
中间表的形式如下:
product category sum_spent_on_product sum_spent_on_category ratio
by_people_buying_product
aerosol air_care 29 39 0.74
perfume air_care 21 31 0.68
burger food 13 22 0.59
fries food 15 28 0.53
示例:至少购买过一次气雾剂
的人在该产品上总共花费了 1800 美元。总体而言,这些人在 air_care
类别(aerosol
所属)上花费了 3600 美元。因此,气溶胶
的比率为 0.5。
我尝试使用左连接横向
来解决这个问题,并计算每个产品
给定的中间结果,但我无法理解如何解决这个问题添加条件仅适用于购买此特定产品的客户
:
select
distinct (product_id)
, category
, c.sales_category
from transactions t
left join lateral (
select
sum(sales_value) as sales_category
from transactions
where category = t.category
group by category
) c on true
;
以上查询列出了每种产品在产品类别上的支出总和,但没有所需的产品购买者条件。
左连接横向
是正确的方法吗?普通 SQL 中还有其他解决方案吗?
最佳答案
我会使用窗口函数来计算每个客户在每个类别中的总支出:
SELECT
customer, product, category, sales_value,
sum(sales_value) OVER (PARTITION BY customer, category) AS tot_cat
FROM transactions;
customer | product | category | sales_value | tot_cat
----------+---------+----------+-------------+---------
A | aerosol | air_care | 10.00 | 20.00
A | perfume | air_care | 8.00 | 20.00
A | perfume | air_care | 2.00 | 20.00
B | aerosol | air_care | 12.00 | 12.00
C | aerosol | air_care | 7.00 | 7.00
C | fries | food | 9.00 | 22.00
C | burger | food | 13.00 | 22.00
D | perfume | air_care | 11.00 | 11.00
D | fries | food | 6.00 | 6.00
那么我们只需要总结一下。当顾客多次购买同一种产品时就会出现问题。在您的示例中,客户 A
购买了香水两次。为了解决这个问题,让我们同时按客户、产品和类别进行分组(并对 sales_value
列求和):
SELECT
customer, product, category, SUM(sales_value) AS sales_value,
SUM(SUM(sales_value)) OVER (PARTITION BY customer, category) AS tot_cat
FROM transactions
GROUP BY customer, product, category
customer | product | category | sales_value | tot_cat
----------+---------+----------+-------------+---------
A | aerosol | air_care | 10.00 | 20.00
A | perfume | air_care | 10.00 | 20.00 <-- this row summarizes rows 2 and 3 of previous result
B | aerosol | air_care | 12.00 | 12.00
C | aerosol | air_care | 7.00 | 7.00
C | burger | food | 13.00 | 22.00
C | fries | food | 9.00 | 22.00
D | perfume | air_care | 11.00 | 11.00
D | fries | food | 6.00 | 6.00
现在我们只需将 sales_value 和 tot_cat 相加即可得到中间结果表。我使用公共(public)表表达式来获取名为 t
的先前结果:
WITH t AS (
SELECT
customer, product, category, SUM(sales_value) AS sales_value,
SUM(SUM(sales_value)) OVER (PARTITION BY customer, category) AS tot_cat
FROM transactions
GROUP BY customer, product, category
)
SELECT
product, category,
sum(sales_value) AS sales_value, sum(tot_cat) AS tot_cat,
sum(sales_value) / sum(tot_cat) AS ratio
FROM t
GROUP BY product, category;
product | category | sales_value | tot_cat | ratio
---------+----------+-------------+---------+------------------------
aerosol | air_care | 29.00 | 39.00 | 0.74358974358974358974
fries | food | 15.00 | 28.00 | 0.53571428571428571429
burger | food | 13.00 | 22.00 | 0.59090909090909090909
perfume | air_care | 21.00 | 31.00 | 0.67741935483870967742
关于sql - 条件总和的左连接横向,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54852276/
我基本上有三个表: hunt_c_usershunt_c_collected_eggshunt_c_achievements 我目前只使用 hunt_c_users 和 hunt_c_collecte
我已经计算了不同表中计数的总和。这会执行两次,每个 performanceID 一次。现在我想得到两个总和的总和。 下面是我目前做的两个总和的代码: SELECT SUM((COUNT (Bo
我有一个对 2 个值求和的脚本。我计划添加更多值(value),但首先我需要让它发挥作用。人们告诉我给他们 NUMBER 值,所以我这样做了,但现在它甚至没有给出输出。 base = 0; $("#F
我正在尝试计算在我们的数据库中跟踪的花费总额。每个订单文档包含一个字段“total_price” 我正在尝试使用以下代码: db.orders.aggregate({ $group: {
给定 Excel 2013(或更高版本)中的 2 个命名表: tbl发票 ID InvRef Total 1 I/123 45 2 I/234
希望你们一切都好。我来这里是因为我从今天早上开始就试图解决一个问题,我再也受不了了。 这就是上下文:我有一个 excel 工作簿,其中有不同的工作表,其中包含不同国家/地区的不同商业计划。我的目标是制
我有一份报告显示客户订购的产品及其价格: CompanyA Product 7 14.99 CompanyA Product 3 45.95 CompanyA Prod
我使用此python客户端: https://github.com/ryananguiano/python-redis-timeseries 如何汇总所有匹配? ts = TimeSeries(cli
希望创建一个总和和计数公式,该公式将自动调整以适应范围内插入的新行。 例如,如果我在单元格 D55 中有公式 =SUM(D17:D54)。每次我在该范围内插入新行时,我都需要更改公式的顶部范围来解释它
所以,我需要聚合日期相同的行。 到目前为止,我的代码返回以下内容: date value source 0 2018-04-08 15:52:26.1
我有数字输入 数量约为 30 我需要将它们全部汇总到一个字段 我拥有的在下面 查看:
您好,我正在尝试根据以下数据计算过去三个月中出现不止一次的不同帐户 ID 的数量;我想要 2 作为查询结果,因为 test1@gmail.com 和 test2@gmail.com 出现超过 1 次。
我有两个带有以下字段的表: ... orders.orderID orders.orderValue 和 payments.orderID payments.payVal 在 payments.pay
我想按 image_gallery 和 video_gallery 两列的 DESC 进行排序。 SELECT b.*, c.title as category, (S
实际上我的原始数据库为 SELECT sum(data1,data2) as database_value,sum(data3,data4) as database_not_value from t
我试图获取三个分数中每一个的值并将它们相加并显示在“总计:”中。我的问题是,我不知道如何做到这一点,以便每次其中一个分数值发生变化时,相应的总分值也会随之变化。 我可以在某处调用“onchange”来
如何获得按第一个值分组的元组列表中第二个和第三个值的总和? 即: list_of_tuples = [(1, 3, 1), (1, 2, 4), (2, 1, 0), (2, 2, 0)] expec
我正在尝试将我的列表中的整数转换为列表的总和和平均值,并说明任何低于冰点 F<32 的温度。每当我尝试获取总和或平均值时,我都会收到错误提示“+: 'int' 和 'str' 不支持的操作数类型”。我
在我的 ios 项目中,我使用了两个实体 (CoreData):具有一对多关系的 Person 和 Gifts 我知道如何计算给一个人的礼物总和: NSDecimalNumber *orderSum=
我有两个表(输入和类别): CREATE TABLE categories ( iId INTEGER NOT NULL PRIMARY KEY AUTOINCREMENT, sNam
我是一名优秀的程序员,十分优秀!