- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
使用百分位数函数,但我没有得到所需的输出。我会说“不正确”,但功能可能按预期工作,我只是没有正确理解它们。
这些是我正在处理的数字:
n = 32
160000
202800
240000
250000
265000
280000
285000
300000
300000
300000
300000
300000
309000
325000
350000
358625
364999.92
393750
400000
420000
425000
450000
450000
463500
475000
475000
505808
525000
550000
567300
665000
900000
我对 percentile_cont
的理解是,如果计数是偶数,它将聚合两个数字,因为它将添加它们然后除以二。我对 percentile_disc
的理解是,如果计数是偶数,它只会选择最小的数字。
这是我对计算百分位数的理解,以第 50 个(中位数)为例:
如果数字(n)的个数是奇数,就挑中间的数字;如果数字是偶数,则将中间的两个数字平均。所以在这种情况下,有 32 个数,所以中位数 = (358625 + 364999.92)/2 = 361812.46
。 percentile_cont
返回正确的值,因为它对两个值求平均; percentile_disc
返回不正确的值,因为它选择了两者中的最低值。
关于其他百分位数,例如第 10 个,我的理解是您将百分位数乘以数字的数量 (n) 以获得索引:在本例中为 .10 * 32 = 3.2 index
。然后你应该四舍五入到最接近的整数,这就是你的百分位值。如果索引是整数,则将索引中的数字与其后的数字进行平均。
在这种情况下,percentile_cont
是错误的,因为它返回 251500
,这甚至不是我可以得出的数字。我能得到的最接近的平均值是 24000、250000、265000
,即 251666.67
。 percentile_disc
返回 250000
的正确结果。
但真正的关键是这个:第 75 个。根据我的计算,它应该返回 469250
。 index = (32*.75) = 24
,该索引应导致 (463500 + 475000) = 469250
。 percentile_disc
返回 463500
; percentile_cont
返回 466375
,我这辈子也无法得出这个数字。
这是我的查询:
SELECT
itemcode,
COUNT(itemcode) AS n,
PERCENTILE_DIST(0.10) WITHIN GROUP (ORDER BY price) AS 10th,
PERCENTILE_DIST(0.25) WITHIN GROUP (ORDER BY price) AS 25th,
PERCENTILE_CONT(0.50) WITHIN GROUP (ORDER BY price) AS median,
AVG(price) AS mean,
PERCENTILE_DIST(0.65) WITHIN GROUP (ORDER BY price) AS 65th,
PERCENTILE_DIST(0.75) WITHIN GROUP (ORDER BY price) AS 75th,
PERCENTILE_DIST(0.90) WITHIN GROUP (ORDER BY price) AS 90th
FROM items
WHERE itemcode = 26 AND removed IS NULL
GROUP BY itemcode;
注意:没有removed
不是NULL
的情况。
我需要做什么才能使它正确且一致地工作?我是否需要编写一个函数来先检查 n
,然后根据它是偶数还是奇数来决定哪个 percentile_disc
或 percentile_cont
?
SQL fiddle :http://sqlfiddle.com/#!17/aa09c/9
最佳答案
将这个问题发布到 Reddit 并获得了一些帮助。
显然,percentile_cont
函数,除了 Excel 中的 percentile
和 percentile.inc
函数外,还使用 C=1 变体进行计算维基百科中解释的线性插值:
显然,我一直在使用的是平均经验分布。
因此 PostgreSQL 的 native 函数将无法很好地工作,需要制作一个自定义函数,我将在完成后发布。 (我怀疑它会使用 9.4 之前的旧 ntile
方法,但仍在研究中)。
但无论如何,这就是它关闭的原因。
关于sql - percentile_cont 和 percentile_disc 都没有在 PostgreSQL 9.6.3 中计算所需的第 75 个百分位数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46163213/
SQL 和一般开发的新手,我有一个表(COUNTRIES),其中包含字段(INDEX、NAME、POPULATION、AREA) 通常我添加一个客户端(Delphi)计算字段(DENSITY)和 On
我想使用 calc(100%-100px),但在我的 demo 中不起作用由于高度只接受像素,因此如何将此百分比值转换为像素。 最佳答案 以下将为您提供高度: $(window).height();
我正在尝试在 MySQL 中添加列并动态填充其他列。 例如我有一张表“数字”并具有第 1 列、第 2 列、第 3 列,这些总数应填充在第 4 列中 最佳答案 除非我误解了你的问题,否则你不只是在寻找:
我想返回简单计算的结果,但我不确定如何执行此操作。我的表格如下: SELECT COUNT(fb.engineer_id) AS `total_feedback`, SUM(fb.ra
我一直在尝试做这个程序,但我被卡住了,我仍然是一个初学者,任何帮助将不胜感激。我需要程序来做 打印一个 10 X 10 的表格,其中表格中的每个条目都是行号和列号的总和 包含一个累加器,用于计算所有表
这个计算背后一定有一些逻辑。但我无法得到它。普通数学不会导致这种行为。谁能帮我解释一下原因 printf ("float %f\n", 2/7 * 100.0); 结果打印 1.000000 为什么会
我想计算从 0 到 (n)^{1/2} - 1 的数字的 AND每个数字从 0 到 (n)^{1/2} - 1 .我想在 O(n) 中执行此操作时间,不能使用 XOR、OR、AND 运算。 具体来说,
如何在 Excel 中将公式放入自定义数字格式?例如(出于说明目的随机示例), 假设我有以下数据: 输入 输出 在不编辑单元格中的实际数据的情况下,我想显示单元格中的值除以 2,并保留两位小数: 有没
每次我在 Flutter 应用程序中调用计算()时,我都会看到内存泄漏,据我所知,这基本上只是一种生成隔离的便捷方法。我的应用程序内存占用增加并且在 GC 之后永远不会减少。 我已将我的代码简化为仅调
我有数字特征观察 V1通过 V12用于目标变量 Wavelength .我想计算 Vx 之间的 RMSE列。数据格式如下。 每个变量“Vx”以 5 分钟的间隔进行测量。我想计算所有 Vx 变量的观测值
我正在寻找一种使用 C 语言计算文件中未知字符数的简单方法。谢谢你的帮助 最佳答案 POSIX 方式(可能是您想要的方式): off_t get_file_length( FILE *file ) {
我正在使用 Postgres,并且我正试图围绕如何在连续日期跨度中得出第一个开始日期的问题进行思考。例如 :- ID | Start Date | End Date =================
我有一个订单表格,我在其中使用 jQuery 计算插件来汇总总数。 此求和工作正常,但生成的“总和”存在问题。总之,我希望用逗号替换任何点。 代码的基础是; function ($this) {
我在使用 double 变量计算简单算术方程时遇到问题。 我有一个具有 double 属性 Value 的组件,我将此属性设置为 100。 然后我做一个简单的减法来检查这个值是否真的是 100: va
我在这里看到了一些关于 CRC 32 计算的其他问题。但没有一个让我满意,因此是这样。 openssl 库是否有任何用于计算 CRC32 的 api 支持?我已经在为 SHA1 使用 openssl,
当我在PHP日期计算中遇到问题时,我感到惊讶。 $add = '- 30 days'; echo date('Y-m-01', strtotime($add)); // result is 2017-
我正在使用 javascript 进行练习,我编写了这个脚本来计算 2 个变量的总和,然后在第三个方程中使用这个总和!关于如何完成这项工作的任何想法都将非常有用! First Number:
我有一个来自EAC的提示单和一个包含完整专辑的FLAC文件。 我正在尝试制作一些python脚本来播放文件,因为我需要能够设置在flac文件中开始的位置。 如何从CueSheet格式MM:SS:FF转
这个问题已经有答案了: Adding two numbers concatenates them instead of calculating the sum (24 个回答) 已关闭去年。 我有一个
4000 我需要上面字段 name="quantity" 和 id="price" 中的值,并使用 javascript 函数进行计算,并将其显示在字段 id= 中仅当我单击计算按钮时才显示“总
我是一名优秀的程序员,十分优秀!