gpt4 book ai didi

sql - postgres替换文本中的计算值

转载 作者:行者123 更新时间:2023-11-29 12:04:32 28 4
gpt4 key购买 nike

我有一个表列 numbers 包含如下字符串:

1, 2, 2A, 14, 14A, 20

以所需的升序排列。

如何制定 ORDER BY 子句来实现此顺序?

默认情况下,postgres 必须求助于字母顺序,即:

1, 2, 14, 20, 2A, 14A

仅使用 Postgres 附带的字符串操作功能可以做到这一点吗? (replace()regex_replace() 等?)

我的第一个想法是:

  1. 剪掉这封信,如果有的话
  2. 数量 * 100
  3. 添加字母的 ascii,如果存在的话

这将产生预期的结果,因为映射值将是:

100, 200, 265, 1400, 1465, 2000

我还可以索引这个被操纵的值以加快排序。

附加限制:

我不能对十六进制数字进行强制转换,因为例如:14Z 也是有效的。

理想情况下,结果是单个表达式。我需要使用此转换进行过滤和排序,例如:

SELECT * FROM table WHERE transform(numbers) < 15 ORDER BY transform(numbers)
RESULT:

1, 2, 2A, 14, 14A

我尝试使用我从@klin 的回答中学到的知识来实现​​我的想法:

  1. 剪切字母并将数字乘以 100:

    substring('12A' from '(\d+).*')::int*100
  2. 截取数字得到字母的ASCII码:

    ascii(substring('12A' from '\d+([A-Z])'))
  3. 将两者相加。

这适用于 12A,但不适用于 12,因为第二个表达式返回 NULL 而不是 0(数字零)。有什么想法吗?

最佳答案

基于这些假设:

  • 数字由数字和可选的一个未决字母组成,仅此而已。
  • 始终至少有一个前导数字。
  • 所有字母都是大写 [A-Z] 或小写 [a-z],但不能混合。

我会在表列上使用 CHECK 约束来强制执行,以确保绝对可靠。

创建一个微型 IMMUTABLE SQL 函数:

CREATE OR REPLACE FUNCTION f_nr2sort(text)
RETURNS int AS
$func$
SELECT CASE WHEN right($1, 1) > '9' COLLATE "C" -- no collation
THEN left($1, -1)::int * 100 + ascii(right($1, 1))
ELSE $1::int * 100 END -- only digits
$func$ LANGUAGE SQL IMMUTABLE;

根据上述假设针对性能进行了优化。我用更便宜的 left() and right() 替换了所有正则表达式.

disabled collation rules with COLLATE "C"对于 CASE 表达式(它也更便宜)以确保 ASCII 字母的默认字节顺序。 [a-zA-Z] 中的字母排序在“9”之上,如果最后一个字母也是如此,我们将相应地进行处理。
这样我们就可以避免添加 NULL 值,也不需要使用 COALESCE 进行修复.

那么你的查询可以是:

SELECT *
FROM tbl
WHERE f_nr2sort(numbers) < f_nr2sort('15C')
ORDER BY f_nr2sort(numbers);

由于该函数是IMMUTABLE,您甚至可以创建一个简单的 functional index支持此类查询:

CREATE INDEX tbl_foo_id ON tbl (f_nr2sort(numbers));

关于sql - postgres替换文本中的计算值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34044410/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com