gpt4 book ai didi

六位 base36 数字范围的 Javascript 正则表达式

转载 作者:行者123 更新时间:2023-11-29 22:27:39 25 4
gpt4 key购买 nike

我正在构建一个 node.js 应用程序,并将 unix 时间戳(以秒为单位)的六位 base36 表示形式存储为 Mongodb 中 _id 的第一部分。典型的 _id 如下所示:

"_id" : "lwhlzy/czwszasfgr/a4d18976c1/f835caa1c3/184d06b47f"

多个数据被连接起来,包括时间戳,后面是一系列散列数据,以形成 GUID 和“materialized path

以后的查询将根据时间范围选择记录,然后选择路径以获取该特定路径在该时间段内发生的事件。这些查询将依赖于 rooted regular expressions ,所以我需要一个可以找到一系列 base36 数字的正则表达式:

这是我目前的代码(通过 Node 运行的测试,是的,它被硬编码为六位数字。第七位数字在 2038 年 12 月 23 日之前不需要。)

var base36 = "0123456789abcdefghijklmnopqrstuvwxyz";

// determine how many left-most characters from & to have in common
// this function works nicely, no problems here
var getOverlap = function (from, to) {
regex = '';
count = to.length;

for (i in to) {
regex += (i>0?'|':'')+'('+to.slice(0,count)+')';
count--;
}

result = from.match(RegExp(regex,"ig"));
return result[0];
};

var from = "lec0s0";
var to = "lwhvqg"; // generated from: parseInt(Date.now()/1000,10).toString(36)

var overlap = getOverlap(from,to);

console.log(from);
console.log(to);

var regex = overlap;
var i = overlap.length;
// start immediately after the left-most common characters and append the rest of the regex
while (i<6) {
regex += "[";

if (from[i] < to[i]) {
regex += base36.slice(base36.indexOf(from[i]), base36.indexOf(to[i])+1);
} else {
regex += base36.slice(base36.indexOf(from[i])) + base36.slice(0, base36.indexOf(to[i])+1);
}

regex += "]";
i++;
}

console.log(regex);
process.exit();

这将输出如下内容:

l[efghijklmnopqrstuvw][cdefgh][0123456789abcdefghijklmnopqrstuv][stuvwxyz0123456789abcdefghijklmnopq][0123456789abcdefg]

在研究这个之后我意识到这有两个主要问题:1)它不太适合真实范围(它会跳过大量记录)和 2)我宁愿有像 [e-w] 这样的字符范围 而不是明确说明的每个字符,尽管它仍然有效。

对于输入 from="lec0s0"to="lwhvqg" 我意识到我遗漏了这个正则表达式的很大一部分。例如,上面的代码只允许第 3 个字符在 c-h 范围内,但在第 2 个字符递增之前,该位置需要达到“z”。我确定我实际上需要一个看起来更像这样的正则表达式:

l[e-v][0-9a-z][0-9a-z][0-9a-z][0-9a-z]|l[e-w][c-g][0-9a-z][0-9a-z][0-9a-z]|l[e-w][c-h][0-9a-u][0-9a-z][0-9a-z]|l[e-w][c-h][0-9a-v][0-9a-o][0-9a-z]|l[e-w][c-h][0-9a-v][0-9a-q][0-9a-g]

所以我的问题是:我得出正则表达式需要看起来像上面后者的结论是否正确?如果是这样,我该如何修改代码来生成它?

提前致谢!

最佳答案

您当前的模式将从 le0000 开始匹配,您实际上希望匹配:

lec0s[0-9a-z]|lec0[t-z][0-9a-z]{1}|lec[1-9a-z][0-9a-z]{2}|le[d-z][0-9a-z]{3}|l[f-v][0-9a-z]{4}|lw[0-9a-g][0-9a-z]{3}|lwh[0-9a-u][0-9a-z]{2}|lwhv[0-9a-p][0-9a-z]{1}|lwhvq[0-9a-g]

以下函数应该为您提供所需的正则表达式:

function getRegex(from,to) {
var base36 = '0123456789abcdefghijklmnopqrstuvwxyz',
getRange = function(f,t) {
if(f == t) {
return f;
}
if(base36.indexOf(f) >= base36.indexOf(t)) {
return t;
}
if(t <= '9' || f >= 'a'){
return '[' +f+'-'+t+']';
}
return '[' +f+(f<'9'?'-9':'')+(t>'a'?'a-':'')+t+']';
},
from = from.split(''),
to = to.split(''),
prefix='',
regex=[],
tmp,i,l;

for(i=0,l=from.length;i<l;i++) {
if(from[i]!=to[i]) {
break;
}
prefix+=from[i];
}
from.splice(0,prefix.length);
to.splice(0,prefix.length);

i = from.length;
while(i--) {
tmp = prefix+from.slice(0,i).join('');
if(from[i] == 'z') {
tmp+='z';
}
else if(from.length-i == 1) {
tmp += getRange(from[i],'z');
}
else if(i) {
tmp += getRange(base36.charAt(base36.indexOf(from[i])+1),'z');
tmp += '[0-9a-z]{'+(from.length-i-1)+'}';
}
else {
tmp += getRange(base36.charAt(base36.indexOf(from[i])+1),base36.charAt(base36.indexOf(to[i])-1));
tmp += '[0-9a-z]{'+(from.length-i-1)+'}';
}
regex.push(tmp);
}
for(i=1,l=to.length;i<l;i++) {
tmp = prefix+to.slice(0,i).join('');
if(to[i] == '0') {
tmp+='0';
}
else if(to.length-i == 1) {
tmp += getRange('0',to[i]);
}
else {
tmp += getRange('0',base36.charAt(base36.indexOf(to[i])-1));
tmp += '[0-9a-z]{'+(from.length-i-1)+'}';
}
regex.push(tmp);
}

return regex.join('|');
}

你可以在这里看到它:http://jsfiddle.net/3cu52/3/

关于六位 base36 数字范围的 Javascript 正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8582408/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com