gpt4 book ai didi

javascript - 从JS变量构建正则表达式不起作用

转载 作者:数据小太阳 更新时间:2023-10-29 05:41:52 24 4
gpt4 key购买 nike

我正在尝试从静态文本以及javascript中的变量构建正则表达式。显然,我缺少一些非常基本的东西,请参见下面的代码中的注释。非常感谢您的帮助:

var test_string = "goodweather";

// One regexp we just set:
var regexp1 = /goodweather/;

// The other regexp we built from a variable + static text:
var regexp_part = "good";
var regexp2 = "\/" + regexp_part + "weather\/";

// These alerts now show the 2 regexp are completely identical:
alert (regexp1);
alert (regexp2);

// But one works, the other doesn't ??
if (test_string.match(regexp1))
alert ("This is displayed.");

if (test_string.match(regexp2))
alert ("This is not displayed.");

最佳答案

首先,问题的答案:

其他答案几乎是正确的,但是没有考虑当要匹配的文本包含文字反斜杠时(即:regexp_part包含文字反斜杠)时会发生什么。例如,当regexp_part等于:"C:\Windows"时会发生什么?在这种情况下,建议的方法将无法正常工作(结果正则表达式变为:/C:\Windows/,其中\W被错误地解释为非单词字符类)。正确的解决方案是先转义regexp_part中的任何反斜杠(所需的正则表达式实际上是:/C:\\Windows/)。

为了说明解决此问题的正确方法,以下是一个函数,该函数采用传递的短语并创建一个正则表达式,并将该短语包装在\b字边界内:

// Given a phrase, create a RegExp object with word boundaries.
function makeRegExp(phrase) {
// First escape any backslashes in the phrase string.
// i.e. replace each backslash with two backslashes.
phrase = phrase.replace(/\\/g, "\\\\");
// Wrap the escaped phrase with \b word boundaries.
var re_str = "\\b"+ phrase +"\\b";
// Create a new regex object with "g" and "i" flags set.
var re = new RegExp(re_str, "gi");
return re;
}
// Here is a condensed version of same function.
function makeRegExpShort(phrase) {
return new RegExp("\\b"+ phrase.replace(/\\/g, "\\\\") +"\\b", "gi");
}

为了更深入地理解这一点,下面是一个讨论...

深入讨论,或“所有这些反斜杠是怎么回事!?”

JavaScript有两种创建RegExp对象的方法:
  • /pattern/flags -您可以直接指定RegExp Literal表达式,其中使用一对正斜杠对模式进行定界,后跟三个模式修饰符标志的任意组合:即'g'全局,'i'忽略大小写或'm'多行。这种类型的正则表达式不能动态创建。
  • 新的RegExp(“pattern”,“flags”)-您可以通过调用RegExp()构造函数来创建RegExp对象,并将该模式​​作为字符串(不带正斜杠定界符)作为第一个参数和可选的模式修饰符标志进行传递(也作为字符串)作为第二个(可选)参数。这种类型的正则表达式可以动态创建。

  • 下面的示例演示使用这两种方法创建一个简单的RegExp对象。假设我们希望匹配单词 "apple"。我们需要的正则表达式模式很简单: apple。另外,我们希望设置所有三个修饰符标志。

    示例1:没有特殊字符的简单模式: apple
    // A RegExp literal to match "apple" with all three flags set:
    var re1 = /apple/gim;

    // Create the same object using RegExp() constructor:
    var re2 = new RegExp("apple", "gim");

    很简单。但是,在转义字符的处理方面,这两种方法之间存在显着差异。 regex文字语法非常方便,因为您只需要转义正斜杠-所有其他字符将不更改直接传递给regex引擎。但是,在使用RegExp构造函数方法时,您将模式作为字符串传递,并且需要考虑两个转义级别:首先是字符串的解释,其次是正则表达式引擎的解释。几个例子将说明这些差异。

    首先让我们考虑一个包含单个文字正斜杠的模式。假设我们希望以不区分大小写的方式匹配文本序列: "and/or"。所需的模式是: and/or

    示例2:具有一个正斜杠的模式: and/or
    // A RegExp literal to match "and/or":
    var re3 = /and\/or/i;

    // Create the same object using RegExp() :
    var re4 = new RegExp("and/or", "i");

    请注意,使用regex文字语法时,必须转义正斜杠(以单个反斜杠开头),因为使用regex文字,正斜杠具有特殊含义(这是一个特殊的元字符,用于分隔模式)。另一方面,使用RegExp构造函数语法(使用字符串存储模式),正斜杠没有任何特殊含义,也不需要转义。

    接下来让我们考虑一种模式,该模式包括一个特殊的: \b单词边界正则表达式元序列。假设我们希望创建一个正则表达式来将单词 "apple"仅作为一个整体匹配(这样它就不会匹配 "pineapple")。模式(由正则表达式引擎看到)需要为: \bapple\b:

    示例3:具有 \b单词边界的模式: \bapple\b
    // A RegExp literal to match the whole word "apple":
    var re5 = /\bapple\b/;

    // Create the same object using RegExp() constructor:
    var re6 = new RegExp("\\bapple\\b");

    在这种情况下,使用RegExp构造函数方法时必须转义反斜杠,因为该模式存储在字符串中,并且要将字面反斜杠转换为字符串,必须将其与另一个反斜杠一起转义。但是,使用正则表达式文字,无需转义反斜杠。 (请记住,使用正则表达式文字,唯一的特殊元字符是正斜杠。)

    反斜杠汤!

    当我们需要匹配文字反斜杠时,事情变得更加有趣。假设我们要匹配文本序列: "C:\Program Files\JGsoft\RegexBuddy3\RegexBuddy.exe"。正则表达式引擎要处理的模式需要为: C:\\Program Files\\JGsoft\\RegexBuddy3\\RegexBuddy\.exe。 (请注意,与单个反斜杠匹配的正则表达式模式为 \\,即每个均必须转义。)这是使用两种JavaScript语法创建所需的RegExp对象的方式

    示例4:匹配文字反斜杠的模式:
    // A RegExp literal to match the ultimate Windows regex debugger app:
    var re7 = /C:\\Program Files\\JGsoft\\RegexBuddy3\\RegexBuddy\.exe/;

    // Create the same object using RegExp() constructor:
    var re8 = new RegExp(
    "C:\\\\Program Files\\\\JGsoft\\\\RegexBuddy3\\\\RegexBuddy\\.exe");

    这就是为什么 /regex literal/语法通常比 new RegExp("pattern", "flags")方法更受青睐的原因-它完全避免了可能经常出现的反斜杠。但是,当您需要动态创建一个正则表达式时(如OP所需要的那样),您将不得不使用 new RegExp()语法并处理反斜杠。 (一旦把头缠好,它的确不是那么糟糕。)

    RegexBuddy的营救!

    RegexBuddy是一个Windows应用程序,可以解决此反斜杠汤问题-它了解正则表达式的语法和多种语言的转义要求,并且在粘贴到应用程序和从应用程序粘贴时会根据需要自动添加和删除反斜杠。在应用程序内部,您以 native 正则表达式格式编写和调试正则表达式。一旦正则表达式正常工作,就可以使用许多“复制为...”选项之一将其导出,以获取所需的语法。非常便利!

    关于javascript - 从JS变量构建正则表达式不起作用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6802601/

    24 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com