c++ - 将 Perl 正则表达式转换为等效的 ECMAScript 正则表达式-6ren

c++ - 将 Perl 正则表达式转换为等效的 ECMAScript 正则表达式

转载作者：IT王子更新时间：2023-10-29 01:22:51

28

4

现在我使用的是 VC++ 2010，但是 VC++ 2010 的 syntax_option_type 只包含以下选项:

static const flag_type icase = regex_constants::icase;
static const flag_type nosubs = regex_constants::nosubs;
static const flag_type optimize = regex_constants::optimize;
static const flag_type collate = regex_constants::collate;
static const flag_type ECMAScript = regex_constants::ECMAScript;
static const flag_type basic = regex_constants::basic;
static const flag_type extended = regex_constants::extended;
static const flag_type awk = regex_constants::awk;
static const flag_type grep = regex_constants::grep;
static const flag_type egrep = regex_constants::egrep;

它不包含 perl_syntax_group(Boost 库有选项)。 但是，我不想使用 Boost 库。

有很多用 Perl 编写的正则表达式，所以我想将现有的 Perl 正则表达式转换为 ECMAScript(或 VC++ 2010 支持的任何一个)。转换后，我可以直接在 VC++ 2010 中使用等效的正则表达式，而无需使用第三方库。

一个例子:

const boost::tregex e(__T("\\A(\\d{3,4})[- ]?(\\d{4})[- ]?(\\d{4})[- ]?(\\d{4})\\z"));
const CString human_format = __T("$1-$2-$3-$4");
CString human_readable_card_number(const CString& s)
{
   return boost::regex_replace(s, e, human_format);
}
CString credit_card_number = "1234567887654321";
credit_card_number = human_readable_card_number(credit_card_number);
assert(credit_card_number == "1234-5678-8765-4321");

在上面的例子中，我想要做的是将 e 和 format 转换为 ECMAScript 样式表达式。

是否可以找到将所有 Perl 正则表达式转换为 ECMAScript 样式的通用方法？
有没有一些工具可以做到这一点？

任何帮助将不胜感激!

最佳答案

对于要转换的特定正则表达式，ECMA 正则表达式中的等效项是:

/^(\d{3,4})[- ]?(\d{4})[- ]?(\d{4})[- ]?(\d{4})$/

在这种情况下， \A (在 Perl 正则表达式中)与 ^ 具有相同的含义(在 ECMA 正则表达式中)(匹配字符串的开头)和 \Z (在 Perl 正则表达式中)与 $ 具有相同的含义(在 ECMA 正则表达式中)(匹配字符串的结尾)。注意 ^的含义和 $如果启用多行模式，ECMA 正则表达式将更改为匹配行的开头和结尾。

ECMA regex 是 Perl regex 的子集，因此如果 regex 使用 Perl regex 中的专有功能，它很可能无法转换为 ECMA regex。即使对于相同的语法，正则表达式的两种方言之间的语法也可能略有不同，因此检查文档并比较用法总是明智的。

我只想说 ECMA regex 和 Perl regex 之间的相似之处。什么不相似，但可以转换，我会尽量提一下。

ECMA 正则表达式缺乏与 Unicode 一起使用的功能，这迫使您查找代码点并将它们指定为字符类。

按照 documentation for Perl regular expression :

修饰符:

只有 i , g , m在 ECMA 标准中，它们的行为与在 Perl 中相同。

s可以通过使用 2 个补充字符类在 ECMA 正则表达式中模拟点全修饰符，例如[\S\s] , [\D\d]

不支持 x和 p旗帜。

不知道有没有办法模拟其余的(前缀和后缀修饰符)。

元字符:

我对使用 \ 有点怀疑具有不解析为任何特殊含义的非元字符，但是如果您不从不需要的地方逃生应该没问题。 .在 ECMA 中排除了更多字符。其余的在 ECMA 正则表达式中的行为相同(即使 m 标志对 ^ 和 $ 的影响)。

量词:

Greedy 和 Lazy 行为应该是一样的。 ECMA 正则表达式中没有占有行为。

转义序列:

没有 \a和 \e在 ECMA 正则表达式中。 \t , \n , \r , \f是相同的。

如果正则表达式有 \cX，请检查文档- 存在差异。

\xhh在 ECMA regex 和 Perl regex 中很常见(指定 2 个十六进制数字是最安全的 - 否则，您将不得不查找文档以了解该语言将如何处理少于 2 个十六进制数字的情况)。

\uhhhh是 ECMA 正则表达式独有的功能，用于指定 Unicode 字符。 Perl 有其他独有的方式来指定字符，例如 \x{} , \N{} , \o{} , \000 .

\l , \u , \L , \U是 Perl 正则表达式独有的。

\Q和 \E可以通过手动转义引用的部分来模拟。

Perl 正则表达式中的八进制转义(少于 3 个八进制数字)可能会令人困惑。仔细检查上下文，阅读文档和/或测试正则表达式以确保您了解它在上下文中的作用，因为它可能是转义序列或反向引用。

字符类和其他特殊转义:

\w , \W , \s , \S , \d , \D如果假设为 US-ASCII，则在 ECMA 正则表达式和 Perl 正则表达式中是等效的。如果涉及到 Unicode，事情将变得一团糟。

ECMA 正则表达式中没有 POSIX 字符类。使用上面的\w , \s , \d或在字符类中指定自己。

反向引用大致相同 - 但我不知道它是否允许 Perl 和 ECMA 正则表达式的反向引用超过 9。

命名引用可以用反向引用来模拟。

其余的(除了 [] 和已经提到的转义序列)在 ECMA 正则表达式中不受支持。

断言:

\b和 \B关于如何基于 \w 定义它们在两种语言中是等效的.

捕获组:分组 ()和反向引用是一样的。 $n ，在替换字符串中用于反向引用匹配的文本，是相同的。本节中的其余部分是 Perl 独有的功能。

引用元字符:(前几节已经提到的内容)。

扩展模式:

ECMA 正则表达式不支持在正则表达式中修改标志。根据标志是什么，您可以重写正则表达式( s 标志是一种始终可以转换为 ECMA 正则表达式中的等效表达式的标志)。

只有 (?:pattern) (非捕获组)，(?=pattern) (正面展望)，(?!pattern) (负面展望)在 Perl 和 ECMA 之间很常见。

ECMA 正则表达式中没有注释，所以 (?#text)可以忽略。

ECMA 正则表达式不支持后视。 Perl 支持固定宽度的后视。在某些情况下，通过将后视设置为捕获组，可以将用 Perl 编写的正面后视正则表达式转换为 ECMA 正则表达式。

如前所述，命名模式可以转换为普通捕获组，并且可以使用编号回溯引用进行引用。

其余的是 Perl 独有的功能。

特殊回溯控制动词:这是 Perl 独有的，我不知道它们的作用(以前从未接触过它们)，更不用说转换了。最有可能的情况是它们无论如何都不能转换。

结论 :

如果正则表达式充分利用了 Perl 正则表达式的全部功能，或者在 Boost 库支持的级别(例如递归正则表达式)，则无法将正则表达式转换为 ECMA 正则表达式。幸运的是，ECMA 正则表达式涵盖了最常用的功能，因此正则表达式很可能是可转换的。

引用 :

ECMA RegExp Reference on MDN

关于c++ - 将 Perl 正则表达式转换为等效的 ECMAScript 正则表达式，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/12127463/

28

4

0

文章推荐： linux - Beaglebone 中的中断

文章推荐： php - 验证输入是否采用此时间格式 - "HH:MM"

c++ - 将迭代器存储到字符串中(转换、转换、追加？)
我正在尝试将一个字符串逐个字符地复制到另一个字符串中。目的不是复制整个字符串，而是复制其中的一部分(我稍后会为此做一些条件......) 但我不知道如何使用迭代器。你能帮帮我吗？ std::stri
C++:转换/转换 void 指针到结构引用
我想将 void 指针转换为结构引用。结构的最小示例: #include "Interface.h" class Foo { public: Foo() : mAddress((uint
javascript - 为什么一个元素从窗口的左上角开始它的 css3 转换/转换？
这有点烦人:我有一个 div，它从窗口的左上角开始过渡，即使它位于文档的其他任何位置。我试过 usign -webkit-transform-origin 但没有成功，也许我用错了。有人可以帮助我吗？
html - 有什么方法可以检测 CSS3 转换/转换/动画的过程状态？
假设，如果将 CSS3 转换/转换/动画分配给 DOM 元素，我是否可以检测到该过程的状态？我想这样做的原因是因为我正在寻找类似过渡链的东西，例如，在前一个过渡之后运行一个过渡。最佳答案我在 h
CSS 转换/转换 - 谷歌浏览器中的 "shaky"图像
最近我遇到了“不稳定”屏幕，这很可能是由 CSS 转换引起的。事实上，它只发生在 Chrome 浏览器上(可能还有 Safari，因为一些人也报告了它)。知道如何让它看起来光滑吗？此外，您可能会注意
jquery - CSS3 转换(转换)在 Firefox 中不起作用，但在 Chrome 和 Safari 中起作用
我正在开发一个简单的 slider ，它使用 CSS 过渡来为幻灯片设置动画。我用一些基本样式和一些 javascript 创建了一支笔 here .注意:由于 Codepen 使用 Prefixfr
Linq 转换
我正在使用以下代码返回 IList: public IList FindCodesByCountry(string country) { var query =
转换、计算的RESTful设计
如何设计像这样的操作: 计算转化翻译例如:从“EUR”转换为“CNY”金额“100”。这是 /convert?from=EUR&to=CNY&amount=100 RESTful 吗？最佳答
Jquery 转换
我使用 jquery 组合了一个图像滚动器，如下所示 function rotateImages(whichHolder, start) { var images = $('#' +which
CSS 转换
如何使用 CSS (-moz-transform) 更改一个如下所示的 div: 最佳答案你可以看看Mozilla Developer Center .甚至还有例子。但是，在我看来，您的具体示例不
CSS 转换
我需要帮助我正在尝试在选中和未选中的汉堡菜单上实现动画。我能够为菜单设置动画，但我不知道如何在转换为 0 时为左菜单动画设置动画 &__menu { transform: translateX(
swift :转换
我正在为字典格式之间的转换而苦苦挣扎:我正在尝试将下面的项目数组转换为下面的结果数组。本质上是通过在项目第一个元素中查找重复项，然后仅在第一个参数不同时才将文件添加到结果集中。 var items:[
具有相同布局的不同类型之间的C++转换
如果我有两个定义相同的结构，那么在它们之间进行转换的最佳方式是什么？ struct A { int i; float f; }; struct B { int i; float f; }; void
Javascript 转换
我编写了一个 javascript 代码，可以将视口(viewport)从一个链接滑动到另一个链接。基本上一切正常，你怎么能在那里看到http://jsfiddle.net/DruwJ/8/ 我现在的
meteorjs 图像上传/转换
我需要将文件上传到 meteor ，对其进行一些图像处理(必要时进行图像转换，从图像生成缩略图)，然后将其存储在外部图像存储服务器(s3)中。这应该尽可能快。您对 nodejs 图像处理库有什么建议
KDB+，转换，左操作数
刚开始接触KDB+，有一些问题很难从Q for Mortals中得到。说，这里 http://code.kx.com/wiki/JB:QforMortals2/casting_and_enumera
JSF float 转换
我在这里的一个项目中使用 JSF 1.2 和 IceFaces 1.8。我有一个页面，它基本上是一大堆浮点数字段的大编辑网格。这是通过 inputText 实现的页面上的字段指向具有原始值的值对象
SceneKit 转换 ScnMatrix4
ScnMatrix4 是一个 4x4 矩阵。我的问题是什么矩阵行对应于位置(ScnVector3)，旋转(ScnVector4)，比例(ScnVector3)。第 4 行是空的吗？编辑: 我玩弄了
Scala map 转换
恐怕我是 Scala 新手: 我正在尝试根据一些简单的逻辑将 Map 转换为新 Map: val postVals = Map("test" -> "testing1", "test2" -> "te
基于配置文件的 XSLT 转换
输入: This is sample 1 This is sample 2 输出: ~COLOR~[Green]This is sample 1~COLOR~[Red]This is sam

首页

博学

6Ren·AI

商城

c++ - 将 Perl 正则表达式转换为等效的 ECMAScript 正则表达式