javascript - 正则表达式 : Using a negative look ahead for the nonsupported negative look behind and capturing the look behind characters upon split-6ren

javascript - 正则表达式 : Using a negative look ahead for the nonsupported negative look behind and capturing the look behind characters upon split

转载作者：行者123 更新时间：2023-11-29 10:56:43

30

4

我又在与正则表达式作斗争了。我一直在尝试添加使用转义字符来转义自定义标记，例如 <1>至 <57>和 </1>至 </57> .在乔治的帮助下，here , 在尝试转义方法之前，以下表达式会产生所需的结果。

('This is a <21>test</21> again.').split(/(<\/?(?:[1-9]|[1-4][0-9]|5[0-7])>)/);

生成 'This is a ', '<21>', 'test', '</21>', ' again.'

This问题有一个建议，即使用负面展望和 OR 来近似不受支持的负面展望。我针对我认为更简单的问题修改了该示例；然而，我又被难住了。

('This is a <21>test</21> again.').split(/(?:(?!\\).|^)(<\/?(?:[1-9]|[1-4][0-9]|5[0-7])>)/) );

生成 'This is a', '<21>', 'tes', '</21>', ' again.'因此，它不包括 <21> 之前的字符或 </21>当不是 \ .我明白了为什么使用了 ?:对于非捕获。

但是，如果它被移除，那么:

('This is a <21>test</21> again.').split(/((?!\\).|^)(<\/?(?:[1-9]|[1-4][0-9]|5[0-7])>)/) );

生成 'This is a', ' ', '<21>', 'tes', 't', '</21>', ' again.'并且前一个字符生成一个单独的拆分。

除了这个问题，当前一个字符是 \ 时，转义会起作用。该标记不会生成字符串的拆分。

能否请您告诉我是否有办法捕获前一个字符，但将其包含在前一个字符串的文本中而不是它自己的拆分？并且可能仅在 \ 时排除它？

当字符串为'This is a <21>test</21> again.'时，期望的结果是 'This is a ', '<21>', 'test', '</21>', ' again.'

当它是 'This is a \<21>test</21> again.' 时，期望的结果是 'This is a <21>', 'test', '</21>', ' again.'

谢谢。

添加在最近学习了如何在 replace 中使用内联函数作为参数之后在 this 处使用正则表达式进行操作MDN 文档，我开始怀疑是否可以在这里做类似的事情。我对衡量性能一无所知，但下面 Revo 提供的正则表达式的复杂性以及他对我关于效率的评论的回答指出，消极的看法会显着提高效率并减少 RegExp 引擎的工作量，并且此外，RegExp 对我来说是一个幕后的黑匣子之谜，这促使我尝试另一种方法。这是几行代码，但产生相同的结果并使用更短的正则表达式。它真正做的是匹配带有和不带有转义字符的标签，而不是试图排除那些使用 \ 转义的标签。，然后在构建数组时忽略带有转义字符的那些。下面的片段。

我不知道控制台日志中提供的时间是否表示性能'，但如果是这样，在我运行的示例中，日志记录 start 之间的时间差异似乎是和 a.split比 a.split 之间的百分比长得多和数组的最终记录 a在exec下方法。

另外，最里面if while 内的 block 声明是为了防止""当标签位于字符串的开头或结尾，或者两个标签之间没有空格时，不会被保存在数组中。

如果您能提供关于为什么或为什么不使用一种方法而不是另一种方法的任何见解，或者在无法访问真正的负面观察背后的情况下引入更好的方法，我将不胜感激。谢谢。

let a, i = 0, l, p, r,
    x = /\\?<\/?(?:[1-9]|[1-4]\d|5[0-7])>/g,
    T = '<1>This is a <21>test<21> of \\<22>escaped and \\> </ unescaped tags.<5>';

console.log('start');

a = T.split(/((?:[^<\\]+|\\+.?|<(?!\/?(?:[1-9]|[1-4]\d|5[0-7])>))+|<\/?(?:[1-9]|[1-4]\d|5[0-7])>)/).filter(Boolean);

      console.log(a);
      a=[];
      while ( ( r = x.exec( T ) ) !== null) {
        if ( r[0].charAt(0) !== '\\' )
          {
             if ( r.index === 0 || r.index === p )
               {
                 a[ i ] = r[0];
                 i = i + 1;
               }
             else 
               {
                 a[ i ] = T.substring( p, r.index );
                 a[ i + 1 ] = r[0];
                 i = i + 2;
               }; // end if
             p = x.lastIndex;
          }; // end if
      }; // next while

      if ( p !== T.length ) a[i] = T.substring( p );
      console.log(a)

最佳答案

您正在拆分所需的子字符串并使用捕获组将它们输出。这也可能发生在不需要的子字符串上。您匹配它们并将它们包含在捕获组中以将它们输出。正则表达式为:

(undesired-part|desired-part)

不需要的子字符串的正则表达式应该放在第一位，因为可以在其中找到所需的子字符串，即 <21>包含在 \<21> 中所以我们应该更早匹配后者。

您写下了我们想要的部分:

(undesired-part|<\/?(?:[1-9]|[1-4]\d|5[0-7])>)

那么不受欢迎的呢？在这里:

(?:[^<\\]+|\\.?|<(?!\/?(?:[1-9]|[1-4]\d|5[0-7])>))+

让我们分解一下:

(?:非捕获组的开始
- [^<\\]+匹配除 < 以外的任何内容和 \
- |或者
- \\.?匹配转义字符
- |或者
- <(?!\/?(?:[1-9]|[1-4]\d|5[0-7])>)匹配<这是不希望的
)+ NCG 结束，尽可能重复，至少重复一次

总体来说是:

((?:[^<\\]+|\\.?|<(?!\/?(?:[1-9]|[1-4]\d|5[0-7])>))+|<\/?(?:[1-9]|[1-4]\d|5[0-7])>)

JS代码:

console.log(
  'This is a \\<21>test</21> ag<ain\\.'.split(/((?:[^<\\]+|\\.?|<(?!\/?(?:[1-9]|[1-4]\d|5[0-7])>))+|<\/?(?:[1-9]|[1-4]\d|5[0-7])>)/).filter(Boolean)
);

关于javascript - 正则表达式 : Using a negative look ahead for the nonsupported negative look behind and capturing the look behind characters upon split，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55662413/

30

4

0

文章推荐： php - php 的开关功能

文章推荐： javascript - FeathersJS:在钩子(Hook)内创建记录

文章推荐： javascript - 如何从html表格中的选择框获取值

MySQL相似表的索引使用不一致: 'Using index' and 'Using where; Using index'
我在优化 JOIN 以使用复合索引时遇到问题。我的查询是: SELECT p1.id, p1.category_id, p1.tag_id, i.rating FROM products p1
sql - 优化查询以删除 "Using where; Using temporary; Using filesort"
我有一个简单的 SQL 查询，我正在尝试对其进行优化以删除“使用位置；使用临时；使用文件排序”。这是表格: CREATE TABLE `special_offers` ( `so_id` int
mysql - EXPLAIN 语句说 'Using where; Using index' 如果在查询中设置了 USE INDEX() 否则就说 'Using where'
我有一个具有以下结构的应用程序表 app_id VARCHAR(32) NOT NULL, dormant VARCHAR(6) NOT NULL, user_id INT(10) NOT NULL
mysql - Extra :-Using where; Using temporary; Using filesort如何优化MYSQL
此查询的正确索引是什么。我尝试为此查询提供不同的索引组合，但它仍在使用临时文件、文件排序等。总表数据 - 7,60,346 产品= '连衣裙' - 总行数 = 122 554 CREATE TAB
mysql - 为什么额外的是 "using where;using index"而不是 "using index"
为什么额外的是“使用where;使用索引”而不是“使用索引”。 CREATE TABLE `pre_count` ( `count_id`
按日期排序时，MySQL 数据库使用 "Using where; Using temporary; Using filesort"
我有一个包含大量记录的数据库，当我使用以下 SQL 加载页面时，速度非常慢。 SELECT goal.title, max(updates.date_updated) as update_sort F
MySQL - 'Using index condition' 与 'Using where; Using index'
我想知道 Using index condition 和 Using where 之间的区别；使用索引。我认为这两种方法都使用索引来获取第一个结果记录集，并使用 WHERE 条件进行过滤。 Q1。有什
Cannot setup TypeScript to use `using` keyword(无法将TypeScript设置为使用“using”关键字)
I am using TypeScript 5.2 version, I have following setup:我使用的是TypeScript 5.2版本，我有以下设置： { "
Cannot setup TypeScript to use `using` keyword(无法将TypeScript设置为使用“using”关键字)
I am using TypeScript 5.2 version, I have following setup:我使用的是TypeScript 5.2版本，我有以下设置： { "
Cannot setup TypeScript to use `using` keyword(无法将TypeScript设置为使用“using”关键字)
I am using TypeScript 5.2 version, I have following setup:我使用的是TypeScript 5.2版本，我有以下设置： { "
mysql - 如何避免MySQL中的 "Using index; Using temporary; Using filesort "，21表JOIN
mysql Ver 14.14 Distrib 5.1.58，用于使用 readline 5.1 的 redhat-linux-gnu (x86_64) 我正在接手一个旧项目。我被要求加快速度。我通过
mysql - OrmLite(服务堆栈): Only use temporary db-connections (use 'using' ?)
在过去 10 多年左右的时间里，我一直打开数据库 (mysql) 的连接并保持打开状态，直到应用程序关闭。所有查询都在连接上执行。现在，当我在 Servicestack 网页上看到示例时，我总是看到
sql - 优化 MySQL 查询以避免 "Using where; Using temporary; Using filesort"
我使用 MySQL 为我的站点构建了一个自定义论坛。列表页面本质上是一个包含以下列的表格:主题、上次更新和# Replies。数据库表有以下列: id name body date topic_id
mysql - EXPLAIN中的 "Using index"和 "Using where; Using index"有什么区别
在mysql中解释的额外字段中你可以得到: 使用索引使用where;使用索引两者有什么区别？为了更好地解释我的问题，我将使用下表: CREATE TABLE `test` ( `id` bi
using - Haxe中的 `using`关键字是什么？
我经常看到人们在其Haxe代码中使用关键字using。它似乎在import语句之后。例如，我发现这是一个代码片段: import haxe.macro.Context; import haxe.ma
克洛尤尔 : how do I use use "and" in "reduce"?
这个问题在这里已经有了答案: "reduce" or "apply" using logical functions in Clojure (2 个答案) 关闭 8 年前。 “and”似乎是一个宏，
克洛尤尔 : how do I use use "and" in "reduce"?
这个问题在这里已经有了答案: "reduce" or "apply" using logical functions in Clojure (2 个答案) 关闭 8 年前。 “and”似乎是一个宏，
c++ - 注册表模式 : to use or not to use
我正在考虑在我的应用程序中使用注册表模式来存储指向某些应用程序窗口和 Pane 的弱指针。应用程序的一般结构如下所示。该应用程序有一个 MainFrame 顶层窗口，其中有几个子 Pane 。可以有
When to use == and when to use is?(什么时候使用==，什么时候使用IS？)
奇怪的是：。似乎a是b或多或少被定义为id(A)==id(B)。用这种方式制造错误很容易：。有些名字出人意料地出现在Else块中。解决方法很简单，我们应该使用ext==‘.mp3’，但是如果ext表面
mysql - 优化 'GROUP BY'-查询，消除 'Using where; Using temporary; Using filesort'
我遇到了一个我似乎无法解决的 MySQL 问题。为了能够快速执行用于报告目的的 GROUP BY 查询，我已经将几个表非规范化为以下内容(该表由其他表上的触发器维护，我已经同意了与此): DROP T

首页

博学

6Ren·AI

商城

javascript - 正则表达式 : Using a negative look ahead for the nonsupported negative look behind and capturing the look behind characters upon split