正则表达式捕获 VBA 注释-6ren

正则表达式捕获 VBA 注释

转载作者：行者123 更新时间：2023-12-05 01:04:59

32

4

我正在 try catch VBA 注释。到目前为止，我有以下内容

'[^";]+\Z

它捕获以单引号开头但在字符串结尾之前不包含任何双引号的任何内容。即它不会匹配双引号字符串中的单引号。

dim s as string        ' a string variable   -- works
s = "the cat's hat"    ' quote within string -- works

但如果注释包含双引号字符串则失败

IE。

dim s as string ' string should be set to "ten"

我该如何修复我的正则表达式来处理这个问题？

最佳答案

@Jeff Wurz's comment中的图案( ^\'[^\r\n]+$|''[^\r\n]+$ ) 甚至不匹配您的任何测试样本，并且链接的问题没有用，那里的正则表达式只会匹配 OP 问题中的特定注释，而不是“VBA 注释语法”。

你提出的正则表达式比我放弃正则表达式方法时的效果更好。

做得好!

问题是您无法使用正则表达式解析 VBA 注释。

在 Lexers vs Parsers , @SasQ's answer在解释乔姆斯基的语法水平方面做得很好:

Level 3: Regular grammars

They use regular expressions, that is, they can consist only of the symbols of alphabet (a,b), their concatenations (ab,aba,bbb etd.), or alternatives (e.g. a|b). They can be implemented as finite state automata (FSA), like NFA (Nondeterministic Finite Automaton) or better DFA (Deterministic Finite Automaton). Regular grammars can't handle with nested syntax, e.g. properly nested/matched parentheses (()()(()())), nested HTML/BBcode tags, nested blocks etc. It's because state automata to deal with it should have to have infinitely many states to handle infinitely many nesting levels.

Level 2: Context-free grammars

They can have nested, recursive, self-similar branches in their syntax trees, so they can handle with nested structures well. They can be implemented as state automaton with stack. This stack is used to represent the nesting level of the syntax. In practice, they're usually implemented as a top-down, recursive-descent parser which uses machine's procedure call stack to track the nesting level, and use recursively called procedures/functions for every non-terminal symbol in their syntax. But they can't handle with a context-sensitive syntax. E.g. when you have an expression x+3 and in one context this x could be a name of a variable, and in other context it could be a name of a function etc.

Level 1: Context-sensitive grammars

正则表达式根本不是解决这个问题的合适工具，因为每当有多个单引号(/撇号)，或者当涉及双引号时，你需要弄清楚代码行中最左边的撇号是否是在双引号内，如果是，那么您需要匹配双引号并在结束双引号之后找到最左边的撇号 - 实际上，不属于字符串文字的最左边的撇号是您的注释标记。

我的理解是 VBA 注释语法是上下文相关的语法(级别 1)，因为撇号只是您的标记，如果它不是字符串文字的一部分，并且要弄清楚撇号是否是字符串文字的一部分，最简单可能是从左到右走你的弦并切换一些 IsInsideQuote遇到双引号时标记......但前提是它们没有被转义(加倍)。实际上，您甚至不会检查字符串字面量中是否有撇号:您只需一直走，直到打开的引号关闭，并且仅当“引号内标志”为 False 时如果您遇到单引号，您会找到一个注释标记。

祝你好运!

这是您缺少的测试用例:

s = "abc'def ""xyz""'nutz!" 'string with apostrophes and escaped double quotes

如果您不关心捕获字符串文字，您可以简单地忽略转义的双引号并在此处查看 3 个字符串文字: "abc'def " , "xyz"和 "'nutz!" .

此 C# 代码输出 'string with apostrophes and escaped double quotes (所有字符串内双引号都在代码中用反斜杠转义)，并适用于我给它的所有测试字符串:

    static void Main(string[] args)
    {
        var instruction = "s = \"abc'def \"\"xyz\"\"'nutz!\" 'string with apostrophes and escaped double quotes";
        // var instruction = "s = \"the cat's hat\"    ' quote within string -- works";
        // var instruction = "dim s as string ' string should be set to \"ten\"";

        int? commentStart = null;

        var isInsideQuotes = false;
        for (var i = 0; i < instruction.Length; i++)
        {
            if (instruction[i] == '"')
            {
                isInsideQuotes = !isInsideQuotes;
            }

            if (!isInsideQuotes && instruction[i] == '\'')
            {
                commentStart = i;
                break;
            }
        }

        if (commentStart.HasValue)
        {
            Console.WriteLine(instruction.Substring(commentStart.Value));
        }

        Console.ReadLine();
    }

那么如果你想捕获所有的法律评论，你需要处理遗留 Rem关键字，并考虑行延续:

Rem this is a legal comment
' this _
    is also _
    a legal comment

换句话说， \r\n本身不足以正确识别所有语句结束标记。

适当的词法分析器+解析器似乎是捕获所有评论的唯一方法。

关于正则表达式捕获 VBA 注释，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/22044801/

32

4

0

文章推荐： RubyMine 在编辑器中无法识别使用 bundler 安装的 gem

java - 几个 "ChildException"捕获 block 与一个 "Exception"捕获 block
多个 ChildException catch block 和一个 Exception catch block 之间哪个更好？更好，我的意思是以良好的实践方式。举例说明: public stati
通过测试连接进行Powershell尝试/捕获
我正在尝试将脱机计算机记录在文本文件中，以便以后可以再次运行它们。似乎没有被记录或捕获。 function Get-ComputerNameChange { [CmdletBinding()]
scala - 拦截与尝试/捕获
我正在将 Scala 'try/catch' 测试代码转换为使用 'intercept' 有没有我不应该使用“拦截”的场景？使用 'intercept' 而不是 'try/catch' 的唯一好处是简
erlang - 如何在Erlang中进行尝试/捕获
我对erlang很陌生，我正在尝试使用基本的try/catch语句来工作。我正在使用Webmachine处理一些请求，我真正想做的就是解析一些JSON数据并将其返回。如果JSON数据无效，我只想返回一
delphi - 捕获 'delete'按键
我不知道如何捕获删除按键。我发现在 ASCII 代码表中，它位于 127 位，但是 if (Key = #127) then 却无济于事。然后我检查了 VK_DELETE 的值，它是 47。尝试使用
php - 对所有PDO查询进行一次全局尝试{}捕获{}
我很少在失败时对数据库查询使用唯一的错误消息我经常使用简短的标准消息，例如“数据库错误/失败。请与网站管理员联系”或类似的消息。或自动发送给我我正在寻找一种在PDO中全局设置一次try {}和ca
Java : CompletableFuture 捕获
我有一个变量CompletableFuture completableFuture 。我希望能够使用任何类型的对象来完成它。例如:completableFuture.complete(new Stri
Java 捕获 IOException
我认为这是基本的东西，但我不知道该怎么做。为什么我得到 IOException never throw in body of相应的 try 语句 public static void main(Str
java - 捕获 JSONException
我在此代码中遇到 JSON 异常: JSONObject jObject = new JSONObject(JSONString); pontosUsuario.setIdUsuari
单引号之间的 Perl 捕获
我正在尝试打印出用单引号括起来的文本。 /bin/bash -lc '/home/CASPER_REPORTS/scripts/CASPER_gen_report.sh CASPER_1' /bin/
java - 捕获 IllegalArgumentException？
我这里遇到了一点问题。我想弄清楚如何捕获 IllegalArgumentException。对于我的程序，如果用户输入负整数，程序应该捕获 IllegalArgumentException 并询问用户
java - 捕获 EJBTransactionRolledbackException
我无法理解 EJBTransactionRolledbackException。我有实体: @Entity public class MyEntity { @Id @Generate
.net - 实时网络使用统计监控/捕获？
对于我给自己提出的以下挑战，如果社区的经验给我任何建议，我将不胜感激 - 即，这里有任何关于最佳方法/方向的指示吗？要求允许收集/实时监控从用户 Windows PC 到一组特定 IP 地址(或
exception - 捕获 SAPSQL_DATA_LOSS
我想在我的 ABAP 代码中捕获并处理 SAPSQL_DATA_LOSS。我试过这个: try. SELECT * FROM (rtab_name) AS rtab
java - 捕获 UnsatisfiedLinkError
我知道捕获错误不是一个好的做法，但在这种情况下，这样做很重要。我正在尝试运行一个包含游戏一部分的 jar，但它给了我一个 unsatisfiedlink 错误，但这是有趣的部分:我正在使用这段代码:
java - 捕获 GenericJDBCException
我有一个表单页面，当我保存它时，它会覆盖数据库。表单页面中有一个文本框，允许用户输入 4000 个字符，但如果用户输入的字符超过此值，则会出现以下错误: ERROR 15:54:05 Abstrac
Python键绑定(bind)/捕获
我想知道在python中绑定(bind)键的最简单方法例如，默认的 python 控制台窗口出现并等待，然后在 psuedo -> if key "Y" is pressed: print (
java - 捕获 NumberFormatException
下面是别人写的类。我面临的问题是，当它进入parse method时与 null as the rawString ，它正在扔NumberFormatException 。所以我想做的是，我应该捕
jquery - 捕获/拦截所有鼠标点击
我有一个简单的脚本，可以捕获所有鼠标单击，除非您单击实际有效的内容。链接、Flash 视频等。我如何调整它，以便无论用户点击什么，在视频加载、新页面加载等之前，它都会发送我构建的简单 GET 请求？
当选择列表值更改而没有更改事件时，Jquery 捕获
我有一个带有一些选择列表的表单，当选择某些值时，这些列表将显示/隐藏更多输入字段。问题是大多数用户都是数据输入人员，因此他们在输入数据时大量使用键盘，并且选择列表的 change 事件仅在焦点离开输

首页

博学

6Ren·AI

商城

正则表达式捕获 VBA 注释