- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我想匹配一个字符串直到一个终端字符/序列,其中:
(',',':', '%%')
.(LF,CR)
也充当终止符,即使前面有转义字符。它们也不是匹配的一部分(但如果有的话,最后一个悬空逃逸是)。所以核心问题是:一些终止符序列被转义中和,而另一些则没有。
这些是一些示例字符串及其所需的匹配结果:字符序列将被视为原始的,但我正在使用 <newline>
对于 (LF,CR)
(即对于 U+000A, U+000D
中的原始换行符)
1: xxx\,aaa,bbb --> xxx\,aaa
2: xxx\\:aaa,bbb --> xxx\\
3: xxx\\\\\,aaa\::bbb --> xxx\\\\\,aaa\:
4: xxx%%aaa --> xxx
5: xxx\%%aaa --> xxx\%%aaa
6: xxx%\%bbb\ --> xxx%\%bbb\
7: xxx\,aaa<newline>bbb --> xxx\,aaa
8: xxx\,aaa\<newline>bbb --> xxx\,aaa\
9: x\xa\a\,bb\\,bb --> x\xa\a\,bb\\
按照 SO 上其他一些问题的风格,我设法做到了这一点:
pat = re.compile(r'.+?(?<!\\)(\\\\)*(?=[:,\n\r]|%%|$)', re.DOTALL|re.UNICODE)
但这并没有涵盖所有规则,它在转义换行符和转义字符串结尾方面存在问题。
编辑:反斜杠可以出现在任何字符之前而不会导致不匹配(参见示例 9),只是如果它出现在另一个反斜杠之前,它会抵消它作为转义字符的作用,如果它出现在某些终止符之前,它会抵消它们作为终止符的作用。
最佳答案
这真的很有挑战性。这是我的方法:
import re
l = ['xxx\\,aaa,bbb',
'xxx\\\\:aaa,bbb',
'xxx\\\\\\\\\\,aaa\\::bbb',
'xxx%%aaa',
'xxx\\%%aaa',
'xxx%\\%bbb\\',
'xxx\\,aaa\nbbb',
'xxx\\,aaa\nbbb',
r'x\xa\a\,bb\\,bb']
for s in l:
print('|||| {0} |||| --> {1}'.format(s, re.match(r'((?:(?:(?:\\\\)+|\\(?:,|:|%)|[^\\,:\n]|\\(?:[^\n]|$))(?<![^\\]%%))*)', s).group(0).rstrip('%')))
一些问题:
首先,我不明白你的第六弦。如何将单个反斜杠作为字符串的最后一个字符?这对我来说毫无意义。
其次,我发现很难在不转义任何一个的情况下检查双百分号。后视是无用的,因为我不知道会有多少个反斜杠,也不知道前视,因为它与它们之前的字符不匹配,所以我使用了一种解决方法,即与第一个匹配的后视对并用 rstrip()
删除它.那么它就不是一个纯粹的regex
(需要后期处理)但这是我的极限。
最重要部分的解释:
(?:\\\\)+
-- 推进每对反斜杠。\\(?:,|:|%)
-- 推进任何被转义的字符集。[^\\,:\n]
-- 一般规则,除了对这种情况有特殊意义的字符之外的任何字符。(?<![^\\]%%)
-- 当找到一对非转义的 %
时停止.\\(?:[^\n]|$)
-- 匹配后跟非特殊字符或 EOL 的反斜杠。我将原始字符串放在管道之间以记录换行符。可能它与您的示例中的所有可能性都不匹配,但我希望您能理解。前面的脚本产生:
|||| xxx\,aaa,bbb |||| --> xxx\,aaa
|||| xxx\\:aaa,bbb |||| --> xxx\\
|||| xxx\\\\\,aaa\::bbb |||| --> xxx\\\\\,aaa\:
|||| xxx%%aaa |||| --> xxx
|||| xxx\%%aaa |||| --> xxx\%%aaa
|||| xxx%\%bbb\ |||| --> xxx%\%bbb\
|||| xxx\,aaa
bbb |||| --> xxx\,aaa
|||| xxx\,aaa
bbb |||| --> xxx\,aaa
|||| x\xa\a\,bb\\,bb |||| --> x\xa\a\,bb\\
关于python - 匹配直到可选的未转义字符/序列之一或换行符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18736593/
我有一个 javascript 从用户输入中读取的 URL。这是 JavaScript 代码的一部分: document.getElementById("Snd_Cont_AddrLnk_BG").v
我将如何在 javascript 中转义斜杠// var j = /^(ht|f)tp(s?)://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$;/ 最佳答案 使用 \ 进行转
在解析到这样的对象之前,我要转义 & 和 =: var obb = parseJSON('{"' + text.replace(/&/g, "\",\"").replace(/=/g,"\":\"")
我正在使用 freemarker 生成一个 freemarker 模板。但我需要一些方法来转义 freemarker 标签。 我将如何逃脱 标签或 ${expression} ? 最佳答案 您也可以使
我正在尝试匹配方括号,即 excel 中正则表达式 VBA 中的 []。我正在尝试使用以下代码,但它不起作用。 Public Function IsSpecial(s As String) As L
我通过设置将 PowerShell 添加到我的上下文菜单中: Windows Registry Editor Version 5.00 [HKEY_CLASSES_ROOT\Directory\she
我需要转义 $,因此我需要将所有出现的 $ 替换为 \$ 所以我写了这个方法: // String#replaceAll(String regex, String replacement) publi
我正在格式化我的问题。非常遗憾。这是我的问题的摘要 在 JSP 中我有一个字段 我输入的值类似于“cQN==ujyRMdr+Qi8dO9Xm*eRun+ner==aLTyt?aKmGI” 实际行动
我有一个文本文件,其内容是C:\temp 我想要值 C:\temp替换为从变量定义的不同值 此外,将从批处理文件(windows .cmd)中调用 perl oneliner set CMDDIR=C
有没有办法使用 jTemplates 来转义 {$,这样我就可以在 onBlur 中使用内联 javascript,例如 telegraaf 在 processTemplate 之后得到这个: 谢谢
我正在尝试将 wget 与包含“#”符号的 url 一起使用。无论我做什么来逃避这个角色,它都不起作用。我用过\、' 和 "。但它们都不起作用。有人有什么建议吗? 谢谢! 最佳答案 如果您真的想让它有
我想知道如何从数据库中回显带有 $ 符号的字符串。此时,数据库中的值“Buy one for $5.00”将转换为“Buy one for .00”。 假设该字段的名称为 title,值为 Buy o
我在 mySQL 中有一个查询,旨在返回我们网站上使用的搜索词。是的,这是一个标签云,是的,我知道它是一条鲻鱼 :) 我们有一个管理页面,管理员可以在其中查看搜索词并选择将它们排除在云端之外。这些词进
我有一个文本区域。在其点击事件上。我将其插入数据库中,然后将其显示为元素列表中的第一个元素。问题是。如果我输入""在textarea中,jquery无法正确显示。它显示为空。代码是 var note
我想知道是否有某种字符串前缀,这样 cstring 就可以按原样使用,而不需要我转义所有字符。我不是 100% 确定。我记得一些关于在字符串前加上 @ 符号( char str[] = @"some\
这个问题在这里已经有了答案: How do I escape curly-brace ({}) characters in a string while using .format (or an f
C/C++编译器如何操作源代码中的转义字符["\"]?如何编写用于处理该字符的编译器语法?遇到那个字符后,编译器会做什么? 最佳答案 大多数编译器分为几个部分:编译器前端称为 lexical anal
我计划接受用户输入,并将其插入到一个 div 中 user_content 一个用户提供内容,另一个用户接收内容。 我认为我会遵循的建议来自 https://www.owasp.org/index.p
我有一个这种形式的 url - http:\\/\\/en.wikipedia.org\\/wiki\\/The_Truman_Show。我怎样才能使它成为正常的网址。我试过使用 urllib.unq
我有一个带有转义数据的字符串 escaped_data = '\\x50\\x51' print escaped_data # gives '\x50\x51' 什么 Python 函数会对其进行反转
我是一名优秀的程序员,十分优秀!