- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
String testString = "a\\,b\\\\,c,d\\\\\\,e,f\\\\g";
String[] splitedString = test.split(PATTERN_STRING);
for (String string : splitedString) {
System.out.println(string);
}
这里我有一个字符串,它将字符串列表编码为字符串,其中转义字符为\,分隔符为 ,
注意:(由于 Java 代码,示例中的反斜杠加倍)
反斜杠和逗号被转义在原始字符串和结果字符串中用逗号合并。我需要一个正则表达式来将此字符串拆分为原始字符串列表。
所以以字符串为例
"a\,b\\,c,d\\\,e,f\\g"I need to get such strings:
"a\,b\\"
"c"
"d\\\,e"
"f\\g"
所以拆分的逻辑很简单:只有当它前面的反斜杠数量为偶数时才用分隔符逗号拆分:0,2,4 ...只有在这种情况下这个逗号才是分隔符。如果逗号前的反斜杠数量是奇数,则它是转义逗号,不应发生拆分。
谁能帮我用适合这种情况的正则表达式?
编辑
我知道这个正则表达式:(?<!\\\\),
将有助于用前面没有反斜杠的逗号拆分字符串。但就我而言,我还需要拆分以防逗号之前的斜线数量为偶数。
感谢任何帮助。
最佳答案
如果必须拆分,那么您可以尝试类似的方法
split("(?<!(?<!\\\\)\\\\(\\\\{2}){0,1000000000}),")
我使用 {0,1000000000}
而不是 *
因为 Java 中的后视需要有明显的最大长度,而 1000000000
似乎足够好,除非您的文本中可以有超过 1000000000
连续 \\
。
如果不需要split
那么你可以使用
Matcher m = Pattern.compile("(\\G.*?(?<!\\\\)(\\\\{2})*)(,|(?<!\\G)$)",
Pattern.DOTALL).matcher(testString);
while (m.find()) {
System.out.println(m.group(1));
}
\\G
表示上一个匹配的结束,或者如果这是 Matcher 的第一次迭代并且没有字符串 ^
的上一个匹配开始。
但最快且不太难实现的是编写您自己的解析器,它会使用像 escaped
这样的标志来表示当前检查的字符已使用 \
转义。
public static List<String> parse(String text) {
List<String> tokens = new ArrayList<>();
boolean escaped = false;
StringBuilder sb = new StringBuilder();
for (char ch : text.toCharArray()) {
if (ch == ',' && !escaped) {
tokens.add(sb.toString());
sb.delete(0, sb.length());
} else {
if (ch == '\\')
escaped = !escaped;
else
escaped = false;
sb.append(ch);
}
}
if (sb.length() > 0) {
tokens.add(sb.toString());
sb.delete(0, sb.length());
}
return tokens;
}
String testString = "a\\,b\\\\,c,d\\\\\\,e,f\\\\g";
String[] splitedString = testString
.split("(?<!(?<!\\\\)\\\\(\\\\{2}){0,1000000000}),");
for (String string : splitedString) {
System.out.println(string);
}
System.out.println("-----");
Matcher m = Pattern.compile("(\\G.*?(?<!\\\\)(\\\\{2})*)(,|(?<!\\G)$)",
Pattern.DOTALL).matcher(testString);
while (m.find()) {
System.out.println(m.group(1));
}
System.out.println("-----");
for (String s : parse(testString))
System.out.println(s);
输出:
a\,b\\
c
d\\\,e
f\\g
-----
a\,b\\
c
d\\\,e
f\\g
-----
a\,b\\
c
d\\\,e
f\\g
关于用于处理转义分隔符和转义转义字符的 Java String.split() 正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22541519/
使用 ListView.separated 我们可以在列表项之间添加 Divider(),但是,一旦我转换到 SliverList,我就看不到我的分隔线了。 delegate: SliverChild
使用 ListView.separated 我们可以在列表项之间添加 Divider(),但是,一旦我转换到 SliverList,我就看不到我的分隔线了。 delegate: SliverChild
我对 Angular 还很陌生。我有一个由一些数据填充的列表项: {{content.Company}} {{content.Town}}, {{content.P
我正在尝试从 SwiftUI 中的 List 中删除“行”分隔符(在 SwiftUI 中称为分隔符)。 我浏览了 List 文档,但我没能找到它的修饰符。 如有任何帮助,我们将不胜感激。 最佳答案 i
我有一个带有 4 个按钮的网格...1 行 4 列。我正在寻找一种方法将左侧的两个按钮与右侧的两个按钮进行视觉分组。我一直在寻找一种使用分隔符执行此操作的方法,但它似乎与 Grid 一起玩得不好,更喜
我对 R 语言相当陌生。所以我有这个包含以下内容的向量: > head(sampleVector) [1] "| txt01 | 100 | 200 | 123.456
我正在尝试连接两列中的值,当我使用 =CONCAT(A2,",",B2) 时,它将连接两列并获得正确的结果 (P0810,P1)。但我正在寻找的是这样的东西(“P0810”,“P1”)。我尝试了 =C
我在这里创建了一个简单的演示。在 amount 字段编辑时,我想显示 , 分隔符?目前,它仅在不处于编辑模式时显示 ,。知道如何实现这一目标吗? DEMO IN DOJO var data = [{
这里是java菜鸟... 这让我抓狂,因为我知道这很简单,但我已经为此工作了 30 分钟...... 这是来自代码战斗: 对于参数 = ["Code", "Fight", "On", "!"] 且分隔
基于这个pywin32基础script如何向托盘菜单 menu_options 添加分隔符? 我还可以让菜单在左键单击时弹出,而不仅仅是右键单击吗? 最佳答案 将 notify 函数(从 URL 中的
我正在使用这段代码: StringTokenizer tokenizer=new StringTokenizer(line, "::"); 拆分以下字符串: hi my name is visghal
- Dropbox login fix - Updated iris viewer * other aspects are to be improved + fix crash on viewing
我试图在每个菜单组之间显示一个分隔线。我已经尝试过为每个组提供一个唯一的 ID,但这没有用。我找到了一些其他解决方案,但它们看起来有点奇怪,比如创建高度为 1dp 的 LinearLayout。 这是
我想为 CONCAT_WS() 选择一个与字段值不冲突的分隔符例如,如果我选择“,”,则字段值可能包含带有“,”的字符串我想选择一个与字段值不冲突的分隔符:( 最佳答案 来自here : CONCAT
我想知道 Sphinx 引擎是否可以使用任何定界符(如普通 MySQL 中的逗号和句点)。我的问题来自于一种冲动,根本不使用它们,而是逃避它们,或者至少在使用 FULLTEXT 搜索执行 MATCH
我正在尝试使用 svg 或纯 css3 制作 header 分隔符,如下所示: preview from design 在 header 中我有标准的 bootstrap 4 轮播
我在使用 CSS 分隔符时遇到了一些难题。看看:http://jsfiddle.net/fVxC6/1/ .div-line { border-bottom: 1px solid #f0f0f
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 关闭 7 年前。 编辑问题以包含 desired behavior, a specific probl
嘿,我正在尝试使用 getline 读取以下行 (15,0,1,#) (2,11,2,.) (3,20,0,S) 我希望能够将整数提取为 int,将字符提取为 char,但我不知道如何只提取它们。 最
我有 2 列,每边 float 一列,我想使用 1px 宽度的线分隔符,从最长列的顶部到底部。 我宁愿远离 TABLE 布局,而且我不知道哪一个将是最长的列,或者它会有多长。 我怎么能只用 css 做
我是一名优秀的程序员,十分优秀!