java - 拆分返回 PatternSyntaxException : Illegal/unsupported escape sequence-6ren

java - 拆分返回 PatternSyntaxException : Illegal/unsupported escape sequence

转载作者：行者123 更新时间：2023-12-02 09:39:38

25

4

当用户输入包含 Unicode 字符(例如 ' 或 ” )时，以下操作将失败:

String[] unicodeStrings = answerText.split("((?<=\\R)|(?=\\R))");

我尝试过调试 split 方法，但没有找到根本原因。我有预感这与表达式中的问号(?)有关。

我还尝试了在线 java 正则表达式工具，并将表达式应用于具有以下字符 ‘” 的某些文本。没有显示任何错误。

我还尝试在在线java编译器中编写一个简单的测试方法，其中我传递了带有‘”字符的测试字符串并执行了上述拆分。也没有错误。

代码:

String answerText = uiq.getAnswerText();
            if (answerText.matches("[\\x00-\\x7F]*")) //if the answerString consists only of ascii characters we encode it
                sb.append("<String name=\"answerText\">")
                        .append(wrapCdata(uiq.isDate() ? formatDate(uiq.getAnswerText(), sourceFormat, targetFormat) : answerText)).append("</String>");
            else { //if the answerString consists of unicode characters we encode only the Linebreakers (the \R)
                String answerNonEscapedText = "";
                String[] unicodeStrings = answerText.split("((?<=\\R)|(?=\\R))");//This regex splits the string to its linebreak-delimiters, including them. i.e. ("$$$\r\n" ---> [$,$,$,\r\n])
                for (String str : unicodeStrings) {
                    if (str.matches("\\R"))
                        str = StringEscapeUtils.escapeJava(str);

                    answerNonEscapedText += str;
                }

错误:

java.util.regex.PatternSyntaxException: Illegal/unsupported escape sequence near index 6 
((?<=\R)|(?=\R)) 
 ^ 
 at java.util.regex.Pattern.error(Pattern.java:1924) 
 at java.util.regex.Pattern.escape(Pattern.java:2416) 
 at java.util.regex.Pattern.atom(Pattern.java:2164) 
 at java.util.regex.Pattern.sequence(Pattern.java:2046) 
 at java.util.regex.Pattern.expr(Pattern.java:1964) 
 at java.util.regex.Pattern.group0(Pattern.java:2807) 
 at java.util.regex.Pattern.sequence(Pattern.java:2018) 
 at java.util.regex.Pattern.expr(Pattern.java:1964) 
 at java.util.regex.Pattern.group0(Pattern.java:2854) 
 at java.util.regex.Pattern.sequence(Pattern.java:2018) 
 at java.util.regex.Pattern.expr(Pattern.java:1964) 
 at java.util.regex.Pattern.compile(Pattern.java:1665) 
 at java.util.regex.Pattern.<init>(Pattern.java:1337) 
 at java.util.regex.Pattern.compile(Pattern.java:1022) 
 at java.lang.String.split(String.java:2313) 
 at java.lang.String.split(String.java:2355)

您能帮我找出失败的根本原因吗？

最佳答案

        String answerText = uiq.getAnswerText();
        if (answerText.matches("[\\x00-\\x7F]*")) {
            sb.append("<String name=\"answerText\">")
              .append(wrapCdata(uiq.isDate()
                      ? formatDate(uiq.getAnswerText(), sourceFormat, targetFormat)
                      : answerText))
              .append("</String>");
        } else {
            String[] unicodeStrings = answerText.split("\\R"); // Splits on linebreaks.
            // This looses the exact line delimiter.
            String answerNonEscapedText = ""; // Better StringBuilder too.
            for (String str : unicodeStrings) {
                answerNonEscapedText += str + "\\r\\n";
            }

对于某些情况，上述原始行分隔符的丢失很重要:存在 CSV，其中字段值可能包含行分隔符 \n 而行以 \r\n。或者这样。

更简单的解决方案:

        // Java >= 9
        String answerText = Pattern.compile("\\R").matcher(uiq.getAnswerText())
            .replaceAll(mr -> StringEscapeUtils.escapeJava(mr.group()));


        // Java < 9 (only for \r and \n)
        String answerText = uiq.getAnswerText()
            .replace("\r", "\\r").replace("\n", "\\n");

关于java - 拆分返回 PatternSyntaxException : Illegal/unsupported escape sequence，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57203130/

25

4

0

文章推荐： javascript - java ScriptEngine 在数组方法上失败

文章推荐： java - RUNNABLE 线程 - 它移动了吗？

文章推荐： java - Springboot事件发布者有延迟

文章推荐： java - 如何使用 Kotlin 或 Java 更改可绘制对象的描边颜色

sequence - 你如何在 Ceylon 中展平一个 Sequence of Sequences？
给定一个 Sequence of Sequences 类型，如何将其转换为单个扁平化 Sequence 类型？考虑以下 Ceylon 代码: Integer[] range(Integer max)
f# - 由 Sequence 的前一个元素和另一个 Sequence 构造的 Sequence
出于学习目的，我正在尝试使用 F# 以序列形式运行模拟。从一系列随机数开始，如果状态不依赖于先前的状态，map 是生成状态序列的直接方法。我遇到问题的地方是当我尝试做类似的事情时: State(i+1
sequence - DynamoDB : Have sequencing within Items
我正在 DynamoDB 上开发论坛。有一个帖子表，其中包含线程中的所有帖子。我需要对帖子中的顺序有一个概念，即我需要知道哪个帖子先出现，哪个后出现。我的服务将在分布式环境中运行。我不确定使用时
sequence - DynamoDB : Have sequencing within Items
我正在 DynamoDB 上开发论坛。有一个帖子表，其中包含线程中的所有帖子。我需要对帖子中的顺序有一个概念，即我需要知道哪个帖子先出现，哪个后出现。我的服务将在分布式环境中运行。我不确定使用时
sequence - Z3py 是否支持 "String"和 "Sequence"
在 Z3 中，它支持 String 和 Sequence。但是 Z3py 是否也支持它们，或者我们必须使用 Python 中的字符串或列表？从最新的版本来看，新版本好像确实支持了String和Sequ
Clojure : apply keys to every sequence of sequence
我是 Clojure 世界的新手，我遇到了一个问题。我得到了一个 LazySeq，看起来像这样(实际上更长) values = (("Brand1" "0") ("Brand2" "15") ("Br
python - "Decoder"模型的 "Sequence-to-Sequence"应该输入什么？
我正在开发一个用于文本生成的序列到序列模型 ( paper )。我没有在解码器端使用“教师强制”，即 t0 时解码器的输出被馈送到 t1 时解码器的输入。现在，实际上，解码器(LSTM/GRU)的输
c++ - Rust 中的 "sequence point"/"sequenced-before"规则是什么？
Rust 中的规则是什么，类似于这里描述的规则http://en.cppreference.com/w/cpp/language/eval_order对于 C++？目前我凭经验发现， 1) 函数的参
python - 我的代码 : identifying sequence within another sequence 中的错误
我当前的代码: import re from Bio.Seq import Seq def check_promoter(binding_element,promoter_seq): promoter
python - 值错误 : setting an array element with a sequence when array is not a sequence
您好，此代码旨在存储使用 open cv 绘制的矩形的坐标，并将结果编译为单个图像。 import numpy as np import cv2 im = cv2.imread('1.jpg') im
java - : a string should not contain any sequence of characters immediately followed by the same sequence? 的正则表达式示例是什么
在我的程序中，我有一个正则表达式，它确保输入字符串至少有一个字母和一个数字字符，并且长度在 2 到 10 之间。 Pattern p = Pattern.compile("^(?=.*\\d)(?=.
python - 如何修复 'TypeError: cannot convert dictionary update sequence element #0 to a sequence'
我正在查看 Google 的免费机器学习速成类(class)，并尝试根据他们类(class)的第一部分制作一个预测模型。但是，在输入函数中，有一个字典，我不断收到此错误， in my_input_fn
c++ - boost fusion/MPL : convert type from sequence to sequence of equivalent any_range's
我想使用 Boost 的 any_range 来处理多个异构数据范围。我的数据范围类型称为 fusion vector ，例如: typedef vector TypeSequence 鉴于这样的类型
oracle - 在 SimpleJdbcInsert 对象中指定 Oracle Sequence 以从 Oracle Sequence 生成 key
我正在使用 SimpleJdbcInsert 作为， SimpleJdbcInsert simpleJdbcInsert = new SimpleJdbcInsert(dataSource).with
python - Biopython 给出 ValueError : Sequences must all be the same length even though sequences are of the same length
我正在尝试通过从我的数据创建 .phy 文件来创建系统发育树。我有一个数据框 ndf= ESV trunc 1 esv1 TACGTAGGTG... 2 esv2 TACGGAGGGT... 3 e
c# - 学习 Rx : How can I parse an observable sequence of characters into an observable sequence of strings?
这可能真的很简单，但我正处于 Rx 学习曲线的底部。我花了几个小时阅读文章、观看视频和编写代码，但我似乎对一些看起来应该非常简单的事情有心理障碍。我正在从串行端口收集数据。我已使用 Observab
python - 类型错误 : cannot convert dictionary update sequence element #0 to a sequence - Odoo v10 community
我正在将一些模块从 v8 迁移到 v10，我有这个模型: class SearchInfoPartnerSeniat(models.TransientModel): _name = "search.i
Marten - using sequences - add new sequence fails on 2nd run(马丁-使用序列-添加新序列在第二次运行时失败)
我尝试添加一个新的“自定义”序列到我的Marten DB中，以获取新用户的用户ID（在注册过程中）。。后来，我能够访问下一个序列值，如下所示：。问题出在上面的代码中：在第一次运行时：将userid_s
sequence - 关于Raku中数组生成序列的问题
我在 rosettacode 遇到了这个代码 my @pascal = [1], { [0, |$_ Z+ |$_, 0] } ... Inf; .say for @pascal[^4]; # ==>
sequence - 对来自序列的供应使用react
我不明白为什么这个程序有效: my $supply = Supply.interval: 1; react { whenever $supply { put "Got $^a" }

首页

博学

6Ren·AI

商城

java - 拆分返回 PatternSyntaxException : Illegal/unsupported escape sequence