- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
首先我想提一下,这不是 How to parse invalid (bad / not well-formed) XML? 的重复项。因为我没有给定的无效(或格式不正确)XML 文件,而是给定的任意 Java String
其中可能包含也可能不包含无效的 XML 字符。我想创建一个 DOM Document
包含Text
具有给定 String
的节点,然后将其转换为文件。当文件被解析为 DOM Document
我想要一个String
等于初始给定的 String
。我创建 Text
节点 org.w3c.dom.Document#createTextNode(String data)
我得到了字符串 org.w3c.dom.Node#getTextContent()
.
正如您在 https://stackoverflow.com/a/28152666/3882565 中看到的那样Text
有一些无效字符XML 文件中的节点。实际上 Text
有两种不同类型的“无效”字符。节点。有预定义的实体,例如 "
, &
, '
, <
和>
DOM API 使用 "
自动转义它们, &
, '
, <
和>
在解析文件时,DOM API 会撤消生成的文件中的内容。现在的问题是,对于其他无效字符,例如'\u0000'
,情况并非如此。或'\uffff'
。解析文件时发生异常,因为'\u0000'
和'\uffff'
是无效字符。
可能我必须实现一种方法来转义给定 String
中的这些字符在将其提交给 DOM API 之前以一种独特的方式,并在稍后当我得到 String
时撤消该操作。回来了,对吗?有一个更好的方法吗?过去有人实现过这些或类似的方法吗?
编辑:此问题已标记为 Best way to encode text data for XML in Java? 的重复问题。我现在已阅读所有答案,但没有一个能解决我的问题。所有答案都表明:
"
之外。 , &
, '
, <
, >
还有更多。"&#number;"
这会导致无效字符异常,例如 "�"
解析文件时。"�"
(它们在某些库中被跳过)。最佳答案
一种技术是将整个字符串编码为 Base64 编码的 UTF8。
但是,如果“特殊”字符很少见,那么可读性和文件大小就会受到重大牺牲。
另一种技术是将特殊字符表示为处理指令,例如 <?U 0000?>
对于代码点 0。
另一种方法是使用反斜杠转义,例如\u0000 表示代码点 0,当然\表示反斜杠本身。这样做的优点是您可能可以找到为您执行此操作的现有库例程(例如 JSON 转换库)。我无法想象为什么你的要求说你不能使用这样的库;但如果你真的不会,那么自己编写代码并不难。
关于Java DOM 转换和解析具有无效 XML 字符的任意字符串?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59447599/
我想要以下内容: void foo( /* something representing a function f */, /* arguments a1, a2, etc. in s
简而言之,我想声明一个这样的特征: trait Test { def test(amount: Int): A[Int] // where A must be a Monad } 这样我就可以
在 GWT 中,如何在 onModuleLoad 方法中插入框架集以及相对嵌套的框架集和框架,以合并许多小程序和其他小部件和 HTML?代码片段是: 公共(public)类 MainEntryPoin
这个问题在这里已经有了答案: How do I best simulate an arbitrary univariate random variate using its probability
我对java相当陌生,并且习惯于枚举本质上只不过是一个命名的整数列表。 现在我正在编写一个实现,其中父类有几个采用枚举值作为参数的方法。枚举将在子类中定义,并且会略有不同。由于枚举基本上看起来像类,所
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 6 年前。 Improve this ques
想象一下 6-7 台服务器的设置都完全相同Java 版本“1.6.0_18”OpenJDK 运行时环境 (IcedTea6 1.8) (fedora-36.b18.fc11-i386)OpenJDK
这个问题在这里已经有了答案: What are some uses of template template parameters? (10 个答案) 关闭 4 年前。 我有一个根据策略舍入值的函数
我正在寻找如何在 Java 中给定一个 Async CompletableFutures 列表,以便前 N 个中的任何一个成功完成或失败。除非没有 N 次成功,否则忽略任何失败。 有这方面的例子吗?
我面临的问题是项目已经使用集群编程来分配任务。 if (cluster.isMaster) { // Fork workers. for (var i = 0; i { }); } el
我正在为 Luxology modo(3D 和 VFX 应用程序)编写脚本,该脚本使用 python 作为脚本语言。在我的脚本中的某个位置,我正在读取从其他应用程序输出的文本文件,并从该文本文件的行创
这个问题在这里已经有了答案: Fast arbitrary distribution random sampling (inverse transform sampling) (5 个答案) 关闭
我只是遇到了一个问题,我有一个结构数组,例如 package main import "log" type Planet struct { Name string `json:"
我正在尝试将 class ResponseResult 编码为 json case class ResponseResult (var Code : Int, var
我想将一个矩阵中的一个 block 复制到另一个矩阵的一部分中。要将其与任何类型的 n 维数组一起使用,我需要通过 [] 运算符应用带有偏移量的列表。有办法做到这一点吗? mat_bigger[0:5
我有一个匹配一组数字和字母的正则表达式。但是我希望能够排除任何三个连续的字母。这是为了防止意外形成单词或缩写。 我的表达如下。它还排除了一些类似的字符,如 0、o、O 和 1、i、I、l): ^[2-
根据documentation . 应匹配任何字符,但不匹配重音字符。 mysql> select 'test' regexp 't.st'; +----------------------+ | '
我该如何用 JavaScript 编写这个 if 语句? if(url == "http://www.google.com/" && "*") { ... } * 需要灵活并接受添加到第一个变量上
我知道 cPython 有一个 GIL,因此如果不使用多处理模块,您的脚本就无法在多个内核上运行。但是有什么可以阻止内置功能,例如使用多核进行排序吗?我不了解 cPython 结构,但我想我要问的问题
寻找命令行 gdb 的替代方法来检查 OSX 上的核心转储 - 有没有办法让 Xcode 打开带有调试符号的任意核心转储? 最佳答案 您是否尝试过使用 MachOView 1? 听起来它可能适用于查看
我是一名优秀的程序员,十分优秀!