Java XML 解析 : Avoid entity reference resolution-6ren

Java XML 解析 : Avoid entity reference resolution

转载作者：行者123 更新时间：2023-11-30 09:46:14

24

4

我目前正在使用 DOM 解析器解析 XHTML 文档，例如:

final DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
dbf.setValidating(false);

final DocumentBuilder db = dbf.newDocumentBuilder();
db.setEntityResolver(MY_ENTITY_RESOLVER);
db.setErrorHandler(MY_ERROR_HANDLER);
...
final Document doc = db.parse(inputSource);

我的问题是，当我的文档包含实体引用时，例如:

<p>&euro;</p>

我的解析器为包含“€”而不是“€”的内容创建了一个文本节点。也就是说，它以预期的方式解析实体(XHTML 1.0 Strict DTD 链接到 ENTITIES Latin1 DTD，后者又建立了“€”与“€”的等价)。

问题是，我不希望解析器做这样的事情。 我想保留“€”文本未修改。

我已经尝试过:

final DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
dbf.setExpandEntityReferences(false);

但是:

我不喜欢这样，因为我担心这可能会使某些解析器实现无法导航从 XHTML 1.0 Strict DTD 到 ENTITIES Latin1 DTD，因此不考虑“€”作为声明的实体。
当我这样做时，它奇怪地创建了两个节点:一个“井号”实体节点和一个后面带有“€”符号的文本节点。

有什么想法吗？是否可以在 DOM 解析器中配置它而不诉诸 预处理 XHTML 并将所有“&”符号替换为其他符号？...

解决方案可以用于 DOM 解析器或 SAX 解析器，我不介意使用 SAX 解析然后使用转换创建我的 DOM...

此外，我无法切换到非标准的 XML 解析库。没有 jdom，没有 jsoup，没有 HtmlCleaner 等。

非常感谢。

最佳答案

我采用的方法是用 Xerces 将其视为纯文本的唯一标记替换任何实体。转换为文档对象后，标记将替换为实体引用对象。

参见 http://sourceforge.net/p/commonclasses/code/14/tree/trunk/src/com/redhat/ecs/commonutils/XMLUtilities.java 中的 convertStringToDocument() 函数

关于Java XML 解析 : Avoid entity reference resolution，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/7240857/

24

4

0

文章推荐： java - com.google.gdata.client.GoogleService$CaptchaRequiredException

文章推荐： python - keras 中 softmax 输出的一个热输入

文章推荐： java - JTextArea+JScrollPane 中滚动+插入符行为的自定义

Wpf Resolution Independence 和 Native Resolution
WPF 文档和教程指出 WPF 与分辨率无关，据我所知，它会在不同分辨率(1600x1200 -> native 和 1024x768)和/或 DPI 设置下显示相同大小的窗口。但是，当我尝试示例应用
Kinect v2 : Spatial resolution/depth resolution/camera calibration
对于我的应用程序，我分析了 Kinect v2 的空间分辨率。为了分析空间分辨率，我记录了一个垂直平面到给定距离的平面，并将平面的深度图转换为点云。然后我通过计算欧几里得距离将一个点与他的邻居进行比
android - OpenGL ES : render once at normal resolution then half the resolution
有没有办法在 Android 上的 OpenGL ES 2.0 中将场景渲染为正常分辨率，然后将屏幕的另一部分渲染为较低分辨率？如果我使用 GLES20.glViewPort() 并更改分辨率，它不
android-camerax - java.lang.IllegalArgumentException : Suggested resolution map missing resolution for camera 1
使用 CameraX.LensFacing.FRONT 时出现此错误, 在模拟器上测试 E/AndroidRuntime: FATAL EXCEPTION: main Process: met
android - 哪个依赖性导致 “Failed resolution Failed resolution of: Lcom/google/android/gms/common/internal/zzab;”
我没有使用Firebase，这似乎是other问题的原因people 这是错误的屏幕截图: 这是我的依赖项列表: dependencies { implementation project('
java.lang.NoClassDefFoundError : Failed resolution Failed resolution of: Lcom/google/android/gms/common/internal/zzab;
我正在按照教程 (link) 将图像上传到 Firebase 数据库，但出现以下错误。我重新检查了 gradle 依赖项并启用了 multidex 支持，但错误仍然存在 java.lang.NoC
visual-studio-2015 - VS2015 中的 bower 错误 "bower requirejs extra-resolution Unnecessary resolution: requirejs#~2.2.0"
我正在尝试使用 durandal，但出现此错误: 错误: bower requirejs extra-resolution Unnecessary resolution: requirejs#~2.2
ios - 应用因 "iPhone Apps must also run on iPad without modification, at iPhone resolution, and at 2X iPhone 3GS resolution"而被拒绝
我的应用程序被苹果拒绝了，原因是“iPhone 应用程序还必须在 iPad 上运行而无需修改，iPhone 分辨率和 2X iPhone 3GS 分辨率”。Apple 建议“为了支持 iPad 3GS
resolution - 图像分辨率最高
我在我的网站上显示用户的gravatr图像。我怎么知道要使用的最佳高分辨率？例如哪个参数应该是“ s”。 https://secure.gravatar.com/avatar/?s=250 当然，这取
screen-resolution - 网站支持的最低分辨率应该是多少？
我正在开发一个网站，但我不知道“支持”的最低分辨率应该是多少。我知道它可以在所有分辨率下运行，但“支持”是指所有内容都适合页面而不需要左右滚动。我是否应该考虑“支持”1024x768？最佳答案除了
resolution - ImageNet 数据集中图像的分辨率是多少？
有谁知道ImageNet中图片的分辨率数据集？抱歉，我在他们的网站或任何 papers 中都找不到它。 . 最佳答案图像的尺寸和分辨率各不相同。许多应用程序将所有图像的大小调整/裁剪为 256x2
R图: size and resolution
我已经陷入了这个问题:我需要使用 DPI=1200 和特定的打印尺寸来绘制图像。默认情况下 png 看起来不错... png("test.png",width=3.25,height=3.25,un
python - 伪增加值表的 'resolution'
我有一个包含 16.000 个条目的测量数组，形式为 [t] [value] 问题是我的数据记录器太慢了，我每秒只有测量点。对于我的模拟，我需要增加伪分辨率。这样每个时间步都除以 1000，每个测量值
javascript - "resolution"媒体查询引用实际屏幕
我正在尝试使用“分辨率”媒体查询来确定屏幕的实际 DPI。我正在做的代码是这样的: window.matchMedia(`(resolution: ${value}dpi)`).matches 但我
安卓 : Multiple resolution
我正在开发一款支持多种分辨率的应用。我已经通过了http://developer.android.com/guide/practices/screens_support.html但找不到解决方案。决
merge-conflict-resolution - 故意制造合并冲突
我已经从 GitHub 中提取了文件。现在我需要创建一个合并冲突。如何在 GitHub 上故意创建合并冲突？最佳答案在两个分支中编辑同一行，并尝试合并 Merge conflicts in gi
resolution - Kindle:更改屏幕边界/分辨率
有什么方法可以更改分辨率或为亚马逊 Kindle 键盘上的屏幕设置不同的边界？我的屏幕有一部分出现裂纹，我想解决这个问题。我试过在文件系统中乱搞(通过 WiFi 连接)，但我的所有属性更改都没有任何
resolution - 我应该在网站上支持的标准“最低”分辨率是多少？
This question already has answers here: Closed 11 years ago. Duplicate: Recommended website resoluti
screen-resolution - 建立网站时，我应该注意的最小屏幕分辨率是多少？
Closed. This question is opinion-based。它当前不接受答案。想改善这个问题吗？更新问题，以便editing this post用事实和引用来回答。 6年前关闭。
screen-resolution - Tinyscrollbar 不适用于拖动
我在网站的几个部分中使用了 tinyscrollbar 插件。到目前为止，它运行良好。但现在由于某种原因，鼠标滚轮可以滚动，但拖放 slider 不能滚动。我使用的分辨率是 1360x768，但我在

首页

博学

6Ren·AI

商城

Java XML 解析 : Avoid entity reference resolution