gpt4 book ai didi

java - Java 中是否有与 Ruby 的 Nokogiri::XML::EntityDecl 等效的东西?

转载 作者:行者123 更新时间:2023-11-30 07:05:00 24 4
gpt4 key购买 nike

我遇到一个问题,需要在现有 XML 文档的定义中添加包含定义中括号中的实体的 DTD。

例如,根据 DAISY 中的 MathML 规范进行工作 http://www.daisy.org/projects/mathml/mathml-in-daisy-spec.html ,假设我从外部源获得了此 XML:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE dtbook PUBLIC "-//NISO//DTD dtbook 2005-2//EN"
"http://www.daisy.org/z3986/2005/dtbook-2005-2.dtd">
<dtbook xmlns="http://www.daisy.org/z3986/2005/dtbook/" xmlns:m="http://www.w3.org/1998/Math/MathML"
version="2005-3" xml:lang="eng">
<m:math xmlns:dtbook="http://www.daisy.org/z3986/2005/dtbook/"
id="math0001" dtbook:smilref="nativemathml.smil#math0001"
altimg="nativemathml0001.png"
alttext="sigma-summation UnderScript i equals zero OverScript infinity EndScripts x Subscript i">
<m:mrow>
<m:mstyle displaystyle='true'>
<m:munderover>
<m:mo>&#x2211;</m:mo>
<m:mrow>
<m:mi>i</m:mi><m:mo>=</m:mo><m:mn>0</m:mn>
</m:mrow>
<m:mi>&#x221E;</m:mi>
</m:munderover>
<m:mrow>
<m:msub>
<m:mi>x</m:mi>
<m:mi>i</m:mi>
</m:msub>
</m:mrow>
</m:mstyle>
</m:mrow>
</m:math>
</dtbook>

我想添加规范中的 ENTITY 定义以使本书支持 MathML,结果如下所示:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE dtbook PUBLIC "-//NISO//DTD dtbook 2005-2//EN"
"http://www.daisy.org/z3986/2005/dtbook-2005-2.dtd"
[
<!ENTITY % MATHML.prefixed "INCLUDE" >
<!ENTITY % MATHML.prefix "m">
<!ENTITY % MATHML.Common.attrib
"xlink:href CDATA #IMPLIED
xlink:type CDATA #IMPLIED
class CDATA #IMPLIED
style CDATA #IMPLIED
id ID #IMPLIED
xref IDREF #IMPLIED
other CDATA #IMPLIED
xmlns:dtbook CDATA #FIXED 'http://www.daisy.org/z3986/2005/dtbook/'
dtbook:smilref CDATA #IMPLIED"
>
<!ENTITY % mathML2 PUBLIC "-//W3C//DTD MathML 2.0//EN"
"http://www.w3.org/Math/DTD/mathml2/mathml2.dtd"
>
%mathML2;
<!ENTITY % externalFlow "| m:math">
<!ENTITY % externalNamespaces "xmlns:m CDATA #FIXED
'http://www.w3.org/1998/Math/MathML'">
]
>
<dtbook xmlns="http://www.daisy.org/z3986/2005/dtbook/" xmlns:m="http://www.w3.org/1998/Math/MathML"
version="2005-3" xml:lang="eng">
<m:math xmlns:dtbook="http://www.daisy.org/z3986/2005/dtbook/"
id="math0001" dtbook:smilref="nativemathml.smil#math0001"
altimg="nativemathml0001.png"
alttext="sigma-summation UnderScript i equals zero OverScript infinity EndScripts x Subscript i">
<m:mrow>
<m:mstyle displaystyle='true'>
<m:munderover>
<m:mo>&#x2211;</m:mo>
<m:mrow>
<m:mi>i</m:mi><m:mo>=</m:mo><m:mn>0</m:mn>
</m:mrow>
<m:mi>&#x221E;</m:mi>
</m:munderover>
<m:mrow>
<m:msub>
<m:mi>x</m:mi>
<m:mi>i</m:mi>
</m:msub>
</m:mrow>
</m:mstyle>
</m:mrow>
</m:math>
</dtbook>

在 Ruby 中,Nokogiri 中有一个方法可用于添加这些 ENTITY 定义,如下所示: Nokogiri::XML::EntityDecl.new("MATHML.prefixed", doc, MATHML_ENTITY_DECL_TYPE, nil, nil, "INCLUDE")

Java 中有类似的东西吗?我们使用 JDOM 来操作 XML 文档,但 JDOM DocType 类似乎不支持这些实体定义。

最佳答案

使用 JDOM,您应该能够解析原始文档,并从文档中提取 DTDContent 节点。

你的代码看起来像这样:

Document doc = saxBuilder.build(myxmlfile);
DocType dtd = doc.getDocType();

dtd 内容应该是对 dtbook 引用的引用。

您现在可以采用 mathml 声明的字符串表示形式,并将它们作为 DocType 的内部子集包含在内(也许您想从文件中读取它,或者作为系统资源等)。

String internal = "  <!ENTITY % MATHML.prefixed \"INCLUDE\" >\n"
+ " <!ENTITY % MATHML.prefix \"m\">\n"
+ ......

dtd.setInternalSubset(internal);

参见:http://www.jdom.org/docs/apidocs/org/jdom2/DocType.html#setInternalSubset(java.lang.String)

这将修改声明,并且,如果您输出 XML,您应该拥有您期望的内容:

XMLOutputter xout = new XMLOutputter();
xout.output(doc, System.out);

关于java - Java 中是否有与 Ruby 的 Nokogiri::XML::EntityDecl 等效的东西?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40293841/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com