java - DocumentBuilder tagName 根本问题-6ren

java - DocumentBuilder tagName 根本问题

转载作者：行者123 更新时间：2023-12-01 18:31:31

25

4

我正在尝试使用 DocumentBuilder 并解析一个包含多个文档的大文件。当我运行程序时，出现此错误:"The markup in the document following the root element must be well-formed."

我认为这是因为我的文档上没有实际的根目录，它是一个 TextEdit Document ，结构如下:

<DOC>
<DOCNO> AP890106-0001 </DOCNO>
<FILEID>AP-NR-01-06-89 0033EST</FILEID>
<FIRST>r a PM-BRF--Heidnik     01-06 0136</FIRST>
<SECOND>PM-BRF--Heidnik,0139</SECOND>
<HEAD>Torture-Murderer In Fair Condition, Conscious</HEAD>
<DATELINE>PITTSBURGH (AP) </DATELINE>
<TEXT>
   Convicted torture-murderer Gary Heidnik has
regained consciousness after apparently attempting suicide in his
prison cell with a drug overdose, prison officials said.
   Heidnik's condition was upgraded to fair Thursday, but he
remained under tight security in the intensive care unit of West
Penn Hospital, said Tom Seiverling, a spokesman for the State
Correctional Institution at Pittsburgh.
   Heidnik, 45, was semi-comatose earlier this week after being
found unconscious in his cell Sunday. Prison officials believe
Heidnik stored up medications that were prescribed for him by
pretending to take them at the designated times.
   The self-proclaimed minister faces the death sentence for the
slayings of two of six women he kept chained in the basement of his
Philadelphia row house. He was convicted and sentenced last July.
</TEXT>
</DOC>
<DOC>
<DOCNO> AP890106-0002 </DOCNO>
<FILEID>AP-NR-01-06-89 0524EST</FILEID>
<FIRST>d a PM-BRF--DrivingToddler     01-06 0162</FIRST>
<SECOND>PM-BRF--Driving Toddler,0166</SECOND>
<HEAD>3-Year-Old Takes Careening First Drive; Emerges Unharmed</HEAD>
<DATELINE>CAZENOVIA, N.Y. (AP) </DATELINE>
<TEXT>
   Going out to buy a puppy, Cecilia Kaler
placed her three-year-old son in a child seat, left the car running
and got out to clear snow from the windshield. She never finished
the job.
   As soon as his mother closed the door, little Michael Kaler
locked it, put the car in drive, and rode away Wednesday. The car
went down the driveway, across a busy road, narrowly missed a tree
and fire hydrant, rolled on its side down an embankment and finally
came to rest in a creek.
   Michael was wet, cold and otherwise unharmed, said Kaler, a
resident of this community 15 miles southeast of Syracuse.
   A nearby man heard Kaler screaming and rushed over. He smashed a
window and freed little Michael.
   ``Anybody who says there's no God doesn't know what they're
talking about, because someone certainly was looking out for him,''
Kaler said Thursday.
</TEXT>
</DOC>

我想用 tagNames <DOC> 分隔每个文档和</DOC>

到目前为止我的代码:

 DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
  DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();

  Document doc = dBuilder.parse(document);
  doc.getElementsByTagName("doc").toString();

最佳答案

无法解析您的文件，因为没有“唯一”根元素。您的

<doc> </doc>

block 必须用另一个标签容器包围:选择您喜欢的名称。然后，当 xml 格式良好时，您可以尝试解析。

示例:

<mytag>
    <doc> ........</doc> 
    <doc>........... </doc> 
</mytag>

关于java - DocumentBuilder tagName 根本问题，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/60157575/

25

4

0

文章推荐： iphone - asihttprequest的post和get请求有什么区别？

文章推荐： java - admob 设置已启用 false

文章推荐： c++ - 整数除法算法

文章推荐： java - 如何退出java方法

java - DocumentBuilder 从绝对路径解析文件
我有一个带有 JFileChooser 的基本 Java-UI。我尝试使用以下代码解析所选文件: Document document = builder.parse(getClass().getRe
java - DocumentBuilder 解析带有主题标签的路径
我试图向文档生成器解析一个包含井号标签 (#) 的 xml 路径，但它不起作用，似乎解析器会忽略 # 后面的所有内容。有谁知道我能做什么吗？这是代码: Document document = Doc
java - DocumentBuilder 线程安全吗？
我正在查看的当前代码库使用 DOM 解析器。以下代码片段在 5 种方法中重复: DocumentBuilderFactory factory = DocumentBuilderFactory.new
java - 如何在没有 DocumentBuilder 的情况下插入分页符？
我有一个包含页眉/页脚的模板文档，我必须插入多个文档。在每个文档之后我需要插入一个分页符。在com.aspose.words.DocumentBuilder中有一个insertDocument()和
java - DocumentBuilder tagName 根本问题
这个问题已经有答案了: How to fix error: The markup in the document following the root element must be well-for
java - Documentbuilder.parse() 的问题
我正在尝试从给定的 URL 解析一些 XML。代码如下: try { URL myUrl = new URL(sURL); URLCon
java - DocumentBuilder.parse() -- 权限被拒绝
DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance (); DocumentBuilder dBuilder =
java - DocumentBuilder XML 文件空变量问题
我在 JAVA 中使用 DocumentBuilder Factory 来创建 XML 文件，并且在我的 createTextNode() 方法中“null”值 Not Acceptable 。 El
java - 系统找不到文件指定的文档 document = documentBuilder()
在此 Document document = documentBuilder.parse(filename); 我正在尝试通过缓冲输入流读取一组Xml文件。当我在命令提示符中输入文件时，出现错误 As
java - DocumentBuilder.parse()/解析实体
我是解析 XML 的新手，并且遇到实体问题。 (我正在 Android 上执行此操作，如果有影响的话)。有没有办法让它把一个实体变成它所代表的角色？我在元素的子元素中有这个:“isn't”(减去引号
java - Documentbuilder.parse 返回错误权限被拒绝
我正在尝试使用以下代码在 java 中解析 xml File fXmlFile = new File(DAL_DB_ALARM_MOVED_XML); DocumentBuilderFactory d
Java DocumentBuilder - XML 文件中的错误缩进
我尝试使用 DocumentBuilder 在 Java 中编写一个简单的 XML 文件。我希望 XML 文件看起来像这样:
c# - OpenXmlPowerTools DocumentBuilder 在单独的页面上合并文档
我正在尝试合并 4 个 word 文档并强制每个文档的内容从新页面开始。但是，它不是将每个文档的文本附加到单独的页面，而是将所有文档的文本添加到一个页面。像这样: 我该如何解决？这是代码: publ
java - 可以在 DocumentBuilder 上设置超时吗？
我目前正在从 PHP 脚本(如下所示)读取 XML 文件，该文件工作正常，但是我现在想添加某种形式的 HTTP 超时来检索 XML。 DocumentBuilderFactory docBuilder
java - 使用 DocumentBuilder 验证模式
我正在尝试根据 XSD 架构验证某些 XML 输入。解析器可以工作，但是当我 Hook 模式时，出现以下异常。我已经使用外部 validator 验证了测试输入，所以我已经消除了它。有谁知道如何设置一
Java, XML DocumentBuilder - 解析时设置编码
我正在尝试将包含 XML 文档的树(扩展 JTree)保存到已更改其结构的 DOM 对象。我已经创建了一个新的文档对象，遍历树并成功检索了内容(包括 XML 文档的原始编码)，现在有一个 ByteA
java - DocumentBuilder.parse() 线程安全吗？
是标准的Java 1.6 javax.xml.parsers.DocumentBuilder类线程安全吗？从多个线程并行调用 parse() 方法是否安全？ JavaDoc 没有提到这个问题，但 Ja
java - DocumentBuilder 中 setNamespaceAware 的用途是什么？
谁能告诉我应该在什么情况下将 setNamespaceAware 设置为 true 或 false 根据文档指定由此代码生成的解析器将提供对 XML 命名空间的支持。但是，如果我将其设置为 true
java - 使用 DocumentBuilder 解析 InputStreamReader
我的 Java 经验很少。我试图强制将文档读取为 UTF-8，但在尝试将 InputStream 阅读器连接到文档生成器时遇到了困难。这是我到目前为止所拥有的: import javax.xml.x
java - DocumentBuilder 中的 parse 方法返回错误
我正在尝试使用采用 InputSource 的 parse 方法来解析 DocumentBuilder 实例。错误是: The method parse(InputStream) in the ty

首页

博学

6Ren·AI

商城

java - DocumentBuilder tagName 根本问题