c# - 解析几乎格式正确的 XML 片段 : how to skip over multiple XML headers-6ren

c# - 解析几乎格式正确的 XML 片段 : how to skip over multiple XML headers

转载作者：数据小太阳更新时间：2023-10-29 02:31:23

26

4

我需要编写一个工具来处理以下格式不正确的 XML 片段，因为它在流的中间包含 XML 声明。

公司已经使用了很长时间的此类文件，因此没有更改格式的选项。

没有可用的源代码来进行解析，新工具的平台选择是 .NET 4 或更新版本，最好使用 C#。

片段是这样的:

<Header>
  <Version>1</Version>
</Header>
<Entry><?xml version="1.0"?><Detail>...snip...</Detail></Entry>
<Entry><?xml version="1.0"?><Detail>...snip...</Detail></Entry>
<Entry><?xml version="1.0"?><Detail>...snip...</Detail></Entry>
<Entry><?xml version="1.0"?><Detail>...snip...</Detail></Entry>

使用 XmlReader与 XmlReaderSettings.ConformanceLevel设置为 ConformanceLevel.Fragment , 我可以阅读完整的 <Header>元素很好。即使是 <Entry>元素开始是可以的，但是在阅读 <Detail> 时信息XmlReader它抛出一个 XmlException ，正如它在 <?xml...?> 中所读它在那个地方不期望的 XML 声明。

除了繁重的字符串操作之外，我还有什么选择可以跳过这些 XML 声明？

由于每个片段很容易超过 100 兆字节，我宁愿不要一次将所有内容加载到内存中。但这就是它所需要的，我对此持开放态度。

我得到的异常示例:

System.Xml.XmlException: Unexpected XML declaration.
The XML declaration must be the first node in the document, and no white space characters are allowed to appear before it.
Line ##, position ##.

最佳答案

我不认为内置类会有帮助；您可能需要做一些准备工作并删除多余的 header 。如果你的样本是准确的，你可以做一个 string.Replace(badXml, "<?xml version=\"1.0\"?>, "")继续前进。

关于c# - 解析几乎格式正确的 XML 片段 : how to skip over multiple XML headers，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/11933440/

26

4

0

文章推荐： XML 动态对象和 IEnumberables

文章推荐： c# - 覆盖现有的 XML 文件(如果它已经存在)

word2vec - skip-gram 和 skip-n-gram 的预训练向量
我正在做一个项目，我需要一个 skip-gram 模型的预训练向量。我听说还有一个名为 skip-n-gram 模型的变体可以提供更好的结果。我想知道自己训练模型需要什么？因为我只需要它们来为我的模
c# - System.Linq.IOrderedQueryable' 在尝试使用 Skip 方法时不包含 'Skip' 错误的定义
我正在尝试实现 EF 提供的分页功能。我以为我只需要将简单的 Skip() 和 Take() 添加到我的查询中，但后来我收到了这条消息: Error 4 'System.Linq.IOrderedQu
c++ - Boost Spirit Qi Re-Establish skipping with custom skip 语法
到目前为止，我有一个语法一直在使用标准的 boost::spirit::ascii::space/boost::spirit::ascii::space_type 船长。我有一些使用船长的规则和一些
exception - 仅 LINQ to Entities 中的排序输入支持方法 'Skip'。方法 'OrderBy' 必须在方法 'Skip' 之前调用
我正在处理动态数据。创建动态模型并在global.asax中注册后，如 DefaultModel.RegisterContext(typeof(masterEntities1),new Contex
c# - 方法 ‘Skip’ 仅支持 LINQ to Entities 中的排序输入。必须在方法 ‘OrderBy’ 之前调用方法 ‘Skip’
在 Visual Studio 2013 Update 1 中使用 Entity Framework 6.0.2 和 .NET 4.5.1 DbContext连接到 SQL Server: 我有一个很
asp.net - 将动态数据添加到现有站点时出错 - 'Skip' 仅支持 LINQ to Entities 中的排序输入。 'OrderBy' 必须在 'Skip' 之前调用
我正在创建一个支持动态数据的 ASP.NET 网站。当我从头开始(从 VS 中的模板)创建动态网站时，一切正常。但是，当我尝试添加动态实体 (.edmx) 文件并运行应用程序时，出现以下错误: “Sk
actionscript-3 - AS3 : Can we skip an optional parameter and assign value to the parameter after the skipped one?
我们可以跳过一个可选参数并为跳过的参数赋值吗？例如我有一个函数: public function Dialog(message:String,title:String="Note",dialogsi
ios - QuerySnapshot 在 Firestore 中运行时出错 - 抛出错误 Skipping epollex because skipping EPOLLEX GRPC_LINUX_EPOLL is not defined
我创建了一个函数来从我的 firestore 集合中提取一个随机文档，然后返回一个 FIRQuery。得到它后，我创建了一个模型文件来解析我的 firestore 文档中的任何 FIRQuery 数据
c++ - 如何修复 "initialization of ' hwndButton' is skipped by 'case' label"and hwndButton' is skipped by 'default' label"
我对编程比较陌生，我想尝试看看如何在 Visual Studio 2019 中制作基本的 Windows 桌面应用程序。由于我为按钮添加了代码，所以 C2360 和 C2361 错误不断弹出，但我没有
Clickhouse:如何在 clickhouse 中使用 `Data Skipping Indexes` 和 `Manipulations With Data Skipping Indices` 功能？
我正在使用 Data Skipping Indexes clickhouse 中的功能，我对它的用法感到困惑。如果我在创建表时添加数据跳过索引，如下所示: CREATE TABLE MyTable (
maven - “-Dmaven.test.skip.exec”与 “-Dmaven.test.skip=true”和 “-DskipTests”有什么区别？
我不确定Maven指令-Dmaven.test.skip.exec和-Dmaven.test.skip=true -DskipTests之间的区别是什么。两者似乎都抑制了测试周期。最佳答案 “mav
c# - 当 skip 不能被 take 整除时，通过 pageIndex/pageSize 分页实现 skip/take 分页
假设我有一些神奇的分页黑盒类，它使用 pageIndex 和 pageSize 检索数据，如下所示: public class PaginatedList { // ... // Ch
ruby-on-rails - --skip-sprockets 和 --skip-javascript 仍然生成 app/assets/javascripts/application.js 吗？
我计划使用 Bowerjs 来管理前端依赖项，并使用 gulp.js 来连接、缩小和编译前端代码。因此，我想跳过 Rails Assets 管道，包括 sprocket。我运行以下命令来跳过 Asse
ruby-on-rails - --skip-sprockets 和 --skip-javascript 仍然生成 app/assets/javascripts/application.js 吗？
我计划使用 Bowerjs 来管理前端依赖项，并使用 gulp.js 来连接、缩小和编译前端代码。因此，我想跳过 Rails Assets 管道，包括 sprocket。我运行以下命令来跳过 Asse
c# - 分页错误 :The method 'Skip' is only supported for sorted input in LINQ to Entities. 方法 'OrderBy' 必须在方法 'Skip' 之前调用
我正在索引页上的 MVC 中进行分页......在这一行我得到了错误 return View( employee.ToPagedList(Page ?? 1,3)); 这里是索引方法 public
python - Skip Connections的科学解释
我正在搜索关于跳过连接的科学工作。每个人都在谈论通过网络改进梯度流，这感觉很有意义。但是我很想理解和阅读归根结底的数学和代码意味着什么以及如何在 tensorflow 中深入实现它。 resnet
antlr - "skip"更改解析器行为
添加 skip规则不符合我的期望。这是由逗号和空格分隔的一对标记的语法。我制作了一个版本，其中逗号标记为 skip ，还有一个不是: grammar Commas; COMMA: '
jupyter笔记本幻灯片: Skip as default
将Jupyter用于幻灯片时，是否有默认方法将幻灯片类型设置为跳过新单元格的？最佳答案我针对您所要求的解决方法。创建一个空的“跳过”幻灯片并键入: 退出 C 伏特伏特伏特复制并粘贴许多空的
SVN更新: 'skipped' message
我正在尝试使用更新 svn update --username myusername https://my.svn.address 但是，我只是收到一条“已跳过”消息？最佳答案我猜你遇到了这种类型
Flash时间线脚本: will they be skipped?
Flash 的 MovieClip 时间轴的创建方式可以跳过帧以保持动画平滑度和音频同步。我的问题是，如果帧上有 ActionScript，是否有可能跳过该帧，从而不调用脚本？或者有脚本的帧永远不

首页

博学

6Ren·AI

商城

c# - 解析几乎格式正确的 XML 片段 : how to skip over multiple XML headers