java - 如何使用 Apache Daffodil 的 DataProcessor.unparse() 方法来重建原始解析消息？-6ren

java - 如何使用 Apache Daffodil 的 DataProcessor.unparse() 方法来重建原始解析消息？

转载作者：行者123 更新时间：2023-12-02 01:24:41

我是 Apache Daffodil 的初学者。

我使用 Daffodil Java API 成功将输入文本消息解析为 XML 字符串，即

        Compiler dfdlCompiler = Daffodil.compiler();
        dfdlCompiler.setValidateDFDLSchemas(true);
        File schemaFile = this.getFileFromResources("EDIFACT-SupplyChain-D03B/EDIFACT-SupplyChain-Messages-D.03B.xsd");
        ProcessorFactory processorFactory = dfdlCompiler.compileFile(schemaFile);
        DataProcessor dataProcessor = processorFactory.onPath("/");
        java.io.File file = getFileFromResources("TestData/ORDERS_D.03B_Interchange.txt");
        java.io.FileInputStream fis = new java.io.FileInputStream(file);
        InputSourceDataInputStream dis = new InputSourceDataInputStream(fis);
        JDOMInfosetOutputter outputter = new JDOMInfosetOutputter();
        ParseResult parseResult = dataProcessor.parse(dis, outputter);
        Document doc = outputter.getResult().getDocument();
        XMLOutputter xo = new XMLOutputter(org.jdom2.output.Format.getPrettyFormat());
        String xmlString = xo.outputString(doc);

        System.out.println("parsed text... resulting xmlString=" + xmlString);

但是，现在，我不清楚如何使用 unparse() 方法来重构原始文本消息(似乎缺乏使用 Daffodil 的 Java API 进行解解析以重构原始消息的示例)。

试试这个:

        SAXBuilder builder = new SAXBuilder();
        Document d2 = builder.build(new StringReader(xmlString));
        JDOMInfosetInputter inputter = new JDOMInfosetInputter(d2);
        WritableByteChannel output = Channels.newChannel(new DataOutputStream(new ByteArrayOutputStream()));
        UnparseResult result = dataProcessor.unparse(inputter, output);

如何提取原始消息？或者说，这种做法不正确吗？

Apache Daffodil 版本:2.3

Java版本:jdk8+

<小时/>

使用这个精简的 Java 应用程序进行测试...

import java.io.ByteArrayOutputStream;
import java.io.DataOutputStream;
import java.io.File;
import java.io.IOException;
import java.io.StringReader;
import java.net.URL;
import java.nio.channels.Channels;
import java.nio.channels.WritableByteChannel;
import org.jdom2.Document;
import org.jdom2.output.XMLOutputter;

import org.apache.daffodil.japi.Compiler;
import org.apache.daffodil.japi.Daffodil;
import org.apache.daffodil.japi.DataProcessor;
import org.apache.daffodil.japi.ParseResult;
import org.apache.daffodil.japi.ProcessorFactory;
import org.apache.daffodil.japi.UnparseResult;
import org.apache.daffodil.japi.infoset.JDOMInfosetInputter;
import org.apache.daffodil.japi.infoset.JDOMInfosetOutputter;
import org.apache.daffodil.japi.io.InputSourceDataInputStream;
import org.jdom2.input.SAXBuilder;

public class Blah2 {

    public static void main(String[] args) throws IOException, Exception {
        Blah2 b = new Blah2();
        b.process();
    }

    private void process() throws IOException, Exception {

        Compiler dfdlCompiler = Daffodil.compiler();
        dfdlCompiler.setValidateDFDLSchemas(true);
        File schemaFile = this.getFileFromResources("EDIFACT-SupplyChain-D03B/EDIFACT-SupplyChain-Messages-D.03B.xsd");
        ProcessorFactory processorFactory = dfdlCompiler.compileFile(schemaFile);
        DataProcessor dataProcessor = processorFactory.onPath("/");
        java.io.File file = getFileFromResources("TestData/ORDERS_D.03B_Interchange.txt");
        java.io.FileInputStream fis = new java.io.FileInputStream(file);
        InputSourceDataInputStream dis = new InputSourceDataInputStream(fis);
        JDOMInfosetOutputter outputter = new JDOMInfosetOutputter();
        ParseResult parseResult = dataProcessor.parse(dis, outputter);
        Document doc = outputter.getResult().getDocument();
        XMLOutputter xo = new XMLOutputter(org.jdom2.output.Format.getPrettyFormat());
        String xmlString = xo.outputString(doc);

        System.out.println("parsed text... resulting xmlString=" + xmlString);

        SAXBuilder builder = new SAXBuilder();
        Document d2 = builder.build(new StringReader(xmlString));
        JDOMInfosetInputter inputter = new JDOMInfosetInputter(d2);
        WritableByteChannel output = Channels.newChannel(new DataOutputStream(new ByteArrayOutputStream()));
        UnparseResult result = dataProcessor.unparse(inputter, output);

        System.out.println("unparsed xml document.. result.toString()=" + String.valueOf(result));        

        //how can I obtain the original input text???
    }

    private File getFileFromResources(String fileName) throws IOException {
        URL resource = this.getClass().getClassLoader().getResource(fileName);
        return new File(resource.getFile());
    }
}

解析操作的输出如下。

(我仍然不明白如何完成相反的操作 - 即“解析”)

parsed text... resulting xmlString=<?xml version="1.0" encoding="UTF-8"?>
<D03B:Interchange xmlns:D03B="http://www.ibm.com/dfdl/edi/un/edifact/SupplyChain/D03B">
  <UNB>
    <S001>
      <E0001>UNOA</E0001>
      <E0002>4</E0002>
    </S001>
    <S002>
      <E0004>APPLICATION</E0004>
      <E0007>1</E0007>
    </S002>
    <S003>
      <E0010>COMPANY</E0010>
      <E0007>1</E0007>
    </S003>
    <S004>
      <E0017>20051107</E0017>
      <E0019>1159</E0019>
    </S004>
    <E0020>6002</E0020>
  </UNB>
  <D03B:Message>
    <UNH>
      <E0062>SSDD1</E0062>
      <S009>
        <E0065>ORDERS</E0065>
        <E0052>D</E0052>
        <E0054>03B</E0054>
        <E0051>UN</E0051>
        <E0057>EAN008</E0057>
      </S009>
    </UNH>
    <D03B:BadMessage>
      <Segment>
        <Name>BGM</Name>
        <Data>2B3232302B424B4F4439392B39</Data>
      </Segment>
      <Segment>
        <Name>DTM</Name>
        <Data>2B3133373A32303035313130373A313032</Data>
      </Segment>
      <Segment>
        <Name>NAD</Name>
        <Data>2B42592B353431323334353030303137363A3A39</Data>
      </Segment>
      <Segment>
        <Name>NAD</Name>
        <Data>2B53552B343031323334353030303039343A3A39</Data>
      </Segment>
      <Segment>
        <Name>CTA</Name>
        <Data>2B4141</Data>
      </Segment>
      <Segment>
        <Name>COM</Name>
        <Data>2B7331313A41412A7332313A41412A7333313A4141</Data>
      </Segment>
      <Segment>
        <Name>LIN</Name>
        <Data>2B312B312B303736343536393130343A4942</Data>
      </Segment>
      <Segment>
        <Name>QTY</Name>
        <Data>2B313A3235</Data>
      </Segment>
      <Segment>
        <Name>FTX</Name>
        <Data>2B41464D2B312B2B4C6F7264206F66207468652052696E6773</Data>
      </Segment>
      <Segment>
        <Name>LIN</Name>
        <Data>2B322B312B303736343536393039303A4942</Data>
      </Segment>
      <Segment>
        <Name>QTY</Name>
        <Data>2B313A3235</Data>
      </Segment>
      <Segment>
        <Name>FTX</Name>
        <Data>2B41464D2B312B2B54686520486F62626974</Data>
      </Segment>
      <Segment>
        <Name>LIN</Name>
        <Data>2B332B312B313836313030343635363A4942</Data>
      </Segment>
      <Segment>
        <Name>QTY</Name>
        <Data>2B313A3136</Data>
      </Segment>
      <Segment>
        <Name>FTX</Name>
        <Data>2B41464D2B312B2B5468652053696C6D6172696C6C696F6E</Data>
      </Segment>
      <Segment>
        <Name>LIN</Name>
        <Data>2B342B312B303539363030363735363A4942</Data>
      </Segment>
      <Segment>
        <Name>QTY</Name>
        <Data>2B313A3130</Data>
      </Segment>
      <Segment>
        <Name>FTX</Name>
        <Data>2B41464D2B312B2B546865204368696C6472656E206F6620487572696E</Data>
      </Segment>
      <Segment>
        <Name>UNS</Name>
        <Data>2B53</Data>
      </Segment>
      <Segment>
        <Name>CNT</Name>
        <Data>2B323A34</Data>
      </Segment>
    </D03B:BadMessage>
    <UNT>
      <E0074>22</E0074>
      <E0062>SSDD1</E0062>
    </UNT>
  </D03B:Message>
  <UNZ>
    <E0036>1</E0036>
    <E0020>6002</E0020>
  </UNZ>
</D03B:Interchange>

unparsed xml document.. result.toString()=org.apache.daffodil.japi.UnparseResult@2e734540

最佳答案

UnparseResult实际不包含解解析的结果(是的，也许我们可以更好地命名它；)。 UnparseResult实际上只包含解解析是否成功(通过 isError 方法)以及失败时的任何诊断。解解析数据写入WritableByteChannel您传递给 unparse()作为参数。

问题是，在您的情况下，您可以使用以下内容来定义该 channel :

WritableByteChannel output = Channels.newChannel(new DataOutputStream(new ByteArrayOutputStream()));

因此，您定义的 channel 将写入底层 ByteArrayOutputStream ，但您无权访问这些字节，因为它没有分配给变量。所以你真正想做的是分配一个 ByteArrayOutputStream到一个变量并将其传递给您的新 channel ，然后在解解析后访问字节数组 - 如下所示:

ByteArrayOutputStream boas = new ByteArrayOutputStream();
WritableByteChannel output = Channels.newChannel(new DataOutputStream(boas));
UnparseResult result = dataProcessor.unparse(inputter, output);
System.out.println(boas.toString());

此外，我们的 Java API 测试还提供了一些有关 Daffodil Java API 使用的好资源:

https://github.com/apache/incubator-daffodil/blob/master/daffodil-japi/src/test/java/org/apache/daffodil/example/TestJavaAPI.java

其中包含使用 ByteArrayOutputStream 和 WritableByteChannel 来解析字节并转换为字符串的示例。

关于java - 如何使用 Apache Daffodil 的 DataProcessor.unparse() 方法来重建原始解析消息？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57116200/

文章推荐： java - MVVM架构中从存储库插入数据后无法切换到MainActivity

文章推荐： scala 泛型函数 `not found: type ?`

文章推荐： entity-framework - 我可以在 EF6 中使用外键来唯一约束吗？

文章推荐： java - 如何在HiveMQ Client中获取客户端的QoS？

Oracle 更改索引/重建
如果我使用 alter index x rebuild 重建不可用的索引，是否会重新评估之前使用该索引的任何 SQL 的执行计划？我知道在我使用的数据库版本 - Oracle 10.2.0.4.0
从校准的相机图像进行 3d 重建
我正在研究 3d 重建。现在当我考虑一对图像时。我有一组对应点。我有我的相机详细信息。例如我有焦点细节，旋转和平移矩阵(4 * 4)。我想在 3D(三角剖分)中投影我的点。因此，据我所知，因子代数非常
python - 重建:为什么不扭曲图像并标准化坐标？
从教程中:https://programtalk.com/vs2/?source=python/8176/opencv-python-blueprints/chapter4/scene3D.py 我不
opencv - 2d图像到3d(重建)
我需要您的帮助和建议。这个问题包括以下几项:某房间的照片，该房间站在严格固定位置的房间内(一个房间围绕轴线旋转)。如何将所有这些图片组合在一起，从而产生一种效果，就像我们用眼睛看到的一样？从一点开始就
c - 重建/更新内核模块
嘿那里，以下问题:我在工作中使用一个相当奇怪的 Linux 发行版(Centos 5)，它似乎有一个较旧的内核(或者至少在内核中存在一些差异)，并且您不能简单地更新它。我需要安装的程序需要一个函数 c
statistics - 受限玻尔兹曼机 - 重建
我读了一些关于受限玻尔兹曼机的文章。这些机器的重建能力经过了测试。我了解训练是如何进行的，但不了解重建是如何完成的。有人可以给我一些提示吗？最佳答案杰夫·辛顿 (Geoff Hinton) 的演讲
ios - 重建/重置核心数据时出错
如果轻量级迁移失败，我将尝试重建核心数据数据堆栈，并将用户送回登录屏幕。我正在通过将一对多关系更改为一对一关系来对此进行测试。起初，我在删除新的 persistentStoreCoordinator
MySQL索引操作命令总结（创建、重建、查询和删除索引命令详解）
以下所列示例中中 `table_name` 表示数据表名，`index_name` 表示索引名，column list 表示字段列表（如：`id`,`order_id`）。 1、创建索引索引的
Flutter - 避免 ListView 重建
当您根据 ListView.builder 和 ListView.separated valueKey = key; return _messages
flutter - 切换页面时防止谷歌地图 flutter 重建
切换底部导航页面后，我有一个非常烦人的谷歌地图 flutter 重建问题。我已经坚持了最后一次缩放和相机位置，但是每次我进入 map 页面时，小部件都会自行重建。如何预防？最佳答案采用 Autom
python - 重建 Pandas 数据框
我是 Python 的新手。我在重建一个错误的 Dataframe 时遇到了麻烦。我的数据框如下所示: df = pd.DataFrame({'col1': ['id 1', 'id 2', 'tes
MATLAB:使用八点算法进行 3d 重建
我正在尝试从 2 个图像中实现 3d 重建。我遵循的步骤是， 1. Found corresponding points between 2 images using SURF. 2. Impleme
javascript - 重建 Json 列表
// Start with this JSON var initialJson = { "rows": [{ "ID": 123, "Data": 430910, "Ver
flutter - 有条件地停止 child 重建
在有状态的小部件中，我有一个导航部分，用户可以在其中选择父项，并在子项下方显示。当我选择父级也可以重建子部件时，但是当我导航抛出父项而不选择一个子部件时，父级也可以重建(这是正常的)，但是子部件也可
3d - 脸部 3D 重建
我有一个网络摄像头，它可以围绕人的头部以给定的角度步长旋转，并为每一步获取一张图片。我正在寻找一个免费的开源库，该库从获取的图像集开始，使我能够生成代表人头部的 3D 表面，或者至少是定义明确的 3
csv - 重建 CSV 并使用字段值作为导出的文件名
我想从一行中读取一个字符串，然后将其放入一个变量中，该变量随后用作文件名。该字符串位于 .csv 文件中的第二行末尾。由于不必要的标题，需要删除第一行。还有‘;’旧 .csv 文件中使用的内容需要替换
haskell - 嵌入文件更改后的 Cabal 重建
我正在使用file-embed如此封装: import qualified Data.ByteString as B import qualified Data.ByteString.Internal
c - 重建 makefile 即使它是最新的
我的 makefile 总是重建，不明白为什么.. 这里是: SRC = $(DIR)/my_getnbr.c \ $(DIR)/my_isneg.c \ $(DI
java - 重建 Eclipse 编辑器
我有一个附带编辑器的 Eclipse 插件。我添加了更改语法突出显示颜色的首选项，但这些更改仅在我手动重新启动编辑器后才适用。我通过一个 DefaultDamagerRepairer 实现了语法高
jquery - 重建 DIV id
我有一段 php 可以输出 div(取决于数组中有多少个)并为该 div 分配一个 id(即 div_1、div_2)等我还设置了一个隐藏字段，其中包含输出了多少个 div 的计数(divcount

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

java - 如何使用 Apache Daffodil 的 DataProcessor.unparse() 方法来重建原始解析消息？