gpt4 book ai didi

java - Talend 的 JSON 解析器

转载 作者:行者123 更新时间:2023-11-30 11:46:04 25 4
gpt4 key购买 nike

我需要一些帮助来设计一种在 Talend 作业(Java 作业,而不是 Perl)中解析 JSON 文档的策略。我正在使用 Talend 版本:5.0.2 并在 Mac 上开发,计划在 Linux 机器上运行。

不幸的是,由于我的文件格式,我无法使用 tFileInputJSON 组件——每个文件包含数百个 JSON 文档,一个完整的 JSON 文档在文件中占一行。我认为正确的解决方案是逐行读取文件,然后将其传递到 JSON 解析器,然后从那里将结果发送到作业的其余部分。

在我看来,我的选择是:

a) 将行输入发送到某种 Java JSON 解析器。如果这是我需要采取的策略,我想要一些关于如何处理输出和获取的建议

b) 找到一个解析 JSON 文档的 Talend 组件,但在流程中而不是在有效 JSON 格式的单个文件中。

我四处寻找这个组件,但似乎找不到。根据我的搜索,似乎 tFileInputJSON 组件也相对较新。

我绝对知道这是 Java 可以轻松完成的事情。我的问题是让整个事情在 Talend 框架内同步。

有人对我下一步应该去哪里有什么建议吗?

提前致谢。

最佳答案

您是否尝试过创建自定义例程?您可以在代码(在左侧的存储库窗口中)下执行此操作,右键单击例程并创建您的自定义例程。这使您可以编写一个 Java 函数,然后可以从您的作业中的某个地方调用该函数(tMap、tJava 等)。您可以读取您的输入文件并在每一行/元素或任何您想要的东西上调用一个函数。

与任何 Java 函数一样,该例程随后可以写入文件、打印到屏幕或返回一些列表对象,您可以在另一个 tJava、tJavaFlex、tJavaRow 或您作业中的任何 Talend 组件中进一步处理这些对象。

这可能感觉有点老套,但您可以使用自定义例程做很多事情。

如果您想一路走下去并创建自己的组件,这可能是一个很好的开始方式:http://www.talendforge.org/forum/viewtopic.php?id=17650当然,创建组件要耗费更多时间,但如果您认为您将在多个项目/案例中重用此代码,则可能会有用。

关于java - Talend 的 JSON 解析器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10003100/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com