java - tExtractJsonFields Talend，使用正则表达式按长度将列分成多列-6ren

java - tExtractJsonFields Talend，使用正则表达式按长度将列分成多列

转载作者：行者123 更新时间：2023-11-30 11:15:35

29

4

我的作业有一个来自 xml 文件的无限制列，该列的长度可以超过 4000 个字符，但是，这是 Oracle varchar 列的最大长度。我需要能够使用 Talend 中的 tExtractRegexFields 组件将每 3000-4000 个字符的列分隔到一个单独的列中。

但是，我不擅长正则表达式，遇到了一些麻烦。

文本的格式一般是这样的:

"<p>#Principal Responsibilities: </p>
<p>INSERT EXTREMELY LONG DESCRIPTION HERE</p>"

我试过用这样的东西:

"([a-zA-Z0-9]{0,4000})"

但我运气不好，它只捕获了 1 个单词。

作业是这样设置的:

tFileInputXML------>tExtractRegexFields----->tMap------tOracleOutput

我知道我缺少的是一些简单的东西，但我就是想不通是什么!

最佳答案

您需要捕获的不仅仅是字母数字字符。试试“([.]{0,4000})”，假设 Talend 接受句号表示任何字符，那应该可以为您提供所有信息。或者，您可以接受“([a-zA-Z0-9 ]{0, 4000})”(注意空格)，这应该让您得到不止一个单词，但在第一个标点符号之后可能什么也没有。

关于java - tExtractJsonFields Talend，使用正则表达式按长度将列分成多列，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/25328589/

29

4

0

文章推荐： javascript - 嵌套和链接(撰写)之间有什么区别吗

文章推荐： java - 如何比较对象数组的值？

文章推荐： java - 将实体从库引用到 JPA 中的另一个库

talend - Talend 中的交易
我想在 Talend 中写入数据库时执行事务，但不知道如何执行。我尝试了调色板中的各种组件，但无法执行。我将不胜感激任何与此主题相关的帮助甚至更好的教程。谢谢! 最佳答案 Talend 支持在写
talend - 根据 Talend 中的条件跳过组件
我有一个场景，我想根据条件跳过要执行的组件并在 Talend 中运行其连续组件。有可能吗？最佳答案您有两个选项可用于有条件地执行部分工作。条件检查之后的组件可以是起始组件(如果将其拖放到 Ca
talend - 如何在 Talend 的列中选择不同的值
我正在 Talend 中导入 Excel 文件。我想选择“A”列中的所有不同值，然后将该数据转储到数据库中。使用 Talend 可以做到这一点吗？如果没有，有哪些可用的替代方案。感谢任何帮助最佳答案
talend - 如何在 Talend 中实现 tLoop？
我是 Talend 的新手，需要一个示例作业来实现 tLoop。如果失败，我想运行 10 次作业。我查看了文档，但我似乎无法弄清楚这一点。最佳答案这个答案有两个部分使用 tJava 创建循环重
talend - 如何在 Talend 中实现 tLoop？
我是 Talend 的新手，需要一个示例作业来实现 tLoop。如果失败，我想运行 10 次作业。我查看了文档，但我似乎无法弄清楚这一点。最佳答案这个答案有两个部分使用 tJava 创建循环重
talend - Talend 中的公共(public)日志记录
我试图在 Talend 中实现日志记录。所以我使用普通组件做了一份工作，我通过 Twarn 和 Tdie 记录了错误、信息和调试。使用 Logcatcher ，我将日志分为调试和错误两个文件。这部分工
talend - 如何在 Talend Open Studio 中记录任务进度？
我有一些示例作业可以将数据从一个数据库迁移到另一个数据库，我想了解一些有关当前进度的信息，例如从应用程序本身交互式运行作业时的信息(我从命令行导出并运行它) )。我使用 flowMeter 和 st
talend - 如何在 Talend 中使用 tFileExist 组件？
使用 Talend，我想验证是否存在名为 ListePS.xls 的文件在我的 D:/做一些治疗别的没什么。如何检查 Talend 中是否存在文件？最佳答案您必须使用组件 tFileExist
talend - 如何在 Talend 的“代码”选项卡中显示行号？
每当我单击“代码”选项卡查看 Talend 作业的 Java 代码时，我都看不到行号。是否有任何设置可以启用行号？最佳答案您可以从首选项启用行号如果您按照此面包屑导航，您将看到显示行号的参数 -
talend - 如何与 Talend 中的 joblet 共享数据库连接
我有一个带有 tMSSqlConnection 设置的作业，并且我需要与 joblet 共享该连接。我在网上找到了说明，说将其注册为共享连接，然后在具有该连接名称的 joblet 组件的动态设置中添加
talend - 如何在 Karaf 中为 Talend-ESB 运行时容器设置默认上下文？
我正在努力了解 Talend ESB (SE) 运行时的部署架构。目前我只有一个容器，一切都在路由的默认上下文中运行。这对于 PoC 和开发非常有用，但是当我们进入测试和生产部署时，我希望为不同的环
talend - 与 Talend 相关的 .ini 和 .properties 文件有什么区别？
.properties 文件扩展名用于通过 Talend 中的文件加载上下文变量。在 tFileProperties 中，在选择参数文件的文件格式时，我们有一个下拉列表 .properties 和 .
talend - 我无法在 Mac OS 上安装 Talend open studio
我无法在 Mac OS 上安装 Talend open studio。错误 - TOS_BD-macosx-cocoa 可执行启动程序无法找到其同伴共享库。最佳答案您只需在 TOS 二进制文件文件
hadoop - 将作业从 talend DI 导出到 talend big data
我是 talend ETL 工具的新手。我已经在 talend DI(数据集成)工具中创建了作业工作流，现在我想使用 hadoop 切换/实现相同的作业，因为我正在使用 talend 大数据工具。谁能
svn - 从放在 SVN 上的 talend studio 导出 Talend 项目并从 Jenkins 构建它
您好，我正在使用 talend open studio 5.5。我想导出 talend 作业并放入 SVN。它包含以下文件。1)工艺一).items b).属性我想从中构建 talend 作业并创
java - Talend Open Studio 和 Eclipse - 将源代码从 eclipse 链接到 talend open studio 并将作业导出为测试
是否可以将 Talend Open Studio 与 Eclipse 结合使用。我想将我的 eclipse 开发(资源)直接作为源代码链接到 talend 并在其中使用我的类。我想做的是，写例如Ta
business-intelligence - Talend Open Studio for Data Integration 与 Talend Open Studio for Big Data 的区别
我对 Talend 提供的不同产品感到困惑。看来Talend Open Studio for Data Integration和 Talend Open Studio for Big Data是相同
java - Talend : Set up talend 5. 6.1 在 macosx 上使用 java 1.7 jdk
使用 Talend Big Data Studio。尝试使用 Neo4jConnection 版本 2.x.x，显示错误“组件需要 Java 1.7” 我在 .bash_profile 中设置了 JA
talend - 在talend中将文件拆分为更多文件
我正在寻找一种如何根据实际文件行在 talend studio 中拆分作业执行的方法 - 我想处理一个作业分支中以“DEBUG”开头的文件行和另一个作业分支中的另一行。那可能吗？最佳答案为此，请使
Talend 作业部署
我是 Talend Open Studio 的新手，我想在 Macbook 或 Windows PC 上开发一个作业，然后导出该作业并将其作为计划作业(即 cron)在 Linux 服务器上运行。这

首页

博学

6Ren·AI

商城

java - tExtractJsonFields Talend，使用正则表达式按长度将列分成多列