gpt4 book ai didi

regex - 使用 Apache Nifi 提取 HL7 值并应用正则表达式

转载 作者:行者123 更新时间:2023-12-02 13:23:18 26 4
gpt4 key购买 nike

我需要使用 Apache Nifi 从 HL7 XML 文档中提取患者信息,并应用正则表达式从包含嵌入 HTML 的部分中提取诊断结果(是的,抱歉。不是我的设计选择:-( )

HL7 中感兴趣的数据的第一个路径是:

“ClinicalDocument”\“recordTarget”\“患者角色”\“患者”\“姓名”

第二个更复杂的是:

"ClinicalDocument"\"structuredBody"\"component"\"section"\"text @mediaType="text/x-hl7-text+xml"" 其中 的值>title 元素等于“诊断结果”

我需要匹配组件部分标题的子节点文本值的文本,其值为“< em>Diagnostic Results”(诊断结果),然后提取对等节点的文本值text

我的 HL7 XML 片段如下所示:

</ClinicalDocument>
...
<recordTarget>
<patientRole>
....
<patient>
<name><given>John</given><family>Doe</family></name>
...
<structuredBody>
...
<component>
<section classCode="DOCSECT" moodCode="EVN">
<templateId root="0.0.0.0.0.0.1" />
<code code="000-01" codeSystem="0.0.0.1.0.0" />
<title>Diagnostic Results</title>
<text mediaType="text/x-hl7-text+xml">
Some data of interest expressed in n microns.<content ID="NKN_results"/>
</text>

关于如何在 Apache Nifi 中执行此操作有什么建议吗?

最佳答案

您应该能够使用 XPath 和 NiFi EvaluateXPath处理器来匹配和提取 <text>元素。我首先将 StructuredBody 标记作为以下表达式的根:

/structuredBody/component/section[title = 'Diagnostic Results' and text[@mediaType='text/x-hl7-text+xml']]/text

但是您应该能够将其调整为完整的 XML 路径。一旦<text>元素被解析出来,从 NiFi 0.5.0 开始,您可以使用 GetHtmlElement 处理器从嵌入的 HTML 中提取。在 NiFi 0.5.0 之前,如果 HTML 格式良好(例如 XHTML),您可以使用另一个 EvaluateXPath 处理器。

关于regex - 使用 Apache Nifi 提取 HL7 值并应用正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35387047/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com