gpt4 book ai didi

azure - ADF : data set Row deliminater multiple characters

转载 作者:行者123 更新时间:2023-12-03 06:06:30 25 4
gpt4 key购买 nike

我正在使用 azure 数据工厂来解析 .dat 文件。

每一行都由字符串“TASK”分隔。

示例

尝试 123 ~ 946 任务 34T89YT56 任务 368905T67 任务 365< em>890PT65678

<小时/>

当我进行数据预览时,每次出现字符“T”时都会显示单独的行。有没有办法将行分隔符与字符串值一起使用?

在上面的示例中,我需要以字符串“TASK”开头的三个单独的行

最佳答案

For Copy activity, the single character or "\r\n" used to separate rows in a file.

enter image description here

图像引用: MS 文档 Delimited text properties in ADF .

只能使用单个字符作为行分隔符。这就是原因,即使给出 TASK 作为分隔符,它也会使用 T 作为分隔符。您无法使用复制事件读取带有分隔符的文件作为 TASK。这可以使用映射数据流转换事件来实现。以下是步骤,

  • 使用源数据集进行源转换。将行分隔符指定为 \n,将列分隔符指定为 ,。选择这些分隔符是因为这些分隔符不是数据的一部分。 enter image description here

  • 采用派生列转换,并将列的表达式指定为split(Column_1,'TASK')

enter image description here这将从 column1 数据中生成值数组。

  • 进行展平转换,并将unroll by 的值作为column1 数组给出。

enter image description here

展平变换的输出:

enter image description here

关于azure - ADF : data set Row deliminater multiple characters,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/77261923/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com