gpt4 book ai didi

azure - 使用 Azure 数据工厂删除 Excel 文件中的特定行

转载 作者:行者123 更新时间:2023-12-03 04:55:22 26 4
gpt4 key购买 nike

我在 ADLS 中有一组 excel 文件。该格式类似于以下格式:

enter image description here

前 4 行始终是文档标题信息,最后 3 行将是 2 个空行和文档指示符的末尾。员工信息的行数是不确定的。我想使用 ADF 删除前 4 行和最后 3 行。

任何人都可以帮助我了解派生列/选择中应该包含哪些表达式吗?

最佳答案

我的 Excel 文件:

ExcelFile

源数据集设置(在范围内指定 A5 并选择第一行作为标题): SourceDataSetProperties

确保刷新源数据集中的架构。 Schema

架构刷新后,如果您预览源数据,您将看到第 5 行中的所有行。这也将包括我们可以在数据流中过滤的页脚。

Preview接下来,使用以下表达式添加过滤器转换

  !startsWith(sno,'dummy') && sno!=''

这将过滤掉以虚拟开头的行,在您的情况下,即文档结尾。此外,我们通过检查 sno!='' 来忽略空行

过滤后的最终预览:

Preview After Filtering footer

关于azure - 使用 Azure 数据工厂删除 Excel 文件中的特定行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/69987579/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com