gpt4 book ai didi

etl - 使用pentaho水壶下载文件

转载 作者:行者123 更新时间:2023-12-02 21:53:31 24 4
gpt4 key购买 nike

我正在尝试创建一个可以通过 HTTP 下载多个文件的作业。这些文件的列表位于 MySQL 表中。我通过以下步骤创建了一个主要作业:开始、设置变量、FILELIST(我创建的转换)、下载(我创建的作业)和成功。

转换 FILELIST 包含以下步骤:表输入和将行复制到结果(此转换与数据库通信并向主任务提供 URL 列表)。任务 DOWNLOAD 包含以下步骤:开始、http、成功(此任务应将文件下载到我的计算机)。

这一切都不起作用,为什么?有人知道更好的方法来做同样的事情吗?

最佳答案

我希望您具备 Kettle 的基本知识。因此,从数据库获取某些内容的列表可能不是问题。我猜你一直在让 Kettle 下载并保存所有这些文件 - 有效地运行一个循环。

下载文件的步骤是“HTTP”,仅在“作业”中可用。因此,诀窍是为每个文件执行一个作业(包含下载的 HTTP 步骤),或者使用 Kettle-lingo“为每一行执行”。 URL 作为从字段设置的参数传递到下载作业中。

如果这对您没有帮助,请查看以下链接,我将在其中更详细地介绍如何实现这一壮举(这是一种壮举 - 但它不应该是一项壮举):

http://www.joyofdata.de/blog/batch-downloading-files-with-pentaho-kettle/

关于etl - 使用pentaho水壶下载文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18144625/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com