gpt4 book ai didi

python - 从 python 脚本读取大型 hdfs 文件

转载 作者:可可西里 更新时间:2023-11-01 14:46:58 27 4
gpt4 key购买 nike

我有一个 python 脚本需要处理一个大文件。如果我减少原始文件并运行脚本,代码可以正常工作,但是当我在原始数据上运行脚本时,我的脚本需要永远执行。我正在考虑使用 HDFS 来存储文件并从 python 脚本中读取它。但是为了使用 HDFS,我是否必须将我的 python 脚本转换为 map reduce 程序,或者我是否可以使用相同的代码。

最佳答案

您需要调整 Python 代码然后使用 Hadoop Streaming处理它。这正是流式传输所针对的情况类型。

关于python - 从 python 脚本读取大型 hdfs 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31524443/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com