gpt4 book ai didi

apache-spark - 是否可以将HDFS上的tar.gz文件解压缩并将其放在其他HDFS文件夹中,而无需将其带到本地系统

转载 作者:行者123 更新时间:2023-12-02 20:20:48 25 4
gpt4 key购买 nike

我里面有employee_mumbai.tar.gz文件,我有name.json和salary.json。
tar.gz位于HDFS位置。是否可以将gzip文件解压缩/解压缩并将json文件放在HFDS文件夹中,而无需将其放入本地文件系统。
N.B:
请记住,它不是文本文件,也不是json文件的唯一信息。

请让我知道是否也可以直接在不同的数据框中分别读取两个文件。

最佳答案

这对我有用:

hdfs dfs -cat /data/<data.gz> | gzip -d | hdfs dfs -put - /data/ 

关于apache-spark - 是否可以将HDFS上的tar.gz文件解压缩并将其放在其他HDFS文件夹中,而无需将其带到本地系统,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60631524/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com