gpt4 book ai didi

apache-spark - Spark 解码和解压 gzip 嵌入的 base 64 字符串

转载 作者:行者123 更新时间:2023-12-03 21:26:09 28 4
gpt4 key购买 nike

我的 Spark 程序读取一个包含编码为 64 的 gzip 压缩字符串的文件。我必须解码和解压缩。
我使用 spark unbase64 解码并生成字节数组

bytedf=df.withColumn("unbase",unbase64(col("value")) )

spark中是否有任何可以解压缩字节码的spark方法?

最佳答案

我写了一个udf

def decompress(ip):

bytecode = base64.b64decode(x)
d = zlib.decompressobj(32 + zlib.MAX_WBITS)
decompressed_data = d.decompress(bytecode )
return(decompressed_data.decode('utf-8'))



decompress = udf(decompress)
decompressedDF = df.withColumn("decompressed_XML",decompress("value"))

关于apache-spark - Spark 解码和解压 gzip 嵌入的 base 64 字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46347118/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com