gpt4 book ai didi

hadoop - 使用java读取存储在hdfs中的excel文件

转载 作者:可可西里 更新时间:2023-11-01 15:25:09 25 4
gpt4 key购买 nike

我正在使用 Java 为 Hive 编写 UDF。我必须读取存储在 hdfs 中的 excel 文件并使用 udf 进行一些处理。我正在使用 poi 库进行处理。

当我们从 hdfs 读取时,我们得到 FSDataInputStream,但是当我们使用 POI 创建工作簿时,它需要 InputStream 对象。
虽然代码在编译时没有给出错误。

FSDataInputStream stream = hdfs.open(new Path(inputFile));
Workbook workbook= new XSSFWorkbook(stream);

但是当我创建临时函数时,我得到:

Execution Error, return code -101 from org.apache.hadoop.hive.ql.exec.FunctionTask. org/apache/poi/ss/usermodel/Workbook

最佳答案

看起来您没有添加所有依赖的 jar。您需要构建具有依赖性的 jar 或一个接一个地添加所有依赖的 jar。

命令:hive> 添加 myjar.jar

关于hadoop - 使用java读取存储在hdfs中的excel文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48684692/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com