gpt4 book ai didi

java - Hive UDF 未返回预期结果

转载 作者:行者123 更新时间:2023-12-01 13:42:53 25 4
gpt4 key购买 nike

我编写了一个可由 Hive(查询语言)调用的 UDF,它采用 2 个参数并具有以下逻辑:

如果两个参数都为 null,则返回 null如果一个参数为 null,则返回非 null 值如果传入的参数都不为 null,则返回两个值中较大的一个

我已经编写了代码,编译了类,并成功向 Hive 注册了 JAR。我验证了创建临时函数后我可以在 HIVE 中看到该函数。我遇到的问题是,当我从选择中调用它时,它只返回“_c0”而不是预期值:

这是java类的定义。

package com.ispace.hive.udf;

import org.apache.hadoop.hive.ql.exec.UDF;
import org.apache.hadoop.hive.ql.exec.Description;
import java.util.*;
/*
*
* Compilation on Local box is very environment specific but for the iMac in 2013, this command will compile the class:
* javac -target 1.6 -cp $(ls /usr/local/Cellar/hive/0.12.0/libexec/lib/hive-exec*.jar):/usr/local/Cellar/hadoop/1.2.1/libexec/lib/hadoop-core.jar com/ispace/hive/udf/GreaterOf.java
*
* The above step creates a single .class file that needs to be bundled into a JAR (java archive file)
* To bundle a file or multiple files into a jar, you can run this:
* jar cvf udfcomparer.jar ./com/ispace/hive/udf/GreaterOf.class ./com/ispace/hive/udf/LesserOf.class
*
* To call a UDF, you must add the JAR to your hive session and then create a 'temporary'function as follows:
*
* hive (default)> ADD JAR /Users/calvinimac/Documents/Safezone/Projects/prospect-visual/etl/scripts/ec2-emr/jars/udfcomparer.jar;
* hive (default)> create temporary function inlinemax as 'com.ispace.hive.udf.GreaterOf';
*/

@Description(name = "GreaterOf",
value = "_FUNC_(Integer s, Integer t) - returns the greater value of the two.\n"+
"If both values are null, it will return NULL.\n"+
"If one value is non null, it will return that value if the other is NULL.",
extended = "Example:\n"
+ " > SELECT _FUNC_(column1, column2) FROM src;")

public final class GreaterOf extends UDF {
public Integer evaluate(final Integer s, final Integer t) {
Integer result = null;

if (s == null && t == null) {
result = null;
} else if (s == null) {
result = t;
} else if (t == null) {
result = s;
} else if (s >= t) {
result = s;
} else {
result = null;
}

return result;
}
}

在 Hive 中,我创建了一个占位符表(未使用)创建未使用的表(id bigint)然后我运行这个选择:从未使用的中选择 inlinemax(2,4)

我原本期望得到 4 的结果,但结果却是“c0”。

我的 UDF 是否错误?它是否会处理 Hive null 值作为参数并将它们正确映射到我的 Integer 方法参数中?

最佳答案

未使用的内容中有任何行吗???看起来“_c0”是 Hive 生成​​的派生列名称。要获取任何行,您的查询表中至少需要一行。

关于java - Hive UDF 未返回预期结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20565314/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com