- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
这是下表
CREATE TABLE IF NOT EXISTS TestingTable1
(
BUYER_ID BIGINT,
ITEM_ID BIGINT,
CREATED_TIME STRING
)
这是上表中的以下数据-
BUYER_ID | ITEM_ID | CREATED_TIME
------------+------------------+-----------------------
1015826235 220003038067 2012-07-09 19:40:21,
1015826235 300003861266 2012-07-09 18:19:59,
1015826235 140002997245 2012-07-09 09:23:17,
1015826235 210002448035 2012-07-09 22:21:11,
1015826235 260003553381 2012-07-09 07:09:56,
1015826235 260003553382 2012-07-09 19:40:39,
1015826235 260003553383 2012-07-09 06:58:47,
1015826235 260003553384 2012-07-09 07:28:47,
1015826235 260003553385 2012-07-09 08:48:47,
1015826235 260003553386 2012-07-09 06:38:47,
1015826235 260003553387 2012-07-09 05:38:47,
1015826235 260003553388 2012-07-09 04:55:47,
1015826235 260003553389 2012-07-09 06:54:37,
34512201 597245693 2012-07-09 16:20:21,
34512201 8071787728 2012-07-09 15:19:59,
34512201 5868222883 2012-07-09 08:23:17,
34512201 2412180494 2012-07-09 22:21:11,
34512201 2422054205 2012-07-09 06:09:56,
34512201 1875744030 2012-07-09 19:40:39,
34512201 5639158173 2012-07-09 06:58:47,
34512201 5656232360 2012-07-09 07:28:47,
34512201 959188449 2012-07-09 08:48:47,
34512201 4645350592 2012-07-09 06:38:47,
34512201 5657320532 2012-07-09 05:38:47,
34512201 290419656539 2012-07-09 04:55:47,
如果你在表中看到上面的数据,只有两个 UNIQUE BUYER_ID
和对应的那些我有 ITEM_ID
和 CREATED_TIME
。每当我为每个 BUYER_ID
触发此查询(即昨天的日期)时,我只需要 10 条基于今天日期前一天时间的最新记录。
所以对于这个 BUYER_ID
- 34512201
我需要 10 条基于昨天 CREATED_TIME
的 BUYER_ID
的最新记录仅限日期。
并且每个 BUYER_ID
都可以有任何一天的数据。但我对今天的数据(总是指昨天的日期)的前一天特别感兴趣,方法是检查 CREATED_TIME
为每个 BUYER_ID
查找昨天日期的 TOP 10
最新数据。下面是我应该得到的与每个 BUYER_ID
相对应的示例输出。
示例输出。
BUYER_ID | ITEM_ID | CREATED_TIME
------------+------------------+-----------------------
34512201 2412180494 2012-07-09 22:21:11
34512201 1875744030 2012-07-09 19:40:39
34512201 597245693 2012-07-09 16:20:21
34512201 8071787728 2012-07-09 15:19:59
34512201 959188449 2012-07-09 08:48:47
34512201 5868222883 2012-07-09 08:23:17
34512201 5656232360 2012-07-09 07:28:47
34512201 5639158173 2012-07-09 06:58:47
34512201 4645350592 2012-07-09 06:38:47
34512201 2422054205 2012-07-09 06:09:56
1015826235 210002448035 2012-07-09 22:21:11
1015826235 260003553382 2012-07-09 19:40:39
1015826235 220003038067 2012-07-09 19:40:21
1015826235 300003861266 2012-07-09 18:19:59
1015826235 140002997245 2012-07-09 09:23:17
1015826235 260003553385 2012-07-09 08:48:47
1015826235 260003553384 2012-07-09 07:28:47
1015826235 260003553381 2012-07-09 07:09:56
1015826235 260003553383 2012-07-09 06:58:47
1015826235 260003553389 2012-07-09 06:54:37
我正在使用 Hive
并且 Hive
支持类似 SQL 的语法。所以我需要确保 SQL 也能在 Hive 环境中工作。
谁能帮我解决这个问题?
更新:-
我正在使用下面的查询,我需要从下面的查询中获取前 10 个最新的查询,并且需要为日期检查添加一个限定符,这意味着在 昨天日期的 where 子句
中 - 我不能使用TOP 10
这里是因为 Hive 不支持 TOP 10
sql 语法。我需要一些其他方法来解决这个问题。
SELECT * FROM TestingTable1 WHERE ORDER BY buyer_id, created_time DESC;
还有一个更新:-
我使用 RANK UserDefinedFunction
编写了下面的查询。
SELECT buyer_id, item_id, created_time, rk
FROM (
SELECT buyer_id, item_id, rank(item_id) as rk, created_time
FROM testingtable1
DISTRIBUTE BY buyer_id, item_id
SORT BY buyer_id, item_id, created_time desc
) a
WHERE rk < 10
ORDER BY buyer_id, created_time, rk;
这是 Java 中的 RANK UDF 函数-
package com.example.hive.udf;
import org.apache.hadoop.hive.ql.exec.UDF;
public final class Rank extends UDF{
private int counter;
private String last_key;
public int evaluate(final String key){
if ( !key.equalsIgnoreCase(this.last_key) ) {
this.counter = 0;
this.last_key = key;
}
return this.counter++;
}
}
上面的查询没有按照我想要的方式工作,我想在那个查询中必须进行某种扭曲。
有没有办法在不使用 HiveQL 中的任何 UDF 的情况下做到这一点?
最佳答案
SELECT FIRST 10 *
FROM TestingTable1
WHERE buyer_id = 34512201
ORDER BY created_time DESC;
关于sql - 查找昨天日期每个 BUYER_ID 的 TOP 10 最新记录,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11405446/
我有一个最大堆和一个最小堆,其中最大堆的最大元素小于或等于最小堆的最小元素。 我现在想移动最小堆的最小元素成为最大堆的最大元素。 一种方法是弹出最小堆的顶部元素并将其插入最大堆。 有没有更有效的方法来
关闭。这个问题需要details or clarity .它目前不接受答案。 想改进这个问题吗? 通过 editing this post 添加细节并澄清问题. 关闭 3 年前。 Improve
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit th
我遇到过几篇(机器学习分类问题)期刊论文提到使用 Top-N 方法评估准确性。数据显示,在相同的训练、测试条件下,Top 1 准确率 = 42.5%,Top-5 准确率 = 72.5%。请问这个top
我是 js 和 vue 的初学者,我正在建立一个网站来自动化我的比萨店交付订单。 我有一个 v-for 浇头列表,客户可以从列表中最多选择 4 个浇头,他可以选择 2、3 或 4 次相同的浇头。 我为
Kubernetes top (kubectl top) 命令显示的内存使用情况与在 pod 内运行的 Linux top 命令不同。 我创建了 k8s 部署,其中 YAML 包含以下内存限制: re
linear-gradient() 的浏览器实现已经发展到支持 top 和 to top 作为 anchor 值。它们是同向还是相反? 最佳答案 它们相反。 to top 在元素底部使用第一个颜色参数
我有一个 HTML 对象: 1:1 但出于某种原因...当我通过以下代码在 jQuery 中访问它的 top 属性时: $tile = $('[data-x=1][data-y=1]');
这是我关于 stackoverflow 的第一个问题,如果我没有做对所有事情,请多多包涵。如果我可以更好地格式化它,请告诉我。 我正在完成 TOP 2nd CSS Margin/Padding 练习。
我正在尝试使我的登录页面与 css 保持一致。但是,我在两个属性 margin-top 和 top 之间遇到了问题。 margin-top倾向于根据第一个元素推送登录页面,而top只是登录页面的位置。
我正在构建一个 jQuery 表单字段验证器,目前我正致力于在 CSS 中构建弹出通知。 问题是,无论 margin 的应用如何,我都无法让 .notification-point 与 .notifi
假设我们有 3 个方法:方法 2 从方法 1 调用,方法 3 从方法 2 调用。方法 2 和 3 的大小均为 30 个字节码。此外,为了确定性,假设方法 2 总是从方法 1 调用一次,而方法 3 总是
我有几千条记录,我需要分批更新它们,每批更新 350 条记录。 我想知道以下两个更新语句是否有任何区别,其中一个是否会运行得更快,使用更少的数据库资源等。 语句1: UPDATE TOP (350)
目前我正在为一个元素开发一个 PSD 设计,在那个设计中,一个部分有一个完全不同的形状来吸引人的外观。 为了创建该形状,我创建了一个 svg 文件并将其用作背景并通过 absolute 属性定位该部分
我有 sticky-top 类的元素侧边栏和 div: .... 当侧边栏是粘性的时候,我需要传递一个边距,因为 sticky-t
我不希望他们处于同一水平。它们都是独立的div。侧边栏是固定的。为什么侧边栏不粘在顶部而不是与文章 div 对齐? body{ margin: 0; padding: 0; } div
似乎最好只为顶级函数创建一次 FunPtr,而不是在需要时创建一个新的函数(同一函数)并处理其释放。 除了 foreign import ccall "wrapper" 之外,我是否忽略了获取 Fun
希望得到一些指点,我有一个问题:我需要向具有 Clusterrole:view 的用户添加什么角色/权限才能让该用户在 kubectl 中使用“top node”和“top pod”命令?我们在 1.
我的情况非常简单: 我有一个名为 FullTextPagina 的表值函数,定义如下: select * from Pagina as p where contains(p.PageText, @te
这个问题已经有答案了: Use variable with TOP in select statement in SQL Server without making it dynamic [dupli
我是一名优秀的程序员,十分优秀!