gpt4 book ai didi

sql - 如何在小组内订购。在 hive 中额外使用concate_ws和collect_set

转载 作者:行者123 更新时间:2023-12-02 20:48:19 25 4
gpt4 key购买 nike

我有这种格式的数据
出于安全原因,我在短语栏中添加了****。这基本上是一个聚会的句子。
Data

这是1个特定ID的有序对话。

我想达到这个结果:
再次***代替句子。
result

我用来实现此查询:

select tmp.interaction_id,collect_set(tmp.final) from
(select interaction_id,concat_ws(':-- ',party,phrase) as
final,start_offset,end_offset from aads_piim.A608232_Myvoice_wt_transcript
where interaction_id=26951370
order by start_offset,end_offset) as tmp
group by tmp.interaction_id;

在这里,我能够执行此操作,因为我仅排序1个ID。然后正确地安排对话。像代理商和客户顺序。
我有大约40万条这样的记录。我想为他们做类似的事情。
我为此使用的查询是:
create table aads_piim.a608232_myvoice_transcript_combined as
select tmp.interaction_id,collect_set(tmp.final) as final_trans from
(select interaction_id,concat_ws(':-- ',party,phrase) as
final,start_offset,end_offset from aads_piim.A608232_Myvoice_wt_transcript
order by start_offset,end_offset) as tmp
group by tmp.interaction_id;

但是这里在排序时会考虑所有ID。
我的问题是如何在IDS中排序。表示在我的情况下,如何针对该特定ID按ID分组并按偏移量列排序。

最佳答案

首先按interact_id排序,然后按偏移量排序。

select interaction_id,concat_ws(':--  ',party,phrase) as final,start_offset,end_offset  
from aads_piim.A608232_Myvoice_wt_transcript
order by interaction_id,start_offset,end_offset

关于sql - 如何在小组内订购。在 hive 中额外使用concate_ws和collect_set,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47045486/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com