sql - BigQuery 中交叉联接后的行聚合-6ren

sql - BigQuery 中交叉联接后的行聚合

转载作者：行者123 更新时间：2023-12-03 23:10:01

24

4

假设您在 BigQuery 中有下表:

A = user1 | 0 0 |
    user2 | 0 3 |
    user3 | 4 0 |

交叉连接后，您有

dist = |user1  user2  0 0 , 0 3 |  #comma is just showing user val seperation
       |user1  user3  0 0 , 4 0 |
       |user2  user3  0 3 , 4 0 |

如何在 BigQuery 中执行行聚合来计算跨行的成对聚合。作为典型的用例，您可以计算两个用户之间的欧几里德距离。我想计算两个用户之间的以下指标:

sum(min(user1_row[i], user2_row[i]) / abs(user1_row[i] - user2_row[i]))

对每对用户的所有 i 求和。

例如，在 Python 中，您只需:

for i in np.arange(row_length/2)]):
dist.append([user1, user2, np.sum(min(r1[i], r2[i]) / abs(r1[i] - r2[i]))])

最佳答案

从丑陋的方式开始:您可以将数学压平到查询中。也就是转 for i in ... sum(min(...)/abs(...))进入对每个字段进行操作的 SQL。请注意MIN和SUM是您不想使用的聚合函数。而是使用+对于 SUM 和 IF(a < b, a, b)对于 MIN 。 ABS(a, b)看起来像 IF(a < b, b-a, a-b) 。如果您只是计算欧几里得距离，您可以这样做

SELECT left.user, right.user, 
  SQRT((left.x-right.x)*(left.x-right.x) 
     + (left.y-right.y)*(left.y-right.y) 
     + (left.z-right.z)*(left.z-right.z)) as dist 
FROM (
    SELECT * 
    FROM dataset.table1 AS left 
    CROSS JOIN dataset.table1 AS right)

更好的方法是用户定义函数，并将向量创建为重复值。然后你可以写一个 DISTANCE()对交叉连接左侧和右侧的两个数组执行计算的函数。如果您尚未加入 UDF 测试版计划并想加入，请联系 Google 云支持。

最后，如果您将架构从 {user:string, field1:float, field2:float, field3:float,...} 更改为至{user:string, fields:[field:float]}

然后，您可以用位置展平该字段并对其进行交叉连接。如:

SELECT
  user,
  field,
  index,
FROM (FLATTEN((
  SELECT  
    user,
    fields.field as field,
    POSITION(fields.field) as index,
  from [dataset1.table1]
), fields))

如果将其另存为 View ，请将其命名为“dataset1.flat_view”

然后您就可以加入:

SELECT left.user as user1, right.user as user2,
       left.field as l, right.field as r,
FROM dataset1.flat_view left
JOIN dataset1.flat_view right 
ON left.index = right.index
WHERE left.user != right.user

这将为每对用户和每个字段匹配字段提供一行。您可以将其保存为 View “dataset1.joined_view”。

最后，您可以进行聚合:

既然你想要这个:

sum(min(user1_row[i], user2_row[i]) / abs(user1_row[i] - user2_row[i]))

它看起来像:

SELECT user1, user2, 
    SUM((if (l < r, l, r)) / (if (l > r, l-r, r-l))
FROM [dataset1.joined_view] 
GROUP EACH BY user1, user2

关于sql - BigQuery 中交叉联接后的行聚合，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29565007/

24

4

0

文章推荐： google-chrome - Chrome 开发工具中的网络选项卡停止记录请求

文章推荐： sql - 通过选择其他表中的另一列来插入一列，但如何填充第二列

具有空值的多个字段的 SQL 联接
我有一张维护要求表和相关的每月执行频率维护 +----------+------+ | maint_id | freq | +----------+------+ | 1 | 6
在最近的可用日期进行 SQL 联接
我目前有这些表: CREATE TABLE #SECURITY_TEMP (ID CHAR(30)) CREATE TABLE #SECURITY_TEMP_PRICE_HISTORY (ID CHA
具有空值的多个字段的 SQL 联接
我有一张维护要求表和相关的每月执行频率维护 +----------+------+ | maint_id | freq | +----------+------+ | 1 | 6
sql - 在同一张表上进行子查询/联接
我有一个如下所示的表格表tbl_veh VIN Record DateChange 11223344 123A 6/24/2012 11223344
CakePHP:ContainableBehavior 查询结构/联接
我的应用程序的数据模型群组有很多用户用户所属组用户有很多打卡冲床属于用户冲床属于PayPeriod PayPeriod hasMany Punch 找电话 $groups = $this->
c# - LINQ、联接、分组和聚合
使用 Join 或 GroupJoin，是否有任何方法可以为父表和子表中的字段生成聚合值。给定一个 Orders 表和一个 OrderDetails 表，使用下面的 2 个步骤我可以从 Orders
mysql - 获取表中每个条目组合的公共(public)联接
我有一个包含用户 ID 和用户名的用户表。另一个表有一个兴趣列表，包括兴趣和姓名。第三个表是一个连接表，包含 userid 和interestid。对于每对用户，我想获取他们共同兴趣的数量。我尝试了
mysql - 如何进行以下 MySQL 联接？
假设我有下表: 表A a_name | age | country Jordan | 5 | Germany Molly | 6 | Spain Paris | 7 | France John | 7
c# - 如何执行行为与物理数据库内部联接完全一样的 LINQ 联接？
数据源是 CSV 文件的集合，因此没有实际的数据库。这是与日本已有数十年历史的遗留系统的集成。我有一个 c# 函数需要将 2 个 DataTables 和 2 个列名作为参数。我的函数需要对这两个数
elasticsearch - Elasticsearch 联接/脚本查询，使用子查询的输出
我有一种情况要在具有数据的elasticsearch中编写搜索查询，如下所示 {id:"p1",person:{name:"name",age:"12"},relatedTO:{id:"p2"}} {
php - 创建映射和索引时如何在Elastic Search PHP中创建批量父子关系(联接)
我想创建具有父子关系的文档。我有如下数据 parent_id = null的父文档数据 { "id": 1, "work
c# - LINQ to SQL - 联接、分组和求和
我有以下按预期工作的 SQL: SELECT p.ACCT_ID AS [Acct], a.ACCT_NAME AS [AcctName], p.PD_NO AS [Period],
jpa - 如何使用自定义 "on"条件进行 CriteriaBuilder 联接？
我想使用 CriteriaBuilder 在连接 2 个表的位置进行查询。在 MySQL 中，我尝试进行的查询如下所示: SELECT * FROM order LEFT JOIN item ON o
java - hql 与 @CollectionTable 联接
使用带有collection标签的域Service，如下所示: @Entity public class Service extends AbstractEntity { private st
Mysql 将表 A 的多个列与另一个表 B 联接
我有一个解决方案，通过连接同一个表两次，但我想知道以下查询是否可以优化？ select oc.name as father_occupation, o.name as mother_occupatio
sql - Oracle 联接(左外、右等。:S )
我知道除了知道什么是“最喜欢的编程卡通”之外，stackoverflow 会对我有所帮助:P 这是接受的答案: Bill Karwin 感谢大家的帮助(我想给你们加倍投票) 我的查询结果是这样的(这是
对表 B 范围内的表 A 值进行 SQL 联接
我有两个表格，可以在附图中看到。表 A 包含部门、月份和平均。表 B 包含月份、年份、RangeStart、RangeEnd 和颜色。如果您查看表 B 的屏幕截图，您将看到每个月都有绿色、黄色
c# - Linq to Sql Count Include 联接
我有一个 Linq to sql 如下: var members=db.Members.Include(x=> x.Contact).Count(); 现在由于一些错误的数据，我的成员中的所有联系人都
php - SQL:如何在 SQL 中过滤 (WHERE) 联接 (ON) 表？
我有两个表(用户和帖子)，我想写出一个用户的所有帖子(以及其他内容)。我想我应该使用 JOIN 和 WHERE，但我在使用 WHERE 时遇到错误。这是我的代码: SELECT username,
orm - EclipseLink 生成笛卡尔计划而不是 SQL 中的(内部)联接。为什么？
在 Hibernate 是我的持久性提供者的项目中，我可以使用“join fetch”表达式发出查询，Hibernate 将生成反射(reflect)该内容的 SQL:包含使用有效比较路径的联接表达式

首页

博学

6Ren·AI

商城

sql - BigQuery 中交叉联接后的行聚合