SQL 在单个表上执行 INNER JOIN 的替代方法-6ren

SQL 在单个表上执行 INNER JOIN 的替代方法

转载作者：可可西里更新时间：2023-11-01 07:05:49

24

4

我有一个大表 (TokenFrequency)，其中有数百万行。结构如下的 TokenFrequency 表:

表 - TokenFrequency

id - 整数，主键
来源 - 整数，外键
token - 字符
计数 - 整数

我的目标是选择其中两个源具有相同标记的所有行。例如，如果我的表看起来像这样:

id --- source --- token --- count
1 ------ 1 --------- dog ------- 1
2 ------ 2 --------- cat -------- 2
3 ------ 3 --------- cat -------- 2
4 ------ 4 --------- pig -------- 5
5 ------ 5 --------- zoo ------- 1
6 ------ 5 --------- cat -------- 1
7 ------ 5 --------- pig -------- 1

我想要一个 SQL 查询来为我提供源 1、源 2 和计数总和。例如:

source1 --- source2 --- token --- count
---- 2 ----------- 3 --------- cat -------- 4
---- 2 ----------- 5 --------- cat -------- 3
---- 3 ----------- 5 --------- cat -------- 3
---- 4 ----------- 5 --------- pig -------- 6

我有一个如下所示的查询:

SELECT  F.source AS source1, S.source AS source2, F.token, 
       (F.count + S.count) AS sum 
FROM       TokenFrequency F 
INNER JOIN TokenFrequency S ON F.token = S.token 
WHERE F.source <> S.source

这个查询工作正常，但我遇到的问题是:

我有一个包含数百万行的 TokenFrequency 表，因此需要更快的替代方法来获得此结果。
我目前的查询是重复的。例如它的选择:
source1=2, source2=3, token=cat, count=4
source1=3, source2=2, token=cat, count=4
这不是什么大问题，但如果有办法消除这些问题并反过来提高速度，那将非常有用

我遇到的主要问题是查询速度，我当前的查询需要几个小时才能完成。我认为是问题所在。我确信必须有一种方法来消除内部连接并仅使用 TokenFrequency 表的一个实例就可以获得类似的结果。我提到的第二个问题也可能会促进查询速度的提高。

我需要一种方法来重组此查询，以更快、更高效的方式提供相同的结果。

谢谢。

最佳答案

我需要更多信息来诊断速度问题，但要删除重复项，请将其添加到 WHERE:

AND F.source<S.source

关于SQL 在单个表上执行 INNER JOIN 的替代方法，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/1246965/

24

4

0

文章推荐： mysql - 事务MySQL

文章推荐：带标签的 MySQL 全文 bool 搜索

java - 为什么 `Outer.Inner inner = o.new Inner();` 不是 `Outer.Inner inner = o.new Outer.Inner();` ？
class Outer { class Inner { } } public class Demo { public static void main(
mysql - 为什么 "t1 inner join t2"和 "t1 inner join t3"快，但 "t1 inner join t2 inner join t3"慢 265 倍？
我在我的 PC 上使用 bitnami WAMP 创建了一个 mysql 服务器，并使用流畅的 SQL 创建了两个表 table_a 和 table_b: CREATE TABLE `table_a`
mysql - 使用第二个 INNER JOIN 或在第二个 INNER JOIN 之前对两个表进行 INNER JOIN 的 SQL
select sld.linkid,sld.accept,scd.catid,scd.catname,scd.caturl,scd1.parentcatid from sound_li
java - 为什么在 Outer.Inner obj2 = new Outer<>().new Inner() 中使用菱形运算符失败？虽然与 Inner 相同可以吗？
为什么在实例化通用外部类(连同内部类)时使用菱形运算符会在代码段 2 中产生错误，而代码段 1 却完全没问题？我知道稀有类型是被禁止的，但我的情况不是稀有类型——在稀有类型中，外部和内部都是通用的，
sql - 如果我明确想要 INNER JOIN，省略 INNER 关键字是否安全？
这不是那么重要(请注意)，但它是一个语法特殊性，它是关于可移植性的，我没有找到引用可靠资源或规范的问题(或答案)，所以我很好奇: 省略 INNER 是否安全关键字，如果我明确想要 INNER JOIN
sql - INNER JOIN 与 INNER JOIN (SELECT . FROM)
同一查询的这两个版本之间的性能有什么区别吗？ --Version 1 SELECT p.Name, s.OrderQty FROM Product p INNER JOIN SalesOrderDet
php - Inner Join WITH 和 inner join ON 有什么区别？
阅读 Doctrine 2 文档时 at this page我可以看到他们有两种方法来指定内部连接的条件: // Example - $qb->expr()->innerJoin('u.Group',
java - Class.inner 类还是类 Instance.inner 类？
我想知道我怎么能直接从外部类型到达内部类，就好像它是一个静态成员一样: public class Hello { public class UnderHello { v
Java 泛型 : why can't inner interface implement from a (inner) superinterface?
我有一个这样的界面: public interface SuperInterface { public interface SubInterface { public void
postgresql - INNER JOIN USING 和 INNER JOIN ON 之间是否存在性能差异？
假设有两个表: students (student_id INT, class_id INT); instructors (instructor_id INT, class_id INT); 这两者之
sql-server - "Sub SELECT before INNER JOIN"还是 "WHERE after INNER JOIN"？
有表 A 和表 B。我想将这些表连接到两列，但仅限于表 A 的选定行。查询场景: SELECT B.* FROM B INNER JOIN (SELECT * FROM A WHERE A.COLU
sql-server - 什么时候应该使用 INNER -LOOP- JOIN 而不是 INNER JOIN
今天我了解了SQL Server中的一个东西，叫做INNER LOOP JOIN . 这是什么意思？ (谷歌没有提供帮助……或者我应该说……有关它的博客文章有点……技术性，让我大吃一惊)。此外，在哪
mysql - SQL:特定情况下 INNER JOIN 和 INNER SELECT 之间的区别
我开始学习 SQL。而且我发现我们经常可以在 JOIN 或内部选择语句的帮助下获得相同的结果。问题 1(广泛):JOIN 在哪里比内部选择更快，反之亦然？问题 2(窄):您能解释一下是什么导致了以
php - MySQL INNER JOIN 3 个表，还可以使用 INNER JOIN 进行删除
我真的很努力地完成这项任务，因此非常感谢任何帮助或指导。表格: module_uploads +--------------------------+
mysql - 仅当 INNER JOIN 记录存在时才在 INNER JOIN 上添加 sql 语句条件
仅当连接表中存在记录时，我才尝试根据连接表中的条件从用户表中选择一行。如果记录不存在，我想返回该行。我只想在存在 INNER JOIN 记录且 contact_blocked != 1 时不返回该行。
MySQL 在 INNER JOIN 中使用 INNER JOIN 和 CASE WHEN 选择
我有一个包含字符的数据库。由于角色的名称不仅在名称与角色分开时才使用。由于有 Male 和 Female 字符，我将它们保存在不同的表中: tbl_player, tbl_maleName, tbl_
css - HTML/CSS : How to have a container's scrollbar control the scroll of an inner-inner div?
[决定如何表述问题并不容易...] 这是一个 example jsfiddle . 紫色的 div ('#inner') 高 1000 像素。如何制作红色 div ('#out') 的滚动条 - 控
php - Wordpress 查询添加 INNER/LEFT JOIN。为什么或如何删除/防止 INNER/LEFT JOIN？
我正在为 wordpress 中的帖子开发一个过滤器，它使用来自 postmeta 的数据:我的日期过滤器正在运行并给我这个查询: 工作查询结果: SELECT SQL_CALC_FOUND_ROWS
html -
with float right inner inner
元素只能与一个
一起使用。为什么？
我有使用引导类并动态添加带有引导类和 clearfix 的元素 var li = $("").addClass("list-group-item clearfix"); var div = $(
java - 创建名称为 'Test_flow' : Cannot create inner bean '(inner bean) 的 bean 时出错
我已经为 Test_flow 创建了简单的测试套件，但是当我尝试运行该流程时出现错误。 java.lang.RuntimeException: org.mule.api.config.Configur

首页

博学

6Ren·AI

商城

SQL 在单个表上执行 INNER JOIN 的替代方法