gpt4 book ai didi

mySQL:查找两列之间最常见的值

转载 作者:行者123 更新时间:2023-11-29 22:58:58 25 4
gpt4 key购买 nike

我正在使用两个表:目标表有 mid、gid,miRNA 表有 mid、miRNA_name。 (mid 是 miRNA 的 ID,gid 是基因的 ID)。

我想列出受共同调控基因最多的前 10 个 miRNA。每行应该有 miRNA id #1、miRNA name #1、miRNA id #2、miRNA name #2 以及共同基因的数量。

目标表例如:

mid    gid
1 1
1 297
1 305
2 198
2 209
3 209
3 297

miRNA 表例如:

mid      name
1 hsa-miR-4711
2 hsa-miR-36
3 hsa-miR-54

我想我需要按 mid 对两个表进行分组,然后按 gid 排序。有了这个,我应该找到哪些 mids 具有共同的 gid,并按照 select 子句中指定的方式列出它们以及共同基因的数量(计数 gid)。

到目前为止,我有以下内容,但我不确定这是否是正确的方法。任何帮助将非常感激。先感谢您! :)

SELECT m.mid, m.name, n.mid, n.name, COUNT (*)
FROM (SELECT mid, gid FROM miRNA JOIN targets USING (mid)) as m
AND (SELECT mid, gid FROM miRNA JOIN targets USING (mid)) as n
WHERE COUNT(*)>1
GROUP BY gid
LIMIT 10;

输出应如下所示:

mid1    name1          mid2     name2         count
1 hsa-miR-4711 3 hsa-miR-54 297
2 hsa-miR-36 3 hsa-miR-54 209

最佳答案

只是为了确认...您只关心最有共同点的两个 miRNA 条目。因此,本质上,将 miRNA #1 与 miRNA #2 的所有 gID、miRNA #3 的 gID 等进行比较。

如果 m#7 有 7 个与 m#58 相同的基因组 ID,并且 m#23 有 6 个与 m#49 相同的基因组 ID,等等...下游,但 m#7 也可能有 5 个与 m#58 相同的基因组 ID m#38。如果是这样,您的此示例列表将显示类似

miNRA7  (17's name)   miNRA 58  (58's name)   7
miNRA23 (23's name) miNRA 49 (49's name) 6
miNRA7 (17's name) miNRA 38 (38's name) 5

如果是这种情况,我会进行连接的自连接以获得合格的连接,然后获取名称。我会确保您的 TARGETS 表作为 ( gid, mid ) 上的索引作为一个索引,而不是两个单独的索引。

select
TopPairs.mid,
m1.name as NRAName1,
TopPairs.AltMID,
m2.name as NRAName2,
TopPairs.PairCount
from
( select
t1.mid,
t2.mid as AltMID,
count(*) as PairCount
from
Targets t1
JOIN Targets t2
t1.gid = t2.gid
AND t1.mid < t2.mid
group by
t1.mid,
t2.mid
having
count(*) > 1
order by
count(*) DESC
limit 10 ) TopPairs
JOIN miRNA m1
on TopPairs.mid = m1.mid
JOIN miRNA m2
on TopPairs.AltMID = m2.mid

与“t2”别名(第二个实例)的 JOIN 首先显式地在匹配的 gID 上进行,但仅适用于 t2.mid 大于 t1.mid 的 gID。这样 #1 就会与 #2、#3、#4 等进行比较,但永远不需要将 #2、#3 或 #4 与 #1 进行比较,因为它们已经完成了。

只有在基因组比较完成并且您拥有有限列表之后,才会连接到命名的 miNRA 表以获取输出的显式名称。如果您扔掉 30 万个基因组比较并保留 10 个,则无需获取这些详细信息。获取 10 个,然后加入。

关于mySQL:查找两列之间最常见的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28594043/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com