gpt4 book ai didi

python - 如何在 r 或 python 中查找并突出显示彼此一定范围内的值簇?

转载 作者:太空宇宙 更新时间:2023-11-03 21:20:13 26 4
gpt4 key购买 nike

我有一个数字列表(全部大于 10,000,000),并且我想查找彼此 5,000,000 以内的数字簇(这些数字对应于曼哈顿中的列)基因 SNP 突变图)。

有没有办法对列表进行聚类分析,以便我可以在其中写入一个文件: If [i]+1 < [i]+5,000,000

它会突出显示文件中的那些值吗?我现在将其作为 Excel 文件,但可以更改格式。谢谢。

最佳答案

您将在这里得到几个潜在的答案。我喜欢 data.table 包,因为它速度快并且有许多有用的内置运算符。在这种情况下,我们可以使用shift()参数来比较观察i和观察i + 1。您可以将其分解为多个步骤,但将所有逻辑合并到一行中如下所示:

library(data.table)

set.seed(1)
dt <- data.table(int = sample(10000000:100000000, 10000, replace = TRUE))

dt[, highlight := ifelse(shift(int,n = 1, type = "lead") < int + 5000000, "highlight", "no highlight")]
#show how many rows fit our criteria defined above
table(dt$highlight)
#>
#> highlight no highlight
#> 5524 4475

reprex package于2019年1月24日创建(v0.2.1)

关于python - 如何在 r 或 python 中查找并突出显示彼此一定范围内的值簇?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54345230/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com