- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有矢量 A
和 B
.向量长度 A
是 12。向量的长度 B
是 23。
A <- c(125,195,322,421,65,102,85,98,88,176,300)
B <- c(62,138,124,78,117,84,148,91,71,112,137,102,65,102,85,98,88,176,150,78,72,68,102)
A
中找到最长的值序列满足这一点:它们是连续的,它们在 60 到 180 之间。在这个例子中,这个序列是:
A.selected <- c(65,102,85,98,88,176)
B
中找到第一行对于其中存在与
A.selected
具有最高重合度的值序列(与
A.selected
的长度相同) .我认为这样做是这样的:
# First, I create different vectors of `B` of the same length (`5` in this example) than `A.selected` starting from the first row in `B`:
B_1 <- c(B[1],B[2],B[3],B[4],B[5],B[6])
B_2 <- c(B[2],B[3],B[4],B[5],B[6],B[7])
B_3 <- c(B[3],B[4],B[5],B[6],B[7],B[8])
. . . .
. . . .
. . . .
B_13 <- c(B[13],B[14],B[15],B[16],B[17],B[18])
. . . .
. . . .
# Second, I estimate the strength of the correlation between `A.selected` and the different combinations of `B` (`B_1`,`B_2`,...,`B_13`,`B_14`, etc) using the Pearson's correlation coefficient (`R²`). I also calculated the `P-value` of this correlation to be sure is significant.
mod1 <- cor.test(A.selected,B_1)
mod2 <- cor.test(A.selected,B_2)
mod3 <- cor.test(A.selected,B_3)
. . . .
. . . .
. . . .
mod13 <- cor.test(A.selected,B_13)
coef.mod1 <- c(as.numeric(mod1[4]),as.numeric(mod1[3])) # R² and P-value of the 1st correlation
coef.mod2 <- c(as.numeric(mod2[4]),as.numeric(mod2[3])) # R² and P-value of the 2nd correlation
coef.mod3 <- c(as.numeric(mod3[4]),as.numeric(mod3[3])) # R² and P-value of the first correlation
. . . .
. . . .
. . . .
coef.mod13 <- c(as.numeric(mod4[4]),as.numeric(mod4[3])) # R² and P-value of the first correlation
# I find the model with the highest R², but considering also that the `P-value` has to be lower than `0.05`.
Models.dataframe <- data.frame(R2 = c(coef.mod1[1],coef.mod2[1],coef.mod3[1],0.38,0.65,0.13,0.26,-0.34,0.76,0.48,0.32,0.42,coef.mod13[1]),
P.value = c(coef.mod1[2], coef.mod2[2], coef.mod3[2], 0.38, 0.65, 0.13, 0.26, 0.84, 0.26, 0.48, 0.32, 0.42, coef.mod13[2]))
rownames(Models.dataframe[which.max(Models.dataframe$R2) & Models.dataframe$P.value <= 0.05,])
"13" # In row 13 in `B` starts the sequence of numbers that have the highest overlap with the sequence `A.selected`
A
和
B
有几十万的长度,所以我需要一个代码来自动完成所有这些。
最佳答案
实现步骤 1 的方法有点麻烦:
根据OP的评论编辑:
library(tidyverse)
get_consecutive_grps <- function(x) {
runlengths <- rle(x) %>% .$lengths
map2(runlengths, 1:length(runlengths), ~ rep(..2, ..1)) %>% unlist()
}
tmp <-
enframe(A) %>%
mutate(
sel = between(value, 60L, 180L),
idx = get_consecutive_grps(sel)
) %>%
group_by(idx) %>%
mutate(
idx_cnt = row_number()
)
longestrun <- filter(tmp, sel) %>% pull(idx_cnt) %>% max()
longestidx <- filter(tmp, sel, idx_cnt == longestrun) %>% pull(idx)
# It's possible that there are several selected sequences of the same length;
# use the first one
A.selected <- filter(tmp, idx == longestidx[1]) %>% pull(value)
get_Bs <- function(start_idx, length, vec) {
vec[start_idx:(start_idx + length - 1)]
}
offset <- 1:(length(B) - length(A.selected))
Bs <-
map_dfc(offset, get_Bs, length = length(A.selected), vec = B) %>%
setNames(str_c("Bidx_", offset)) %>%
mutate(relpos = row_number()) %>%
select(relpos, everything())
# Rearrange data and calculate correlations with `A.selected`
B_corr <-
Bs %>%
pivot_longer(
cols = -relpos,
names_to = "Bidx",
names_prefix = "Bidx_"
) %>%
pivot_wider(
id_cols = Bidx,
values_from = value,
names_from = relpos,
names_prefix = "relpos_"
) %>%
nest(B_snippits = starts_with("relpos")) %>%
mutate(
corr = map(B_snippits, ~ cor.test(A.selected, as.numeric(..1))),
corr_tidy = map(corr, broom::tidy)
) %>%
unnest(corr_tidy)
# Get B-index for highest correlation
B_corr %>%
filter(estimate == max(B_corr$estimate), p.value <= 0.05) %>%
pull(Bidx)
# ==> "13"
关于r - 如何使用 R 中的自动过程(即 for 循环等)查找向量之间特定值序列的匹配行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61119644/
如果我声明了类似的类型 type test(NSIZE) integer, len :: NSIZE real :: dummy(NSIZE) contains procedure,
我知道这是一个不太可能的事情,但是由于“选项私有(private)模块”的限制,甚至更糟糕的“私有(private)子/函数”的限制,有谁知道是否有一种方法可以从 Excel 应用程序隐藏 VBA 过
我有两个表,property 和 component。 component.id_property = property.id。 我正在尝试创建一个过程,该过程对所选属性的组件进行计数,如果所选属性没
我有一份报告,它是在 SSRS 2005 中开发的,我正在使用存储过程从数据库中获取结果。报告输出的结果非常简单,如下图所示。 如果假设我正在寻找不同的成员 例如:- MemberID c108 c
我需要一个通用函数/过程,该函数/过程将根据提供的数据计算出我的淡入淡出时间和值,如下所示: 我将字节值保存在字节数组中:这些是起始值。然后,我在其他数组中存储了一些值:这些将是新值。然后我有时间要提
我想在界面的多个按钮上创建相同的操作。是否只能通过创建单独的操作监听器方法并调用执行操作的方法才可行,还是还有其他方法?是否可以将按钮放在一个组中并执行以下操作:- groupButton.setOn
我有以下情况: procedure Test; begin repeat TryAgain := FALSE; try // Code // Code if this an
我正在尝试执行以下操作;假设我在 Oracle 中创建了一个对象类型 create type test as object( name varchar2(12), member procedure p
问题: 如果可能的话,如何声明一个用于任何类型参数的函数 T其中 T 的唯一约束是它被定义为 1D array如 type T is array ( integer range <> ) of a_r
我正在尝试创建这个 mysql 过程来制作一个包含今年所有日期和所有时间的表(以一小时为间隔。) CREATE TABLE FECHAS ( created_at datetime ); CREA
所以, 我在这里面临一个问题,这让我发疯,我认为这是一个愚蠢的错误,所以我不是 MySQL 的新手,但它并不像我想象的那样工作。 尝试将此语句部署到 MySQL 后,我收到此错误: ERROR 106
我有一个架构,其中包含星球大战中的人物列表、他们出现的电影、他们访问的行星等。这是架构: CREATE DATABASE IF NOT EXISTS `starwarsFINAL` /*!40100
我一直在为一家慈善机构创建一款应用程序,允许家庭在节日期间注册接收礼物。数据库组织有多个表。下面列出了这些表(及其架构/创建语句): CREATE TABLE IF NOT EXISTS ValidD
正如上面标题所解释的,我正在尝试编写一个sql函数来按日期删除表而不删除系统表。我在此消息下方放置了一张图片,以便直观地解释我的问题。任何帮助将不胜感激!感谢您的时间! 最佳答案 您可以通过查询INF
DELIMITER $$ CREATE PROCEDURE INSERT_NONE_HISTORY_CHECKBOX() BEGIN DECLARE note_id bigint(20); F
是否可以编写一个存储过程或触发器,在特定时间在数据库内部自动执行,而无需来自应用程序的任何调用?如果是,那么任何人都可以给我一个例子或链接到一些我可以阅读如何做到这一点的资源。 最佳答案 查看 pgA
我需要创建一个过程:1)从表中的字段中选择一些文本并将其存储在变量中2) 更新相同的记录字段,仅添加 yyyymmdd 格式的日期以及过程中的附加文本输入...类似这样的... delimiter /
好的,这就是我想做的: 如果条目已存在(例如基于字段name),则只需返回其id 如果没有,请添加 这是我迄今为止所管理的(对于“如果不存在,则创建它”部分): INSERT INTO `object
以下是我编写的程序,用于找出每位客户每天购买的前 10 件商品。 这是我尝试过的第一个 PL/SQL 操作。它没有达到我预期的效果。 我使用的逻辑是接受开始日期、结束日期以及我对每个客户感兴趣的前“x
我正在尝试在MySQL中创建一个过程那insert week s(当年)发送至我的 week table 。但存在一个问题,因为在为下一行添加第一行后,我收到错误: number column can
我是一名优秀的程序员,十分优秀!