R中有条件的滚动计算-6ren

R中有条件的滚动计算

转载作者：行者123 更新时间：2023-12-01 09:08:39

26

4

我有一个数据表，例如:

 CurrOdo        Lat            NextLat       PrevODO        NextOdo
 2.62           30.01115868   30.01115868           
 5.19           30.01116407   30.01116407       
 7.61           30.01116919   30.01116919       
18.82                         30.01119282     7.61        19.06
19.06           30.01119282   30.01119282       
19.35           30.01119339   30.01119339       
20.54                         30.01122998     19.35       81.5
20.81                         30.01122998     20.54       81.5
37.38                         30.01122998     20.81       81.5
81.5            30.01132238   30.01132238   

atable<-data.table(odo = c(2.62,5.19,7.61,18.82,19.06,19.35,20.54,20.81, 37.38,81.5 ), 
Lat = c(30.01115868,30.01116407,30.01116919,NA,30.01119282,30.01119339,NA,NA, NA, 30.01132238),
NextLat=c(30.01115868,30.01116407,30.01116919, 30.01119282, 30.01119282,30.01119339, 
30.01122998,30.01122998,30.01122998,30.01122998 ),
PrevLat=c(NA,NA,NA, NA, NA,NA, NA,NA,NA,NA ),
PrevODO=c(NA,NA,NA, 7.61, NA,NA, 19.35,20.54,20.81,NA ),
NextOdo=c(NA,NA,NA, 19.06, NA,NA, 81.5,81.5,81.5,NA ))

Lat 值是基于此公式的滚动计算:

纬度:(NextLat- PrevLat) * ((CurrODO - PrevODO)/(NextODO - PrevODO)) + PrevLat

如何计算 Lat 的示例

Row CurrODO 18.82:   (30.01119282- 30.01116919) * (( 18.82 - 7.61) / (19.06 - 7.61)) + 30.01116919
Row CurrODO 20.54:  (30.01122998- 30.01119339) * ((  20.54 - 19.35) / (81.5 - 19.35)) + 30.01119339
Row CurrODO 20.81:   (30.01122998- Lat calc result from 20.54 row) * ((20.81 - 20.54) / (81.5 - 20.54)) + Lat calc result from 20.54 row
Row CurrODO 37.38:   (30.01122998- Lat calc result from 20.81 row) * (( 37.38 - 20.81) / (81.5 - 20.81)) + Lat calc result from 20.81 row

最终结果是:

CurrOdo     Lat             NextLat         PrevODO     NextOdo
2.62        30.01115868     30.01115868             
5.19        30.01116407     30.01116407             
7.61        30.01116919     30.01116919             
18.82       30.0111923247   30.01119282      7.61        19.06  
19.06       30.01119282     30.01119282             
19.35       30.01119339     30.01119339             
20.54       30.0111940906   30.01122998      19.35       81.5   
20.81       30.0111942496   30.01122998      20.54       81.5   
37.38       30.0112040049   30.01122998      20.81       81.5   
81.5        30.01132238     30.01132238

我目前正在 SQL Server 中循环运行它，但这需要很长时间。我也可以将它与 R 放在一个循环中，但是它在大型数据集上表现不佳。我已经坚持了好几天了，所以感谢您的帮助!

最佳答案

我的回答涉及一个重复循环，虽然你说“没有循环”，但我没有看到任何其他方式(当然可能有，这是 R ;-))。< br/>虽然循环应该执行得非常快，但在我的系统上，它需要大约一秒钟的时间来填充 1000 万行的 NA(参见基准测试)。

Lat 的输出与问题中所需的输出匹配。

旁注:
如果您的第一个 Lat 值为 NA，您可能会遇到问题。
因为 PrevLat 在第一行总是 NA，所以 Lat 的第一行 NA 永远不会被重新计算，循环也永远不会中断。
您(当然)可以在循环中构建逃生路线/中断以防止这种情况发生。我保留了这一点，以保持示例的可读性和简短性。

repeat{
  #until there are no more NA in Lat
  if( sum( is.na( atable$Lat ) ) == 0 ){
    break
  }
  #(re)calculate PrevLat
  atable[, PrevLat := shift( Lat, 1, type = "lag" ) ]
  #calculate Lat when PrevLat is known, but Lat is not
  atable[ is.na( Lat ) & !is.na( PrevLat ),
          Lat := (NextLat-PrevLat)*((odo-PrevODO)/(NextOdo-PrevODO))+PrevLat ]
}

#       odo           Lat     NextLat       PrevLat PrevODO NextOdo
# 1:   2.62 30.0111586800 30.01115868            NA      NA      NA
# 2:   5.19 30.0111640700 30.01116407 30.0111586800      NA      NA
# 3:   7.61 30.0111691900 30.01116919 30.0111640700      NA      NA
# 4:  18.82 30.0111923247 30.01119282 30.0111691900    7.61   19.06
# 5:  19.06 30.0111928200 30.01119282 30.0111923247      NA      NA
# 6:  19.35 30.0111933900 30.01119339 30.0111928200      NA      NA
# 7:  20.54 30.0111940906 30.01122998 30.0111933900   19.35   81.50
# 8:  20.81 30.0111942496 30.01122998 30.0111940906   20.54   81.50
# 9:  37.38 30.0112040049 30.01122998 30.0111942496   20.81   81.50
# 10: 81.50 30.0113223800 30.01122998            NA      NA      NA

基准

在 10M 行的 data.table 上(您的 atable 重复了 1M 次)；
在我的系统上(+/- 6 岁的 i5，内存为 16Gb)，循环大约需要一秒钟来计算每个纬度的值。

dt <- atable[rep(atable[, .I], 1000000)]

system.time(
  repeat{
    #until there are no more NA in Lat
    if( sum( is.na( dt$Lat ) ) == 0 ){
      break
    }
    #(re)calculate PrevLat
    dt[, PrevLat := shift( Lat, 1, type = "lag" ) ]
    #calculate Lat when PrevLat is known
    dt[ is.na( Lat ) & !is.na( PrevLat ),
            Lat := (NextLat- PrevLat ) * ((odo - PrevODO) / (NextOdo - PrevODO)) + PrevLat ]
  }
)

# user  system elapsed 
# 0.90    0.35    1.08

session 信息

R version 3.6.1 (2019-07-05)   
Platform: x86_64-w64-mingw32/x64 (64-bit)    
Running under: Windows 10 x64 (build 18362)      

other attached packages:    [1] data.table_1.12.4

update::代码解释

代码的作用:

它用上一行的 Lat 值填充 Prevlat 列
它标识所有 Lat 为 NA 和 PrevLat 具有值(即不不适用)
对于在第 2 步中识别的所有行，根据您提供的函数计算 Lat 的值

重复步骤1到3，直到校验is.na(atable$Lat)的和等于0，当满足这个条件时，就不再有NA-Lat 列中的值...因此我们可以使用 break 退出 repeat 循环。

关于R中有条件的滚动计算，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/58562719/

26

4

0

文章推荐： templates - Codeigniter，如何制作模板

文章推荐： Python:两个正态分布之间的体积(3d)

mysql随机更新两个日期之间的日期列(有条件)
如何在 2014-10-04 - 2014-10-30 仅工作日和 08.00 - 20.00 之间随机更新日期列？ 2014-10-04 - 2014-10-30 random working-da
将二维数组转换为一维数组(有条件)
我有一个二维 (3x7) 数组，我想转换为一维数组，以便我提供的行位于中心。行值可能沿途变化，但必须位于中心。 #define numRows 3 #define numCols 7 #define
Jpa OneToMany 有条件
我有2张 table : 第一个是“人”: person_id, 人名第二个是“PersonsGraphs”: person_id1, person_id2, 关系类型我正在寻找一种建立“家谱”的
java - @JsonIgnore 有条件
是否可以在序列化 JSON 响应的同时根据 If 条件排除某些元素？ if(a == 1) { //show element } else { //don't show element }
java - @JsonIgnore 有条件
是否可以在序列化 JSON 响应的同时根据 If 条件排除某些元素？ if(a == 1) { //show element } else { //don't show element }
javascript - jQuery 有条件
尝试使用 jQuery 编写一个条件，该条件基本上说明，如果 div.gathering 不包含 a.cat-link，则执行以下操作。我已经尝试过以下方法，但似乎不起作用。有人能解释一下吗？ if(
c - 在列表中插入节点的副本(有条件)
该练习要求插入值 x 的副本(这也是要在列表中搜索的值)，但前提是该位置是另一个值 n 的倍数。未指定副本应插入到 x 值之前还是之后。我的问题是并非在所有情况下都插入副本。我认为问题在于，当我插入
c - (有条件？)在函数中创建局部变量
我遇到了这个[问题]:How can I store values into a multi-parameter struct and pass typedef struct to a functio
java - 井字游戏(有条件)
出于某种原因，当我编写 getWinner() 时，它仅适用于 2 种情况(最后一行)。就对角线和列而言，我拥有其他一切，但第 2 行(嗯，三，但数组，所以 2)基本上只适用于 o。只有当 o 位于
MYSQL - 将一列复制到同一个表中的另一列 - 有条件
我有一个问题。我想将“guid”列中的值复制到“帖子内容” 所有行都在一个表“wp-posts”中 “postparent”列中的一行有一个值，而“ID”列中的另一项也有相同的值我必须做的事情是
MySQL - 合并两个表 - 有条件
我想将两个像这样的表合并到一个表中，并为重复的键行添加合并表中最旧的 DateAdded 值。 (Key1,Key2) 是主键。 +-----------+-----------+------+---
mysql - 选择具有最大值的唯一行(有条件)
通过下面的表格和数据，我试图获得最高的 effective_from每个唯一 brand 小于当前时间戳的值/model组合 - 实际上是每件商品的当前价格。 CREATE TABLE things
mysql - 如何删除未知号码的最后一条记录(有条件)？
您能告诉我如何删除未知号码的最后一条记录(有条件)吗？例如，在这种情况下我想删除id为6到10的记录。注意:该表和记录不是恒定的。 +----+-----+---------+ | id | ur
php - 添加时间到mysql时间戳列，有条件
这个问题不太可能对任何 future 的访客有帮助；它只与一个较小的地理区域、一个特定的时间点或一个非常狭窄的情况相关，通常不适用于全世界的互联网受众。如需帮助使此问题更广泛适用，visit the
mysql - 多次计算带有外键的子表，有条件
我有两个表，标签 -> id,name,description,user,status 标签_连接。 -> id, Label_id, 类别所以有多个类别，假设 1 => 新的，2 => 旧的。
java - 将每个单词的第一个字母移动到末尾并添加一个字符，有条件
好的，我会长话短说。这是我的代码 String s = edittextkata.getText().toString(); String[] vowels = {"a","
Linux 查找和替换(有条件)
我有一个非常具体的要求，我发现很难做到，我需要查找并替换文件中的某些行，但问题是文本不同，唯一的好处是它们都有一个 .[扩展名] 例如: 30/07/2012 14:46 17
MongoDB updateMany 有条件
我有一个大型数据库，其中存在各种不一致之处。我想澄清的项目之一是根据人口更改国家/地区状态。数据样本是: { "_id" : "D", "name" : "Deutschland", "pop" :
arrays - 将范围(有条件)中的唯一值组合到另一个范围中
我需要将范围(有条件)中的唯一值组合到同一行的另一个范围中。其实我前两天发过类似的问题Link所提供的答案在我提出上述问题时有效。但后来，我遇到了一个新问题，我宁愿问一个新的问题，让它更清楚: (
VBA - 将字符串中的字符拆分、复制和粘贴到另一个单元格(有条件)
我刚开始使用 VBA，并且正在努力处理需要清理的工作表。我有一列包含混合邮政编码和城市名称的字符串。我想从 A 列中提取邮政编码并放在 B 列中，并在 C 列中提取带有下划线的城市名称。我的(示例

首页

博学

6Ren·AI

商城

R中有条件的滚动计算