r - 为什么 dplyr 删除了不满足条件的值？-6ren

r - 为什么 dplyr 删除了不满足条件的值？

转载作者：行者123 更新时间：2023-12-02 10:38:37

27

4

我正在使用dplyr替换 value与 NA如果满足条件，但它会输入 NA放在不该在的地方。

输出:

df <- structure(list(id = c("USC00231275", "USC00231275", "USC00231275", 
"USC00231275", "USC00231275", "USC00231275", "USC00231275", "USC00231275", 
"USC00231275", "USC00231275"), element = c("TMAX", "TMIN", "TMAX", 
"TMIN", "TMAX", "TMIN", "TMAX", "TMIN", "TMAX", "TMIN"), year = c(1937, 
1937, 1937, 1937, 1937, 1937, 1937, 1937, 1937, 1937), month = c(5, 
5, 5, 5, 5, 5, 5, 5, 5, 5), day = c(1, 1, 2, 2, 3, 3, 4, 4, 5, 
5), date = structure(c(-11933, -11933, -11932, -11932, -11931, 
-11931, -11930, -11930, -11929, -11929), class = "Date"), value = c(0, 
53.96, 68, 44.96, 62.06, 53.96, 73.04, 53.96, 69.08, 50)), .Names = c("id", 
"element", "year", "month", "day", "date", "value"), row.names = c(NA, 
10L), class = "data.frame")

data.frame (注:仅第 1 行和第 2 行满足条件)

            id element year month day       date value
1  USC00231275    TMAX 1937     5   1 1937-05-01  0.00
2  USC00231275    TMIN 1937     5   1 1937-05-01 53.96
3  USC00231275    TMAX 1937     5   2 1937-05-02 68.00
4  USC00231275    TMIN 1937     5   2 1937-05-02 44.96
5  USC00231275    TMAX 1937     5   3 1937-05-03 62.06
6  USC00231275    TMIN 1937     5   3 1937-05-03 53.96
7  USC00231275    TMAX 1937     5   4 1937-05-04 73.04
8  USC00231275    TMIN 1937     5   4 1937-05-04 53.96
9  USC00231275    TMAX 1937     5   5 1937-05-05 69.08
10 USC00231275    TMIN 1937     5   5 1937-05-05 50.00

dplyr

df %>%
  group_by(date) %>%
  mutate(
    value = if(value[element == 'TMIN'] >= value[element == 'TMAX'])
      as.numeric(NA) else value
  )

            id element  year month   day       date value
         (chr)   (chr) (dbl) (dbl) (dbl)     (date) (dbl)
1  USC00231275    TMAX  1937     5     1 1937-05-01    NA
2  USC00231275    TMIN  1937     5     1 1937-05-01    NA
3  USC00231275    TMAX  1937     5     2 1937-05-02 68.00
4  USC00231275    TMIN  1937     5     2 1937-05-02 44.96
5  USC00231275    TMAX  1937     5     3 1937-05-03    NA
6  USC00231275    TMIN  1937     5     3 1937-05-03    NA
7  USC00231275    TMAX  1937     5     4 1937-05-04 73.04
8  USC00231275    TMIN  1937     5     4 1937-05-04 53.96
9  USC00231275    TMAX  1937     5     5 1937-05-05 69.08
10 USC00231275    TMIN  1937     5     5 1937-05-05 50.00

请注意，唯一应该更改的行是 1和2 ，但是dplyr更改行 5和6即使没有满足条件。

最佳答案

下面的代码应该可以完成您想要做的事情

df %>%
  group_by(date) %>%
  mutate(new_value = ifelse( ( (value[element == 'TMIN'] >= value[element == 'TMAX']) & element=='TMIN'), NA, value)) %>%
  ungroup

对于这是否是一个bug的问题，我认为不是。仅查看一年的数据，其中 TMIN >= TMAX，您将得到以下结果

df %>%
  filter(date == '1937-05-01') %>%
  mutate(res = (value[element == 'TMIN'] >= value[element == 'TMAX'])) %>%
  mutate(new_value = ifelse( (res & element=='TMIN'), NA, value))

           id element year month day       date value  res new_value
1 USC00231275    TMAX 1937     5   1 1937-05-01  0.00 TRUE         0
2 USC00231275    TMIN 1937     5   1 1937-05-01 53.96 TRUE        NA

构造 value[element == 'TMIN'] >= value[element == 'TMAX']) 将始终为 true，如 res 中所示> 栏目。下面的代码对此进行了一些分解，希望能够澄清(我希望)。

### Just looking at one date
> df2 <- df %>% filter(date == '1937-05-01')
> df2
           id element year month day       date value
1 USC00231275    TMAX 1937     5   1 1937-05-01  0.00
2 USC00231275    TMIN 1937     5   1 1937-05-01 53.96

### This comparison will be recycled for every element in the group,
### so it will always be TRUE or always FALSE.
> c(df2$value[df2$element == 'TMIN'], df2$value[df2$element == 'TMAX'])
[1] 53.96  0.00

由于对整个组进行一次比较，因此他们将始终看到 TRUE 或始终看到 FALSE。

给出正确结果的代码显示了如何进行比较。

一种可能的最终解决方案可能是:

df %>%
   group_by(date) %>%
   mutate(value = ifelse( ( (value[element == 'TMIN'] >= value[element == 'TMAX']) & element=='TMIN'), NA, value)) %>%
   ungroup

关于r - 为什么 dplyr 删除了不满足条件的值？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34485798/

27

4

0

文章推荐： Symfony2 继承多个包

文章推荐：鼠标退出时的 Java jpopupmenu

文章推荐： jenkins - 如何在作为容器运行的 Jenkins 中运行 Docker

文章推荐： laravel - 如何使用模态 Laravel 5.8 更新特定行

mysql - 满足 WHERE 子句中的所有条件条件
我想检索具有多个条件的数据，其中每个条件将在特定字段中包含特定关键字。表结构如下: sid nid cid 数据 50 7 5 ee 50 7 6 AA 50 7 8 ff 51 7 5 ee 51
prolog - 满足 Prolog 中的一组目标
在 Prolog 中，我经常通过提供模板(包含变量的结构)然后满足其上的一组约束来解决问题。一个简单的例子可能是: go(T) :- T = [_, _, _], member(cat
fpga - 满足 FPGA 设备要求的最佳方法
在设计 FPGA 系统时，我如何粗略估计给定任务所需的逻辑 block 数量？有人对我对这些常见设备的期望有一个粗略的数量级吗？串口使用 CRC32 的数据包解帧器 8 微核我看过 www.o
list - 满足 haskell 中大多数元素的函数
我需要编写一段代码，如果函数满足列表中的大多数元素，则返回 True，不满足其中的 false。例如:moreThan odd [1,2,3] 是 True，但是 moreThan odd [1,2,
javascript - 满足 componentWillReceiveProps 中未同时设置的多个条件
一旦满足三个条件，我需要使用 componentWillReceiveProps() 来调用我的组件中的方法。其中两个条件将当前 Prop 与下一个 Prop 进行比较，这两个条件通过 Ajax 请求
c# - 满足 subview 模型依赖关系
我正在构建一个主从表单。主视图模型构造细节 View 模型的实例。这些细节 View 模型有几个依赖项，需要用新类实例来满足。 (这是因为他们需要在独立于主虚拟机的数据上下文中运行的服务层。) 实现
javascript - 满足 PHP 条件时显示弹出窗口
我有以下项目，我已经使用了一段时间。正如您在运行 snnipets 后看到的那样，一切正常。 /* The dark background behind the dialogs */ .dialog-
javascript - 满足 2 个条件时启用按钮
我正在尝试找出解决此问题的方法: 我想要一个函数来检查文本字段是否填充了文本并且复选框是否被选中。当满足这些条件时，“提交”按钮将启用。如果启用“提交”按钮后不久，用户清除文本字段或取消选中复选框，则
java - 满足 Java 的返回要求
所以我相对较新，我有以下代码，我想知道如何制作这样我可以返回临时变量，同时满足java的返回要求。我希望返回临时值，但由于它位于 if-else block 内，因此从技术上讲，它不会在其外部初始化。
JavaScript - 满足 if/elseif 条件时更改类
我正在编写一个脚本，该脚本读取文本文件并根据 .txt 文件的内容更改 div 中的文本。但这不是我的问题。我不想要纯文本，背景颜色应该根据满足 if/elseif/else 函数的条件而改变。 v
swift - 满足 if let 构造中的多个约束之一
我想在 if let 构造中满足多个约束。我知道我们可以使用“,”(逗号)来解包多个值，但它们都必须成功解包。例如: var str: String? = "Hello" var x: Int? =
android - 在genymotion设备上安装应用程序，满足:“INSTALL_FAILED_CPU_ABI_INCOMPATIBLE”
当我在 genymotion 模拟设备上安装我的应用程序时，它无法很好地安装，在控制台上我得到“INSTALL_FAILED_CPU_ABI_INCOMPATIBLE”我尝试了另一个应用程序，它安装得
r - 查看两个变量的符号是否不同 - 满足 R 中的条件
因此，我试图根据数据帧的匹配条件来查看数据帧的两个变量(v1 和 v2)是否在其符号(正数或负数)中匹配变量(ID1==ID2)。示例数据框 - Trial.df: ID1 v1
gradle - 我是否必须明确检查/满足(Java)项目的所有传递依赖项的许可？
如果交付一个 Java 应用程序，它使用 gradle 依赖管理和许多来自 maven-central 的开源库，是否足以检查第一级 depedencies 的许可证(因为他们的依赖关系必须再次自动与
ceylon - 满足 'Iterable'接口(interface)不涉及Null
我正在尝试创建一个满足接口(interface) Iterable 的类“Gprogram” (这样我就可以在我的 Gprogram 中迭代 Gcommand)。但是，我只能使用类型 Iterable
mysql - POSTGRESQL:满足 2 个条件时对字段求和
我想知道是否可以获得一些帮助。我试图在查询中写入一个查询，我使用 3 个字段:ID、选项和金额。我需要对我的唯一 ID 进行分组，然后在该组中我需要按选项白色进行拆分，总计每个选项的金额。例如:编
ios - Jitsi - 满足 iOS 中的框架配置
如何在iOS swift项目中配置Jitsi-meet框架开启视频通话服务？最佳答案编辑:这也适用于 Xcode Version 12.2 (12B45b)在 Mac OS Big Sur 上。
javascript - jQuery 满足 'if' 未执行
我正在玩一些交互式菜单，目前有一个隐藏菜单，当按下一个按钮时，它会从右边出现，并将整个内容移到上面。有点像移动 facebook 应用程序。为了确定按钮应该将菜单滑出还是放回我使用 javascrip
python - 满足 "Hello World"局部最优的简单遗传算法
我的目标很简单，使用遗传算法重现经典的“Hello, World”字符串。我的代码基于此 post .代码主要包含4个部分: 生成具有多个不同个体的种群根据与target的比较，定义评估个体好坏的
algorithm - 预约调度算法(N人有N个忙闲槽，约束-满足)
问题陈述我们有一个雇主想要面试 N 个人，因此安排了 N 个面试时段。每个人都有这些时段的忙闲时间表。给出一个算法，如果可能的话将 N 个人安排到 N 个槽位，如果不可能则返回一个标志/错误/等。最

首页

博学

6Ren·AI

商城

r - 为什么 dplyr 删除了不满足条件的值？