- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试做一些关于我在 R 方面的专业知识的相当困难的事情。我有一个日期变量,它基本上说明了我的调查的受访者开始它的时间。因此,存在缺失值(非受访者)和日期(受访者)。
我想要绘制的是一个具体变量(例如女性百分比)在我拥有的时间范围内的频率分布。所以,简单地说,一张图表显示第一天 X% 的女性,第二天(包括第一天的人)Y% 等等;对于可用的三个实验组。
我是无知的。我检查了一些以雨或其他自然现象为例的资源,并使用了
cumsum()
ggplot 中的命令来执行它,但似乎不是达到我的目的的方法。我什至不确定我是否需要另一个包裹。
这是示例数据
df <- structure(list(sf_sex = c("Female", "Female", "Female", "Female",
"Female", "Male", "Female", "Male", "Female", "Female", "Female",
"Female", "Male", "Female", "Male", "Female", "Male", "Male",
"Male", "Female", "Female", "Female", "Female", "Female", "Female",
"Female", "Male", "Male", "Male", "Male", "Female", "Male", "Female",
"Male", "Male", "Male", "Female", "Male", "Female", "Male", "Male",
"Female", "Male", "Female", "Female", "Female", "Male", "Male",
"Female", "Male", "Female", "Female", "Female", "Male", "Male",
"Female", "Male", "Male", "Male", "Female", "Male", "Male", "Female",
"Male", "Male", "Male", "Male", "Female", "Female", "Male", "Female",
"Female", "Female", "Female", "Male", "Female", "Female", "Male",
"Female", "Male", "Male", "Female", "Female", "Male", "Female",
"Male", "Female", "Female", "Male", "Male", "Female", "Male",
"Female", "Male", "Male", "Female", "Male", "Female", "Female",
"Female"), StartDate = c("06/07/2019", "06/06/2019", NA, "05/21/2019",
NA, NA, "05/24/2019", NA, NA, "05/20/2019", NA, "06/04/2019",
NA, NA, NA, NA, "06/16/2019", NA, NA, NA, "05/23/2019", NA, NA,
NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, "05/23/2019",
NA, NA, NA, NA, NA, NA, NA, NA, NA, "05/22/2019", NA, "06/13/2019",
NA, NA, "05/28/2019", "05/23/2019", NA, NA, NA, NA, NA, NA, "05/29/2019",
"05/22/2019", NA, "05/23/2019", NA, "05/31/2019", NA, "05/22/2019",
NA, "07/02/2019", "06/02/2019", NA, NA, "05/27/2019", NA, NA,
NA, "05/27/2019", NA, NA, NA, NA, "06/04/2019", "05/22/2019",
NA, NA, "05/24/2019", NA, "05/25/2019", "05/21/2019", "05/20/2019",
NA, NA, "05/24/2019", NA, NA, "06/03/2019", "05/22/2019", "05/20/2019"
)), row.names = c(2L, 9L, 12L, 23L, 24L, 38L, 48L, 49L, 52L,
53L, 55L, 68L, 71L, 75L, 84L, 90L, 107L, 114L, 115L, 117L, 118L,
122L, 125L, 134L, 138L, 144L, 148L, 163L, 169L, 179L, 185L, 188L,
199L, 206L, 209L, 211L, 223L, 227L, 230L, 233L, 234L, 237L, 241L,
243L, 247L, 257L, 269L, 275L, 277L, 284L, 287L, 288L, 291L, 292L,
295L, 301L, 310L, 314L, 316L, 324L, 329L, 331L, 333L, 338L, 341L,
344L, 363L, 365L, 372L, 373L, 375L, 385L, 400L, 401L, 411L, 416L,
421L, 423L, 427L, 429L, 439L, 440L, 443L, 444L, 455L, 465L, 468L,
479L, 504L, 511L, 518L, 522L, 528L, 529L, 530L, 538L, 541L, 542L,
543L, 554L), class = "data.frame")
并且 NA 案例应该被忽略,因为这是没有参与的人。
抱歉,如果数据占用太多空间,非常感谢您的帮助。
最佳答案
这是一个精心制定的问题!
这是我的解决方案,并附有评论以进行一些解释——如果有任何不清楚的地方,请告诉我。
df %>%
# convert StartDate from character to something sort-able
mutate(date = lubridate::mdy(StartDate)) %>%
arrange(date) %>%
# get numerator and denominator of proportion female by date x
mutate(Rs = cumsum(sf_sex %in% c("Male", "Female")),
female_Rs = cumsum(sf_sex == "Female")) %>%
# take last observation per date
group_by(date) %>%
slice(n()) %>%
select(date, Rs, female_Rs) %>%
# make the proportion
mutate(female_prop = female_Rs/Rs) %>%
# plot it over time
ggplot(aes(x = date, y = female_prop)) +
geom_point() +
geom_line()
关于r - 绘制变量随时间的分布 - 累积加法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67884262/
美好的一天! 我正在制作一个出勤检查程序,单击一次时显示橙色按钮,单击两次时显示红色按钮,单击 3 次时显示黑色按钮。我在如何累积 getClickCount() 值方面遇到问题,因为对于按钮要注册
我似乎无法在 Adobe 网站上找到明确的答案。使用 ColdFusion 10,11 甚至 2016,更新(修补程序)是否累积? 例如,ColdFusion 的修补程序高达 hotfix_023
我是随机森林新手,我有一个关于回归的问题。我正在使用 R 包 randomForests 来计算 RF 模型。 我的最终目标是选择对预测连续性状很重要的变量集,因此我正在计算一个模型,然后删除准确度平
目前我们有一个发布/消费者服务,消费者将收到的消息写入 AWS S3。我们目前每月编写超过 100.000.000 个对象。但是,我们可以根据一些规则对这些消息进行分组,以节省一些钱。这些规则可以是这
假设我有一个二叉树: data BinTree a = Nil | Branch a (BinTree a) (BinTree a) 我想在这样的结构上做一个累积映射: mapAccum ::
我正在使用内核估计,我应用了 density函数从 R 到我的数据文件(双变量),经过几次统计处理后,我需要转换这些数据,这就是我的问题: 是否有非参数方法的逆累积分布函数? 我尝试过 Google、
不确定以前是否有人问过这个问题,尝试搜索它但找不到任何相关内容。 我试图获得一个累积的字符串聚合,即仅运行不同值的聚合。这是我正在寻找的结果的示例。 我尝试使用 string_agg 函数,但它仅在用
我想找到累积的 bind.rows。这是我想要实现的小例子。我将使用 dslabs 包中的 gapminder 数据集进行演示。 library(tidyverse) library(dslabs)
在 Linux 中使用 tomcat 进程时,我们观察到时间字段显示5506:34(累积 CPU 时间)。在探索时,这是在进程的整个生命周期中运行所花费的 CPU 时间的百分比。 由于这是一个 Jav
我有一些数据可以使用 pyparsing 中的 OneorMore 函数进行解析。比如, fun = OneorMore( foo.setResultsName("foo") + bar.setRe
我试图弄清楚是否有一种简单的方法可以解决 pandas 的以下问题。假设我有四个容器,A、B、C、D,每个容器都有特定的体积。假设我现在得到了一定量的液体,我想用它来填充这些容器。我怎样才能想出一个“
我正在尝试编写一个函数来检测所有上升沿 - 向量中值超过特定阈值的索引。这里描述了类似的东西:Python rising/falling edge oscilloscope-like trigger
这个问题在这里已经有了答案: Multiplying elements of a column in skipping an element after each iteration (3 个答案)
有没有办法获取数据框中每一行的值计数? |f1|f2| ------- v1 | a value_counts -> {a:1} v2 | a value_counts -> {a:2} v3 |
我目前正在尝试对我正在构建的计算器(使用复合模式)进行测试。第一种方法应该添加 75 美元,效果很好,但是当第二种方法运行时,“服务”被重置并且有0 美元作为工作成本。如果我将这两种方法合二为一,那么
我有一个如下所示的文档: 数据.txt 100, "some text" 101, "more text" 102, "even more text" 我使用正则表达式处理它并返回一个新的处理文档,如
假设我有这个: function getAllPromises(key: string, val: any): Promise { const subDeps = someHash[key]; c
我在 mysql 中有表“cumul_sum”,我想根据条件划分“cumulative”列,即如果此列中的值 >= 70,则这些值应存储在名为“others”的新列中"并且前面应该存放对应的sku_i
我正在做一个用 C++ 刺激 ATM 的项目,但在使用累加器时遇到了一些问题,我的问题是:我正在使用开关(这里是情况 1)来更改在包含的函数中声明的 2 个变量的值switch(),但是值只在情况 1
我希望能够使用 accumulate 对 vector 中的每隔一对元素进行累加。我尝试了以下但没有成功,为非空、非零 vector 返回错误 return std::accumulate(vec.b
我是一名优秀的程序员,十分优秀!