- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
上下文是,我有许多 id
和许多 band
的时间序列,并且我包含了九个 id
和两个 band
的样本。在这里我们可以看到,我可以轻松地绘制所有 id
的时间序列:
library(tidyverse)
df <- structure(list(id = c(1001L, 1001L, 1001L, 1001L, 1001L, 1001L, 1001L, 1001L, 1001L, 1001L, 1002L, 1002L, 1002L, 1002L, 1002L, 1002L, 1002L, 1002L, 1002L, 1002L, 1004L, 1004L, 1004L, 1004L, 1004L, 1004L, 1004L, 1004L, 1004L, 1004L, 1005L, 1005L, 1005L, 1005L, 1005L, 1005L, 1005L, 1005L, 1005L, 1005L, 1007L, 1007L, 1007L, 1007L, 1007L, 1007L, 1007L, 1007L, 1007L, 1007L, 1009L, 1009L, 1009L, 1009L, 1009L, 1009L, 1009L, 1009L, 1009L, 1009L, 1010L, 1010L, 1010L, 1010L, 1010L, 1010L, 1010L, 1010L, 1010L, 1010L, 1011L, 1011L, 1011L, 1011L, 1011L, 1011L, 1011L, 1011L, 1011L, 1011L, 1013L, 1013L, 1013L, 1013L, 1013L, 1013L, 1013L, 1013L, 1013L, 1013L), date = structure(c(1488884400, 1490612474, 1507460497, 1502276146, 1514372627, 1512644789, 1500980863, 1503572707, 1513940711, 1496660730, 1495796861, 1512644789, 1488884400, 1504436115, 1502276146, 1495796118, 1494068453, 1504868786, 1513940711, 1511780307, 1511348810, 1503572707, 1497524848, 1507028336, 1491476744, 1503572707, 1492340161, 1501844755, 1505300762, 1503140790, 1509620381, 1488884400, 1487156167, 1510052273, 1491476744, 1494068453, 1513940711, 1489748810, 1498388749, 1509620381, 1500980120, 1511780307, 1502708860, 1489748810, 1501412778, 1504436115, 1495796861, 1493204748, 1510484382, 1487156167, 1508324436, 1500548201, 1513940711, 1505732183, 1490612474, 1496660730, 1511348810, 1514372627, 1494068453, 1510052273, 1500548201, 1513076347, 1508756553, 1510484382, 1504436858, 1504004193, 1494932749, 1508324436, 1512644789, 1504868786, 1507460497, 1504004193, 1503140790, 1500980120, 1512212632, 1491476744, 1513940711, 1508756553, 1504436115, 1490612474, 1495796861, 1509188631, 1508756553, 1486292805, 1504004193, 1498388749, 1495796861, 1486292805, 1513940711, 1499684790), class = c("POSIXct", "POSIXt"), tzone = "UTC"), band = c("fit1", "fit1", "fit1", "fit1", "fit1", "fit5", "fit5", "fit5", "fit5", "fit5", "fit1", "fit1", "fit1", "fit1", "fit1", "fit5", "fit5", "fit5", "fit5", "fit5", "fit1", "fit1", "fit1", "fit1", "fit1", "fit5", "fit5", "fit5", "fit5", "fit5", "fit1", "fit1", "fit1", "fit1", "fit1", "fit5", "fit5", "fit5", "fit5", "fit5", "fit1", "fit1", "fit1", "fit1", "fit1", "fit5", "fit5", "fit5", "fit5", "fit5", "fit1", "fit1", "fit1", "fit1", "fit1", "fit5", "fit5", "fit5", "fit5", "fit5", "fit1", "fit1", "fit1", "fit1", "fit1", "fit5", "fit5", "fit5", "fit5", "fit5", "fit1", "fit1", "fit1", "fit1", "fit1", "fit5", "fit5", "fit5", "fit5", "fit5", "fit1", "fit1", "fit1", "fit1", "fit1", "fit5", "fit5", "fit5", "fit5", "fit5"), value = c(0.496538754230172, 0.503271496428091, 0.97387311299285, 0.580658673638122, 0.55924511798107, 0.832069876834949, 0.669456383223215, 1.12835570514478, 0.650077806710299, 0.380956367547047, 0.315803532869213, 0.792491389890908, 0.542150595815071, 1.03016500582205, 0.761751198659722, 0.367933240661702, 0.478285303617102, 1.68901870452092, 0.740965064159661, 1.09028738312622, 0.822334909416119, 0.758342181009204, 0.404208383270466, 0.892795714415756, 0.452540219822814, 1.15220190981348, 0.522093412373678, 0.953592910857701, 1.27850667816495, 1.10756222303339, 0.722797148902218, 0.465842402588039, 0.524130056243481, 0.724757971315511, 0.401849347220063, 0.455169211763473, 0.736683498842155, 0.530595901306756, 0.598435246507131, 0.855911625573028, 0.459872179640563, 0.851473466057886, 0.600348304937791, 0.484896112230185, 0.491357621589034, 1.21884821937325, 0.408355867626313, 0.541537217668289, 1.20173675518489, 0.61126928681528, 1.02122136799224, 0.489289990779144, 0.829092258901136, 0.88152853467569, 0.528559966420024, 0.544164467022259, 1.15093592993106, 0.876559089290843, 0.582149928218707, 1.26592404446571, 0.479960992971744, 0.840894959543198, 1.00459298341354, 0.98285777345435, 0.754965044767638, 1.14971147250154, 0.678568628236206, 1.38981008816777, 0.989354634818581, 1.25116433808614, 1.2142398253614, 1.03201975237089, 0.928602154928637, 0.642961745200205, 0.842888403466734, 0.649606669375906, 0.724490820076092, 1.68294181717141, 1.83216850101507, 0.69741924948021, 0.268972923828825, 1.16584414990533, 1.20604228862346, 0.586060027904748, 1.16356144256577, 0.52670838257608, 0.382147314320451, 0.668308513834733, 0.78509264848017, 0.733357618207109)), row.names = c(NA, -90L), class = c("grouped_df", "tbl_df", "tbl", "data.frame"), vars = c("id", "band"), drop = TRUE, indices = list(0:4, 5:9, 10:14, 15:19, 20:24, 25:29, 30:34, 35:39, 40:44, 45:49, 50:54, 55:59, 60:64, 65:69, 70:74, 75:79, 80:84, 85:89), group_sizes = c(5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L), biggest_group_size = 5L, labels = structure(list(id = c(1001L, 1001L, 1002L, 1002L, 1004L, 1004L, 1005L, 1005L, 1007L, 1007L, 1009L, 1009L, 1010L, 1010L, 1011L, 1011L, 1013L, 1013L), band = c("fit1", "fit5", "fit1", "fit5", "fit1", "fit5", "fit1", "fit5", "fit1", "fit5", "fit1", "fit5", "fit1", "fit5", "fit1", "fit5", "fit1", "fit5")), row.names = c(NA, -18L), class = "data.frame", vars = c("id", "band"), drop = TRUE, indices = list(0:4, 5:9, 10:14, 15:19, 20:24, 25:29, 30:34, 35:39, 40:44, 45:49, 50:54, 55:59, 60:64, 65:69, 70:74, 75:79, 80:84, 85:89), group_sizes = c(5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L, 5L), biggest_group_size = 5L, labels = structure(list(merge_id = c(1001L, 1001L, 1002L, 1002L, 1004L, 1004L, 1005L, 1005L, 1007L, 1007L, 1009L, 1009L, 1010L, 1010L, 1011L, 1011L, 1013L, 1013L), band = c("fit1", "fit5", "fit1", "fit5", "fit1", "fit5", "fit1", "fit5", "fit1", "fit5", "fit1", "fit5", "fit1", "fit5", "fit1", "fit5", "fit1", "fit5")), row.names = c(NA, -18L), class = "data.frame", vars = c("merge_id", "band"), drop = TRUE)))
ggplot(df, aes(x = date, y = value, colour = band)) +
geom_point() +
geom_line() +
facet_wrap(~id)
id
太多时,这会变得笨拙并且图变得太小,所以我想直观地检查一个随机子集。我希望以下内容只返回三个
id
,但我们得到四个
id
,我们甚至没有得到每个
band
的所有
id
。我在这里选择了种子 1234,但是如果您继续使用不同的种子重新运行,并使用不同的波段 ID 组合排列,则会得到不同的结果。
set.seed(1234)
ggplot(
data = df %>% filter(id %in% sample(unique(df$id), 3)), # filtering to subset of 3 ids
mapping = aes(x = date, y = value, colour = band)
) +
geom_point() +
geom_line() +
facet_wrap(~id)
ggplot()
调用之外进行采样,它会起作用。 (这将是想要的结果)
set.seed(1234)
some_ids <- sample(unique(df$id), 3) # moved sample() outside of ggplot()
ggplot(
data = df %>% filter(id %in% some_ids),
mapping = aes(x = date, y = value, colour = band)
) +
geom_point() +
geom_line() +
facet_wrap(~id)
sample
而不是
unique(df$id)
部分有关,因为您可以将其替换为
c(1001, 1002, 1004, 1005, 1007, 1009, 1010, 1011, 1013)
并且仍然会遇到问题。我也意识到这可能与我的特定数据有关,因为我确实尝试使用内置数据集制作类似的 reprex,但我无法想象那会是什么,因为这已经是一个非常有限的子集。
dput
中的数据集有什么区别。
df2 <- tibble(
id = rep(1:9, each = 5, times = 2),
date = rep(seq(as.POSIXct("2018-01-01 00:00:00"), by = "month", length.out = 5), times = 18),
band = rep(c("b1", "b2"), each = 45),
value = c(rnorm(45, 0), rnorm(45, 1))
)
最佳答案
TLDR:过滤器表达式会被评估多次,因此您不应使用非确定性表达式。
不确定这是否足以作为答案,但是如果您尝试使用不同的种子运行示例,您会注意到图表的数量随每个种子而变化。这表明我们过滤数据框的 id 数量随着每个种子而变化,表明 sample
实际上被多次调用。我们可以通过创建一个函数来代替 sample
来确认这一点。 :
sample_out <- function(data, n) {
print("running sample_out ")
return (sample(data, n))
}
sample
:
ggplot(
data = df %>% filter(id %in% sample_out(unique(df$id), 3)),
mapping = aes(x = date, y = value, colour = band)
)
sample_out
实际上被多次调用。在我的 session 中,无论种子如何,都会使用上述数据调用 18 次。尝试不同的数据帧大小,似乎是
sample
将被调用 (row_count/5) 次。这意味着
filter
以某种方式多次评估其参数。一个完整的答案将解释为什么
filter
会发生这种情况。但这是我有点迷失的地方。我相信相关的来源在这里:
filter.tbl_df <- function(.data, ..., .preserve = TRUE) {
// elided
out <- filter_impl(.data, quo)
filter_impl
基本上调用了一个 C++ 实现,我认为关键是:
template <typename SlicedTibble>
SEXP filter_template(const SlicedTibble& gdf, const NamedQuosure& quo) {
// elided
Proxy call_proxy(quo.expr(), gdf, quo.env()) ;
// elided
int ngroups = gdf.ngroups() ;
// elided
for (int i = 0; i < ngroups; i++, ++git) {
// elided
LogicalVector g_test = check_result_lgl_type(call_proxy.get(indices));
// elided
}
// elided
}
call_proxy.get
被执行。我假设我们看到
sample_out
被调用 18 次,因为相应的 tibble 中有 18 个组。
dplyr
的文档讨论了它的评估与可能使用的略有不同:
https://dplyr.tidyverse.org/articles/programming.html .
Most dplyr functions use non-standard evaluation (NSE). This is a catch-all term that means they don’t follow the usual R rules of evaluation. Instead, they capture the expression that you typed and evaluate it in a custom way.
关于r - 为什么过滤到 ggplot() 中的数据集样本会返回不正确的样本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52284239/
初学者 android 问题。好的,我已经成功写入文件。例如。 //获取文件名 String filename = getResources().getString(R.string.filename
我已经将相同的图像保存到/data/data/mypackage/img/中,现在我想显示这个全屏,我曾尝试使用 ACTION_VIEW 来显示 android 标准程序,但它不是从/data/dat
我正在使用Xcode 9,Swift 4。 我正在尝试使用以下代码从URL在ImageView中显示图像: func getImageFromUrl(sourceUrl: String) -> UII
我的 Ubuntu 安装 genymotion 有问题。主要是我无法调试我的数据库,因为通过 eclipse 中的 DBMS 和 shell 中的 adb 我无法查看/data/文件夹的内容。没有显示
我正在尝试用 PHP 发布一些 JSON 数据。但是出了点问题。 这是我的 html -- {% for x in sets %}
我观察到两种方法的结果不同。为什么是这样?我知道 lm 上发生了什么,但无法弄清楚 tslm 上发生了什么。 > library(forecast) > set.seed(2) > tts lm(t
我不确定为什么会这样!我有一个由 spring data elasticsearch 和 spring data jpa 使用的类,但是当我尝试运行我的应用程序时出现错误。 Error creatin
在 this vega 图表,如果我下载并转换 flare-dependencies.json使用以下 jq 到 csv命令, jq -r '(map(keys) | add | unique) as
我正在提交一个项目,我必须在其中创建一个带有表的 mysql 数据库。一切都在我这边进行,所以我只想检查如何将我所有的压缩文件发送给使用不同计算机的人。基本上,我如何为另一台计算机创建我的数据库文件,
我有一个应用程序可以将文本文件写入内部存储。我想仔细看看我的电脑。 我运行了 Toast.makeText 来显示路径,它说:/数据/数据/我的包 但是当我转到 Android Studio 的 An
我喜欢使用 Genymotion 模拟器以如此出色的速度加载 Android。它有非常好的速度,但仍然有一些不稳定的性能。 如何从 Eclipse 中的文件资源管理器访问 Genymotion 模拟器
我需要更改 Silverlight 中文本框的格式。数据通过 MVVM 绑定(bind)。 例如,有一个 int 属性,我将 1 添加到 setter 中的值并调用 OnPropertyChanged
我想向 Youtube Data API 提出请求,但我不需要访问任何用户信息。我只想浏览公共(public)视频并根据搜索词显示视频。 我可以在未经授权的情况下这样做吗? 最佳答案 YouTube
我已经设置了一个 Twilio 应用程序,我想向人们发送更新,但我不想回复单个文本。我只是想让他们在有问题时打电话。我一切正常,但我想在发送文本时显示传入文本,以确保我不会错过任何问题。我正在使用 p
我有一个带有表单的网站(目前它是纯 HTML,但我们正在切换到 JQuery)。流程是这样的: 接受用户的输入 --- 5 个整数 通过 REST 调用网络服务 在服务器端运行一些计算...并生成一个
假设我们有一个名为 configuration.js 的文件,当我们查看内部时,我们会看到: 'use strict'; var profile = { "project": "%Projec
这部分是对 Previous Question 的扩展我的: 我现在可以从我的 CI Controller 成功返回 JSON 数据,它返回: {"results":[{"id":"1","Sourc
有什么有效的方法可以删除 ios 中 CBL 的所有文档存储?我对此有疑问,或者,如果有人知道如何从本质上使该应用程序像刚刚安装一样,那也会非常有帮助。我们正在努力确保我们的注销实际上将应用程序设置为
我有一个 Rails 应用程序,它与其他 Rails 应用程序通信以进行数据插入。我使用 jQuery $.post 方法进行数据插入。对于插入,我的其他 Rails 应用程序显示 200 OK。但在
我正在为服务于发布请求的 API 调用运行单元测试。我正在传递请求正文,并且必须将响应作为帐户数据返回。但我只收到断言错误 注意:数据是从 Azure 中获取的 spec.js const accou
我是一名优秀的程序员,十分优秀!