r - geom_density2d 的重量当量-6ren

r - geom_density2d 的重量当量

转载作者：行者123 更新时间：2023-12-04 01:12:49

26

4

考虑以下数据:

   contesto       x       y perc
1       M01  81.370 255.659   22
2       M02  85.814 242.688   16
3       M03  73.204 240.526   33
4       M04  66.478 227.916   46
5      M04a  67.679 218.668   15
6       M05  59.632 239.325   35
7       M06  64.316 252.777   23
8       M08  90.258 227.676   45
9       M09 100.707 217.828   58
10      M10  89.829 205.278   53
11      M11 114.998 216.747   15
12      M12 119.922 235.482   18
13      M13 129.170 239.205   36
14      M14 142.501 229.717   24
15      M15  76.206 213.144   24
16      M16  30.090 166.785   33
17      M17 130.731 219.989   56
18      M18  74.885 192.336   36
19      M19  48.823 142.645   32
20      M20  48.463 186.361   24
21      M21  74.765 205.698   16

我想为由 perc 加权的点 x 和 y 创建一个二维密度图。我可以通过使用 rep 来做到这一点(虽然我认为不正确)如下:

library(ggplot2)

dataset2 <- with(dataset, dataset[rep(1:nrow(dataset), perc),])

ggplot(dataset2, aes(x, y)) + 
    stat_density2d(aes(alpha=..level.., fill=..level..), size=2, 
        bins=10, geom="polygon") + 
    scale_fill_gradient(low = "yellow", high = "red") +
    scale_alpha(range = c(0.00, 0.5), guide = FALSE) +
    geom_density2d(colour="black", bins=10) +
    geom_point(data = dataset) +
    guides(alpha=FALSE) + xlim(c(10, 160)) + ylim(c(120, 280))

这似乎不是正确的方法，因为其他 geom s 允许权重如下:

dat <- as.data.frame(ftable(mtcars$cyl))
ggplot(dat, aes(x=Var1)) + geom_bar(aes(weight=Freq))

但是，如果我尝试在此处使用权重，则该图与数据不匹配(desc 被忽略):

ggplot(dataset, aes(x, y)) + 
    stat_density2d(aes(alpha=..level.., fill=..level.., weight=perc), 
        size=2, bins=10, geom="polygon") + 
    scale_fill_gradient(low = "yellow", high = "red") +
    scale_alpha(range = c(0.00, 0.5), guide = FALSE) +
    geom_density2d(colour="black", bins=10, aes(weight=perc)) +
    geom_point(data = dataset) +
    guides(alpha=FALSE) + xlim(c(10, 160)) + ylim(c(120, 280))

这是 rep的用途吗？加权密度的正确方法，或者是否有类似于 weight 的更好方法 geom_bar 的论据?
rep方法看起来像用基本 R 制作的内核密度，所以我认为它应该是这样的:

enter image description here

dataset <- structure(list(contesto = structure(1:21, .Label = c("M01", "M02", 
"M03", "M04", "M04a", "M05", "M06", "M08", "M09", "M10", "M11", 
"M12", "M13", "M14", "M15", "M16", "M17", "M18", "M19", "M20", 
"M21"), class = "factor"), x = c(81.37, 85.814, 73.204, 66.478, 
67.679, 59.632, 64.316, 90.258, 100.707, 89.829, 114.998, 119.922, 
129.17, 142.501, 76.206, 30.09, 130.731, 74.885, 48.823, 48.463, 
74.765), y = c(255.659, 242.688, 240.526, 227.916, 218.668, 239.325, 
252.777, 227.676, 217.828, 205.278, 216.747, 235.482, 239.205, 
229.717, 213.144, 166.785, 219.989, 192.336, 142.645, 186.361, 
205.698), perc = c(22, 16, 33, 46, 15, 35, 23, 45, 58, 53, 15, 
18, 36, 24, 24, 33, 56, 36, 32, 24, 16)), .Names = c("contesto", 
"x", "y", "perc"), row.names = c(NA, -21L), class = "data.frame")

最佳答案

我认为你做得对，如果你的权重是每个坐标(或按比例)的 # 个观察值。该函数似乎期待所有观察结果，如果您在原始数据集上调用它，则无法动态更新 ggplot 对象，因为它已经对密度进行了建模，并且包含派生的绘图数据。

您可能想使用 data.table而不是 with()如果您的真实数据集很大，它会快 70 倍左右。例如请参阅此处了解 1m 坐标，重复 1-20 次(在此示例中为 >10m 观测值)。但是，与 660 次观察没有性能相关性(无论如何，该图可能会成为大型数据集的性能瓶颈)。

bigtable<-data.frame(x=runif(10e5),y=runif(10e5),perc=sample(1:20,10e5,T))

system.time(rep.with.by<-with(bigtable, bigtable[rep(1:nrow(bigtable), perc),]))
#user  system elapsed 
#11.67    0.18   11.92

system.time(rep.with.dt<-data.table(bigtable)[,list(x=rep(x,perc),y=rep(y,perc))])
#user  system elapsed 
#0.12    0.05    0.18

# CHECK THEY'RE THE SAME
sum(rep.with.dt$x)==sum(rep.with.by$x)
#[1] TRUE    

# OUTPUT ROWS
nrow(rep.with.dt)
#[1] 10497966

关于r - geom_density2d 的重量当量，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/21273525/

26

4

0

文章推荐： haskell - XMonad 根据显示的监视器设置布局

文章推荐： logging - Blazor WebAssembly 日志记录不支持 SetMinimumLevel

文章推荐： wcf - 如何检查 Web 服务是 REST 还是 SOAP？

mysql - 计算列(重量/最大(重量)
我有以下查询: select ema.es_symbol as symbol, ema.score as score, ema.weight as weight, rsi.relative_stren
sql - 计算一组给定的项目(重量)所需的盒子数量
我有一个 ms-sql 表，看起来像这样(重量 = kg)。我希望能够计算给定标识符所需的箱子数量和每个箱子的重量。一个盒子最多可以容纳 30 公斤。该标识符的所有项目都可以在一个框中混合。我仅限于
php - 如何更好地将包裹(重量)分装到不同的卡车上以实现最佳效率
我正在尝试通过 PHP 将重量分配给卡车。条件卡车可以有不同的尺寸可设置单辆或多辆卡车越少越好我有这个 class VehicleCalculation { /** * @var
java - 如何正确引用此代码中的 gem 重量？
如何在这段代码中引用石头的重量，以便我可以在unlockChest方法中使用它？我基本上试图将用户从对象 new Stone()) 输入的权重相加，因此它 == 组合了用户在 Chest() 构造函数
android - 错误的 TableLayout 重量
我在线性布局中使用表格布局，第一行结果很好，但连续的行完全错误，尽管设置了它们。我不确定这是否是我正在运行的 Android Studio 版本的问题，或者它是否不适用于 kotlin ...有什么办
android - 我如何使用领域知识来改进这个算法？呃，重量
我在平衡方面遇到了麻烦。我觉得我在这里遗漏了一些东西.. 这个问题等同于以下情况: table 上散布着各种质量的砝码。你手里拿着几个不同质量的砝码。如果 table 上有一组重量与您手中的重量相
object-detection - 如何重新训练自定义 yolo 重量？
我已经在 YOLOv3 中进行了超过 3 个类别的自定义检测，但是检测结果不准确，所以我想用更多图像重新训练我的自定义 YOLO 权重，但是当我用新图像运行它时，它立即完成，我做错了什么？这是我如
java - 正则表达式:按名称、重量/数量和价格拆分字符串
所以我需要分割字符串: Laundry Detergent 2X Ultra Free Clear 50
java - 重量。客户端包。覆盖小部件的默认 css 样式
我使用 ClientBundle 和 CssResource 接口(interface)。所有适用于类的样式都有效: 在 CSS 中:.dialogVPanel { margin: 5px;} 在界面
java - 如何创建一个包含具有多个值的对象的 JList？例如价格、重量、颜色等
我几乎是编程新手，所以这可能看起来是一个非常愚蠢的问题，我已经尝试这样做有一段时间了，但无法理解它。但是我想知道 JList 对象是否可以存储多个值，因此当我单击列表中的对象时，不同的值(例如价格、
android - 以编程方式与在 XML 中创建 Android 布局时不同的宽度/重量
我想创建具有相同宽度并被拉伸(stretch)以(匹配)父按钮的按钮。我需要以编程方式来完成它。首先，我创建了一个所需状态的布局草稿(只关注按钮的绿线):
ios - iOS 中的 Android 重量(7 个按钮的宽度相等)
我正在尝试在 iOS 中模拟 Android android:layout_weight="1" 中的属性。我有一个带有 7 个按钮的 View ，我希望它们都具有相同的宽度和相同的边距。在 And
用于小型 XML 文件的 C# XmlDocument - 重量/性能
我想知道使用 XmlDocument 类来处理小型 XML 文件的感觉。如果在加载XML文件的过程中，XmlDocument为所有的XML元素及其关系创建了一整套面向对象的结构，理论上对于小的xml文
optimization - Bin Packing : Set amount on bins, 想要最小化最大 bin 重量
给定 n 个无限容量的箱子，我想将 m 件元素装入其中(每个元素都有特定的重量)，同时最小化最重箱子的重量。这不是传统的垃圾箱包装/背包问题，其中垃圾箱的容量有限，而您试图尽量减少使用的垃圾箱数量；
javascript - 尽管遵循了严格的说明，但仍看到未定义的 "Uncaught TypeError: Cannot read property ' 重量
过去几天我一直在学习 D3。我尝试将我所学到的所有内容简化为一个简单的 D3 示例，但我看到了标题中提到的错误。我确信这很简单，我错过了什么？代码: .node { fill: #c

首页

博学

6Ren·AI

商城

r - geom_density2d 的重量当量