R ggplot : Weighted CDF-6ren

R ggplot : Weighted CDF

转载作者：行者123 更新时间：2023-12-02 11:50:56

27

4

我想使用 ggplot 绘制加权 CDF。一些旧的非 SO 讨论(例如 2012 年的 this)表明这是不可能的，但我想我会重新加注。

例如，考虑以下数据:

df <- data.frame(x=sort(runif(100)), w=1:100)

我可以显示未加权的 CDF

ggplot(df, aes(x)) + stat_ecdf()

我该如何用w来衡量它？对于这个例子，我期望一个看起来像 x^2 的函数，因为数字越大权重越高。

最佳答案

您的回答有错误。

这是计算加权 ECDF 的正确代码:

df <- df[order(df$x), ]  # Won't change anything since it was created sorted
df$cum.pct <- with(df, cumsum(w) / sum(w))
ggplot(df, aes(x, cum.pct)) + geom_line()

ECDF 是一个函数 F(a)等于观测值权重(概率)的总和，其中 x<a除以权重总和。

但是这里有一个更令人满意的选项，只需修改 ggplot2 stat_ecdf 的原始代码即可: https://github.com/NicolasWoloszko/stat_ecdf_weighted

关于R ggplot : Weighted CDF，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/32487457/

27

4

0

文章推荐： qt - 如何在QML中渲染三次贝塞尔曲线？

文章推荐： spring - 我想获得有关 Spring BeanCreationException 错误的建议

文章推荐： r - 根据单元格值使用 kableExtra 为行着色

python - Gamma CDF 和逆 CDF 不产生互补值
为什么反 Gamma 函数不产生原始 x 值？代码 x = 0.2 alpha = 2 u = sp.stats.gamma.cdf(x, alpha) x1 = sp.stats.invgamma
python - 如何操纵样本的 CDF 使其与不同样本的 CDF 相匹配？
我想使用 CDF 匹配来纠正降水的原始模型预测(但该应用程序相当通用)。假设下面的 CDF B 是观测到的 CDF(我信任的 CDF)，我想计算 CDF A 和 B 之间的差异，以便在给定的一天我可
javascript - std 正态 cdf、正态 cdf 或误差函数
这些函数(标准正态累积分布函数、正态累积分布函数或误差函数)中的任何一个都可以用 JavaScript 可靠地计算吗？考虑到 Windows 上缺乏 PECL 可用性，我希望有一个完全客户端的解决方
ms-word - 为什么文件实用程序将 Microsoft Word 文件识别为 CDF？这个 CDF 是什么？
我在这里有一些旧的 Microsoft Word 文件(可能是 Word 97)，并注意到标准的 Unix 文件实用程序将此类文件标识为“CDF”。它实际上更精确，转储详细的元数据，例如: CDF V
wolfram-mathematica - 为什么在 Windows/CDF 插件上运行的相同 Mathematica 演示在 linux CDF 播放器上运行时返回不同的值？
我只是在 linux 上尝试 CDF 播放器并比较 same demo在 Windows 上使用 CDF 插件看起来。我注意到了一些奇怪的事情。相同的演示，相同的初始值，但在 Windows 上，相同
r - 如何绘制时间 cdf？
我有以下值: Day 1: X11 X12 X13 X14 X15 ... Day 2: X21 X22 X23 X24 X25 ... Day 3: X31 X32 X33 X34 X35 ...
r - 如何绘制时间 cdf？
我有以下值: Day 1: X11 X12 X13 X14 X15 ... Day 2: X21 X22 X23 X24 X25 ... Day 3: X31 X32 X33 X34 X35 ...
python - 从数据样本计算逆 CDF
如果我得到随机样本数据: X=np.random.random(100)*100 我需要获取 CDF = 34% 或其他值的 X_i 值。我现在能想到的唯一方法是使用逆 CDF。我认为百分位数是等效的
matlab - cdf 的倒数
我想计算给定 pdf 的逆累积密度函数(逆 cdf)。 pdf 直接作为直方图给出，即 N 个等距分量的向量。我目前的做法是: cdf = cumsum(pdf); K = 3; %// som
r - 如何绘制具有不同行数的向量的多个 CDF 图
我想在同一个图中绘制多个变量的 CDF 图。变量的长度不同。为了简化细节，我使用以下示例代码: library("ggplot2") a1 df ggplot(df, aes(x, colour
python - 绘制离散变量的 CDF - 使用交替线的步骤图
我想画一个看起来像这样的图: 数据在 .csv 文件中给出，我已经将其导入到data 并用作图中的 x。 Y 计算如下: y = np.arange(1, len(data)+1)/len(data)
Python Plotly CDF 与频率分布数据
如何使用 Plotly 在 Pandas DataFrame 中绘制频率分布数据的 CDF 图？假设以下玩具数据 value freq 1 3 2 2 3
R ggplot : Weighted CDF
我想使用 ggplot 绘制加权 CDF。一些旧的非 SO 讨论(例如 2012 年的 this)表明这是不可能的，但我想我会重新加注。例如，考虑以下数据: df <- data.frame(x=s
python - 计算两个 CDF 的最大逐点距离
我有2个CDF并且必须找到最大的逐点距离。我创建了直方图并绘制了两者。这些值由随机函数生成，该函数将两个随机数 1-6 相加 100 次，类似于两个骰子。但是，我无法找到绘图上两条线之间的最大距离。
Java CDF 文件解析 UnsatisfiedLinkError
我正在 Java 中开发 CDF(文件万事达卡使用)文件解析器，并且我正在使用找到的 API here 。为了使用这个 API，您需要 jar 文件.. 我不明白我是如何得到这个异常的，因为它应该在
python - Matplotlib CDF 回到零
尝试使用 matplotlib 的 hist 函数绘制累积分布函数 (CDF) 时，最后一个点会返回到零。我读到一些帖子解释说这是因为类似直方图的格式，但找不到适合我的情况的解决方案。这是我的代码:
c# - 如何绘制 CDF 图？
这个问题已经有答案了: 奥 git _a (1 个回答) 已关闭 9 年前。我想通过从文本文件读取数据来制作 CCDF 图。 CCDF表示互补累积分布函数。我尝试搜索CCDF，但我不太了解它。所
python - 逆 CDF 变换采样的分布略有错误
背景我需要使用已知的累积分布函数 (CDF) 从相当复杂的概率密度函数 (PDF) 中随机采样，并且我正在尝试使用 inverse transform sampling 。这应该很容易做到，因为我有
c++ - Matlab - 累积分布函数(CDF)
我正在将代码从 Matlab 转换为 C++，出于某些重要原因，我必须获得均值为 0 且方差为“正态”函数(在 Matlab 中为“norm”)的累积分布函数=1. 在Matlab中的实现是这样的:
Python:使用逆 cdf 技术进行抽样
我有一个复杂的(非标准)分布函数，我想对其进行采样以使用逆 cdf 技术生成模拟数据点。为了这个例子，我将考虑高斯分布 var=100 def f(x,a): def g(y):

首页

博学

6Ren·AI

商城

R ggplot : Weighted CDF