gpt4 book ai didi

r - 使用格子在 R 中为已处理的数据创建箱线图

转载 作者:行者123 更新时间:2023-12-01 11:03:23 24 4
gpt4 key购买 nike

我正在尝试在 R 中为一个非常大的数据集创建一个箱线图。包含数据的文件是 2.5G,如果我尝试导入它,R 会崩溃。幸运的是,其他一些(python)软件可以毫无问题地生成均值和方差,这就是我真正想要绘制的(现在)。

到目前为止,我发现的每个教程都要求您输入完整的数据集,然后 R 自己计算统计数据,但我想知道如何将平均值、中位数、最小值、最大值等传递给 bwplot用于绘图。我更喜欢 R 和 lattice 的原因是因为它与代码最终可能包含的软件套件集成得很好。如果我使用 matlab 或其他一些软件,那将是一个问题,因为这将是我们当前用户的另一个要求。

最佳答案

箱线图绘制均值或方差。您实际上需要完整排名的数据来绘制适当的箱线图,因为数量是中位数、四分位数和 1.5 倍 IRQ 以内的收盘数据点的实际值加上该范围外的所有数据点(异常值)。对于大型数据集,这通常不是一个好主意(因为根据定义,您有数百万个异常值)。

也就是说,您可以以任何方式生成基本摘要并使用 bxp 绘制它们 - 请参阅 R 中的 ?bxp。只要确保您弄清了哪些数量如果它们不是上述情况,那么您正在密谋。

关于r - 使用格子在 R 中为已处理的数据创建箱线图,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8596993/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com