gpt4 book ai didi

r - 用 R 中的线条按组绘制多个数据集

转载 作者:行者123 更新时间:2023-12-04 03:05:21 25 4
gpt4 key购买 nike

令我有些惊讶的是,我无法在 SO 上找到解决此问题的方法,但我已经尝试了所有我认为可能适用的搜索词。但是,我可能没有使用正确的搜索词,所以如果这是重复的,请原谅我,请指出正确的方向。我有按样本分组的数据,每个样本的每个类别都有一个值,其中有很多。这是一个示例数据框(请注意,样本数量和类别数量通常不同):

df <- data.frame( sample = c( "one", "two", "three", "four" ), 
cat_1 = c( 2, 4, -6, 2 ), cat_2 = c( 1, 2, 2, 1 ),
cat_3 = c( 5, -5, 7, 2 ) )

我正在尝试创建一个图,其中 x 轴具有每个类别的离散点,y 轴是每个类别中所有样本的值,并且跨类别的每个样本的这些值由线连接我可以定义的颜色。

似乎 ggplot2 是去这里的方法,但我找不到一种方法让它按照我想要的方式工作。似乎我希望 colnames( dd ) 在使用 aes() 时成为 x 轴变量,但这警告我 xy 的长度不一样。看起来这应该很简单,但我无法弄清楚。

编辑:我看到这篇文章 Plotting multiple variables from same data frame in ggplot答案显示了我想要绘制的确切类型,但我不知道如何使用 melt 将我的数据框更改为包含列名 的格式cat_1cat_2cat_3,作为id.vars

最佳答案

reshape2 包中的函数 melt 将数据转换为长格式。它将一组列堆叠成一个列。您可能想要定义 id 变量,它在调用函数后将保持不变。

如果调用时不带参数,melt 将假定因子和字符变量是 id 变量,而所有其他变量都是测量值。此外,它还提供默认列名:“变量”和“值”。结果,旧列名是新列“变量”下的行。

library(reshape2)
> melt(df)
Using sample as id variables
sample variable value
1 one cat_1 2
2 two cat_1 4
3 three cat_1 -6
4 four cat_1 2
5 one cat_2 1
6 two cat_2 2
7 three cat_2 2
8 four cat_2 1
9 one cat_3 5
10 two cat_3 -5
11 three cat_3 7
12 four cat_3 2

对于您的问题,您可以使用以下代码,指定 id_vars,并指定更多信息的列名(结构保持不变):

df2 <- melt(df, id_vars = sample, variable.name = "category", value.name = "value")

> df2
sample category value
1 one cat_1 2
2 two cat_1 4
3 three cat_1 -6
4 four cat_1 2
5 one cat_2 1
6 two cat_2 2
7 three cat_2 2
8 four cat_2 1
9 one cat_3 5
10 two cat_3 -5
11 three cat_3 7
12 four cat_3 2

ggplot(df2, aes( x=category, y=value, group=sample, col=sample)) +
geom_line()

产生以下情节 enter image description here

请告诉我这是否是您想要的。

关于r - 用 R 中的线条按组绘制多个数据集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45025330/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com