r - geom_bar ggplot2 堆叠、分组的带正值和负值的条形图

r - geom_bar ggplot2 堆叠、分组的带正值和负值的条形图 - 金字塔图

转载作者：行者123 更新时间：2023-12-04 23:00:03

34

4

我什至不知道如何描述我试图正确生成的情节，这不是一个好的开始。我将首先向您展示我的数据，然后尝试解释/展示包含数据元素的图像。

我的数据:

   strain condition count.up count.down
1    phbA  balanced      120       -102
2    phbA   limited      114       -319
3    phbB  balanced      122       -148
4    phbB   limited       97       -201
5   phbAB  balanced      268       -243
6   phbAB   limited      140       -189
7    phbC  balanced       55        -65
8    phbC   limited      104       -187
9    phaZ  balanced       99        -28
10   phaZ   limited      147       -205
11   bdhA  balanced      246       -159
12   bdhA   limited      143       -383
13  acsA2  balanced      491       -389
14  acsA2   limited      131       -295

我有七个样本，每个样本有两种情况。对于这些样本中的每一个，我都有下调的基因数量和上调的基因数量(count.down 和 count.up)。

我想绘制此图，以便对每个样本进行分组；所以 phbA 平衡被避开了 phbA 限制。每个条形图的正侧都有一部分(代表 count.up #)，图的负侧有一部分(代表 count.down #)。

我希望“平衡”条件下的条形为一种颜色，而“限制”条件下的条形为另一种颜色。理想情况下，每种颜色会有两个渐变(一个用于 count.up 和一个用于 count.down)，只是为了在条的两个部分之间产生视觉差异。

一些包含我试图整合的元素的图像:

我还尝试应用此 stackoverflow 示例的一些部分，但我不知道如何使其适用于我的数据集。
I like the pos v. neg bars here; a single bar that covers both, and the colour differentiation of it. This does not have the grouping of conditions for one sample, or the colour coding extra layer that differentiates condition

我已经尝试了很多东西，但我不能做对。我想我真的很挣扎，因为很多 geom_bar 示例都使用计数数据，该图会自行计算，而我正在为其提供直接计数数据。当我转移到 stat= "identity" 时，我似乎无法在我的代码中成功地进行这种区分。然后一切都会变得困惑。任何想法或建议将不胜感激!

使用建议的链接:
所以我一直在用它作为模板，但我被卡住了。

df <- read.csv("countdata.csv", header=T) 
df.m <- melt(df, id.vars = c("strain", "condition")) 
ggplot(df.m, aes(condition)) + geom_bar(subset = ,(variable == "count.up"),    aes(y = value, fill = strain), stat = "identity") + geom_bar(subset = ,(variable == "count.down"), aes(y = -value, fill = strain), stat = "identity") + xlab("") + scale_y_continuous("Export - Import",formatter = "comma")

当我尝试运行 ggplot 行时，它返回一个错误:找不到函数“.”。我意识到我没有安装/加载 dplyr，所以我这样做了。
然后我玩了很多，最终想出了:

library(ggplot2)
library(reshape2)
library(dplyr)
library(plyr)

df <- read.csv("countdata.csv", header=T)
df.m <- melt(df, id.vars = c("strain", "condition"))

#this is what the df.m looks like now (if you look at my initial input df, I    just changed in the numbers in excel to all be positive). Included so you can see what the melt does
df.m =read.table(text = "
strain condition   variable value
1    phbA  balanced   count.up   120
2    phbA   limited   count.up   114
3    phbB  balanced   count.up   122
4    phbB   limited   count.up    97
5   phbAB  balanced   count.up   268
6   phbAB   limited   count.up   140
7    phbC  balanced   count.up    55
8    phbC   limited   count.up   104
9    phaZ  balanced   count.up    99
10   phaZ   limited   count.up   147
11   bdhA  balanced   count.up   246
12   bdhA   limited   count.up   143
13  acsA2  balanced   count.up   491
14  acsA2   limited   count.up   131
15   phbA  balanced count.down   102
16   phbA   limited count.down   319
17   phbB  balanced count.down   148
18   phbB   limited count.down   201
19  phbAB  balanced count.down   243
20  phbAB   limited count.down   189
21   phbC  balanced count.down    65
22   phbC   limited count.down   187
23   phaZ  balanced count.down    28
24   phaZ   limited count.down   205
25   bdhA  balanced count.down   159 
26   bdhA   limited count.down   383
27  acsA2  balanced count.down   389
28  acsA2   limited count.down   295", header = TRUE)

这按应变绘制，两种条件下的count.up 和count.down 值

ggplot(df.m, aes(strain)) + geom_bar(subset = .(variable == "count.up"), aes(y = value, fill = condition), stat = "identity") + geom_bar(subset = .(variable == "count.down"), aes(y = -value, fill = condition), stat = "identity") + xlab("") 

#this adds a line break at zero
labels <- gsub("20([0-9]{2})M([0-9]{2})", "\\2\n\\1",
           df.m$strain)


#this adds a line break at zero to improve readability
last_plot() + geom_hline(yintercept = 0,colour = "grey90")

我无法开始工作的一件事(不幸的是)是如何在每个条形框中显示代表“值”的数字。我已经得到了要显示的数字，但我无法将它们放在正确的位置。我要疯了!

我的数据和上面一样；这是我的代码所在的位置

我已经查看了大量使用 geom_text 在躲避图上显示标签的示例。我一直无法成功实现。我得到的最接近的如下 - 任何建议将不胜感激!

library(ggplot2)
library(reshape2)
library(plyr)
library(dplyr)
df <- read.csv("countdata.csv", header=T)
df.m <- melt(df, id.vars = c("strain", "condition"))
ggplot(df.m, aes(strain), ylim(-500:500)) + 
geom_bar(subset = .(variable == "count.up"), 
aes(y = value, fill = condition), stat = "identity", position = "dodge") +
geom_bar(subset = .(variable == "count.down"), 
aes(y = -value, fill = condition), stat = "identity", position = "dodge") + 
geom_hline(yintercept = 0,colour = "grey90")

last_plot() + geom_text(aes(strain, value, group=condition, label=label, ymax = 500, ymin= -500), position = position_dodge(width=0.9),size=4)

这给出了:

你为什么不对齐!

我怀疑我的问题与我实际绘制的方式有关，或者我没有正确地告诉 geom_text 命令如何定位自己的事实。有什么想法吗？

最佳答案

尝试这个。就像用两个语句(一个表示肯定，一个表示否定)来定位条形一样，以相同的方式定位文本。然后，使用 vjust 微调它们的位置(在栏内或栏外) .此外，数据框中没有“标签”变量；我假设标签是 value .

library(ggplot2)

## Using your df.m data frame
ggplot(df.m, aes(strain), ylim(-500:500)) + 
geom_bar(data = subset(df.m, variable == "count.up"), 
   aes(y = value, fill = condition), stat = "identity", position = "dodge") +
geom_bar(data = subset(df.m, variable == "count.down"), 
   aes(y = -value, fill = condition), stat = "identity", position = "dodge") + 
geom_hline(yintercept = 0,colour = "grey90")


last_plot() + 
   geom_text(data = subset(df.m, variable == "count.up"), 
      aes(strain, value, group=condition, label=value),
        position = position_dodge(width=0.9), vjust = 1.5, size=4) +
    geom_text(data = subset(df.m, variable == "count.down"), 
      aes(strain, -value, group=condition, label=value),
        position = position_dodge(width=0.9), vjust = -.5, size=4) +
    coord_cartesian(ylim = c(-500, 500))

关于r - geom_bar ggplot2 堆叠、分组的带正值和负值的条形图 - 金字塔图，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/38268741/

34

4

0

文章推荐： Perl:2GB 后的索引/rindex？

文章推荐： scala - 在Akka中是否必须拥有大师级 Actor ？

文章推荐： javafx - 鼠标悬停更改图标

Android - 条形图、条形图
我想在我的 android 应用程序中实现一个反馈/评级图表。(就像当你打开 google play 并检查应用程序的反馈时，有一个来自投票它的用户的彩色图表)任何人都可以帮助我如何开始那个？感谢您提
LaTeX 条形图
我正在尝试使用 LaTeX 制作条形图。到目前为止我一直不成功，所以任何人都可以帮助我，也许是最近项目的副本？如何使用 pstricks 制作条形图？我会很感激最简单的解决方案，因为我最近才开始使用
r - 将时间线上的时间跨度可视化为水平直方图/条形图
我有一个包含 6 个事件及其发生时间跨度的 csv 表。我的变量是开始日期、结束日期和事件 ID。我打算创建一个水平直方图/条形图可视化来显示时间范围，即某些类型的事件持续了多长时间。 X 轴应该有多
r - float 条形图
我想制作可以指定条形最小值的条形图(很像盒须图中的盒子)。条形图可以做到吗？我怀疑答案在 ggplot 中，但我找不到示例。这是一些数据: X Jan F
r - 条形图 - 两个相邻的条形图和单独窗口中的条形图
我想使用以下数据来创建可视化: > dput(data) structure(c(1264L, 2190L, 2601L, 1441L, 1129L, 2552L, 1820L, 306L,
python - 条形图，带有单独的正值和负值条形图
我有一个包含正值和负值的数据框。我想显示一个显示两个条形的条形图，一个条形显示正值的百分比，另一个条形图显示负值的百分比。 dummy = pd.DataFrame({'A' : [-4, -3, -
javascript - 如何在条形图中添加自定义文本以及如何减小图表js中y轴的步长(条形图)
我正在尝试在栏中插入自定义文本，我搜索了很多线程，但仍然没有得到任何解决方案。然后我想减小 y 轴的步长。我已附上我的代码。 jQuery( document ).ready(function() {
使用子图的 Pandas 条形图
我正在使用 pandas 来创建条形图。这是一个例子: df=pd.DataFrame(np.random.rand(10, 4), columns=['a', 'b', 'c', 'd']) df.
表示范围的 Python 条形图
我想在python中制作一个分类图来表示几个变量的范围。我想也许我会使用条形图并为条形设置范围。这是我的条形图 import matplotlib.pyplot as plt import numpy
javascript - 条形图 - 条形填充和对齐
我有一个显示 3 个条形的堆叠百分比条形图。 JSFiddle:https://jsfiddle.net/Lr0bszj6/ 由于某种原因，条形之间有很多空间并且没有与标签对齐(只有中间一个)。设置
Android aChartEngine 条形图
我正在尝试使用 aChartEngine 将 GPS 数据(正在查看或正在使用的卫星)显示为条形图，但我没有在此 View 中显示任何数据。这是我的代码，所以你能告诉我我犯了什么错误吗？ public
javascript - 条形图将数据堆叠在彼此之上
我正在使用 this chart implementation . 但是，它分散了我的数据，而不是相互堆叠。我想在 1970 年堆叠我的第一个数组，在 1975 年堆叠第二个数组。换句话说，我希望有
Matlab 条形图 - 根据符号和大小填充不同颜色的条形图
我正在尝试用不同颜色为条形图中的各个条形着色，比如蓝色表示正，红色表示负。我在互联网上找不到任何有用的东西。我在下面的代码中发现每个条形图都根据第一个条形图的值着色，而不是为每个条形图单独设置颜色:
python - Pandas 条形图
我刚刚转移到 pandas 0.20/matplotlib 2.0 python 3.6。 (共构成以下版本)。我用 pandas 来绘制条形图，因为 matplotlib 的级别总是太低。着色列的行
python - float 条形图
我正在尝试制作一个图，其中 x 轴是时间，y 轴是一个条形图，其中的条形图覆盖特定时间段，如下所示: ______________
CSS 条形图 - 非常简单
我有一些非常基本的代码，它可以正常工作，除了所有内容都与顶部对齐...理想情况下，条形图应与底部对齐。我想我可以使用固定定位，因为尺寸是 50px x 50px 的平方，但我更喜欢“固定”少一点的东西
VBA 在图表(条形图)上写入值
这是我用来 Dim ejex As String, ejey As String Dim graficos As String Worksheets("Sheet1").Activate ejex =
来自数据文件的 Gnuplot 3D 条形图
我有一个生成如下条形图的 gnuplot 脚本: 输入数据位于具有多列的文件中，每一列最终都构成图表中的一个集群(示例中显示了 2 个集群)。每个文件都构成图表中的一个条形(示例中有 9 个)。每个文
r - 如何使用一个变量连续填充 ggplot2 条形图
我正在为我的数据 movies 使用库 ggplot2movies 请记住，我指的是 mpaa 评级和用户评级，这是两个不同的事物。如果您不想加载 ggplot2movies 库，这里是相关数据的示例
matplotlib - Pandas 条形图-按列指定条形颜色
有没有一种简单的方法可以使用Pandas DataFrame.plot(kind='bar')方法按列名指定条形颜色？我有一个脚本，可以从目录中的几个不同数据文件生成多个DataFrame。例如，它

首页

博学

6Ren·AI

商城

r - geom_bar ggplot2 堆叠、分组的带正值和负值的条形图 - 金字塔图