- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我在 R 中偶然发现了一个问题,我希望有人能弄清楚它发生的原因以及如何解决它。我对 R 的使用没有很好的审查,有时我会感到困惑,因为一行代码通常可以比许多其他语言做更多的事情。问题似乎是程序在第一次之后没有正确地获取文件输入。如果我输入一个文件,直方图会以我期望的方式出现。但不幸的是,当输入多个文件时,它会将它们组合在一起并将它们放在第一个文件旁边。我宁愿每个输入文件都有自己独立的直方图。很抱歉这篇长文,但我试图提供尽可能多的信息以使我的代码可重现(我似乎不擅长重现代码)。
代码是这样的:
library("tcltk")
#choose any number of files
File.names<-(tk_choose.files(default="", caption="Choose your files", multi=TRUE, filters=NULL, index=1))
Num.Files<-NROW(File.names)
#read the tables
dat <- lapply(File.names,read.table,header = TRUE)
names(dat) <- paste("f", 1:length(Num.Files), sep="")
#use the 14th columns data
tmp <- stack(lapply(dat,function(x) x[,14]))
#this is where the histogram is made(with percent shown on the y axis)
require(ggplot2)
ggplot(tmp,aes(x = values)) +
facet_wrap(~ind) +
geom_histogram(aes(y=..count../sum(..count..)))
dput(tmp)
dput(dat)
sessionInfo()
Targ cov av_cov 87A_cvg 87Ag 87Agr 87Agr 87A_gra 87A%_1 87A%_3 87A%_5 87A%_10 87A%_20 87A%_30 87A%_40 87A%_50 87A%_75 87A%_100
1:028 400 0.42 400 0.42 1 1 2 41.8 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
1:296 400 0.42 400 0.42 1 1 2 41.8 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
1:453 1646 8.11 1646 8.11 7 8 13 100.0 100.0 87.2 32.0 0.0 0.0 0.0 0.0 0.0 0.0
1:427 1646 8.11 1646 8.11 7 8 13 100.0 100.0 87.2 32.0 0.0 0.0 0.0 0.0 0.0 0.0
1:736 5105 29.68 5105 29.68 14 29 48 100.0 100.0 100.0 86.0 65.7 49.4 35.5 16.9 0.0 0.0
1:514 5105 29.68 5105 29.68 14 29 48 100.0 100.0 100.0 86.0 65.7 49.4 35.5 16.9 0.0 0.0
1:296 5105 29.68 5105 29.68 14 29 48 100.0 100.0 100.0 86.0 65.7 49.4 35.5 16.9 0.0 0.0
1:534 400 0.42 400 0.42 1 1 2 41.8 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
Targ cov av_cov 87A_cvg 87Ag 87Agr 87Agr 87A_gra 87A%_1 87A%_3 87A%_5 87A%_10 87A%_20 87A%_30 87A%_40 87A%_50 87A%_75 87A%_100
1:028 400 0.42 400 0.42 1 1 2 41.8 0.0 1.0 0.0 20.0 0.0 0.0 0.0 0.0 0.0
1:296 400 0.42 400 0.42 1 1 2 41.8 0.0 20.0 0.0 40.0 0.0 100.0 10.0 50.0 4.0
1:453 1646 8.11 1646 8.11 7 8 13 100.0 100.0 87.2 32.0 0.0 100.0 4.0 60.0 30.0 20.0
1:427 1646 8.11 1646 8.11 7 8 13 100.0 100.0 87.2 32.0 0.0 80.0 40.0 60.0 80.0 90.0
1:736 5105 29.68 5105 29.68 14 29 48 100.0 100.0 100.0 86.0 65.7 49.4 35.5 16.9 30.0 20.0
1:514 5105 29.68 5105 29.68 14 29 48 100.0 100.0 100.0 86.0 65.7 49.4 35.5 16.9 20.0 30.0
1:296 5105 29.68 5105 29.68 14 29 48 100.0 100.0 100.0 86.0 65.7 49.4 35.5 16.9 20.0 30.0
1:534 400 0.42 400 0.42 1 1 2 41.8 0.0 40.0 30.0 80.0 70.0 40.0 30.0 30.0 10.0
> dput(tmp)
structure(list(values = c(0, 0, 0, 0, 49.4, 49.4, 49.4, 0), ind = structure(c(1L,
1L, 1L, 1L, 1L, 1L, 1L, 1L), .Label = "f1", class = "factor")), .Names = c("values",
"ind"), row.names = c(NA, -8L), class = "data.frame")
> dput(dat)
structure(list(f1 = structure(list(Targ = structure(c(1L, 2L,
4L, 3L, 7L, 5L, 2L, 6L), .Label = c("1:028", "1:296", "1:427",
"1:453", "1:514", "1:534", "1:736"), class = "factor"), cov = c(400L,
400L, 1646L, 1646L, 5105L, 5105L, 5105L, 400L), av_cov = c(0.42,
0.42, 8.11, 8.11, 29.68, 29.68, 29.68, 0.42), "X87A_cvg", "X87Ag", "X87Agr", "X87Agr.1", "X87A_gra", "X87A._1", "X87A._3", "X87A._5", "X87A._10", "X87A._20", "X87A._30", "X87A._40",
"X87A._50", "X87A._75", "X87A._100"), class = "data.frame", row.names = c(NA,
-8L))), .Names = "f1")
> sessionInfo()
R version 2.14.1 (2011-12-22)
Platform: x86_64-redhat-linux-gnu (64-bit)
locale:
[1] LC_CTYPE=en_US.UTF-8 LC_NUMERIC=C
[3] LC_TIME=en_US.UTF-8 LC_COLLATE=en_US.UTF-8
[5] LC_MONETARY=en_US.UTF-8 LC_MESSAGES=en_US.UTF-8
[7] LC_PAPER=C LC_NAME=C
[9] LC_ADDRESS=C LC_TELEPHONE=C
[11] LC_MEASUREMENT=en_US.UTF-8 LC_IDENTIFICATION=C
attached base packages:
[1] tcltk stats graphics grDevices utils datasets methods
[8] base
other attached packages:
[1] ggplot2_0.9.1
loaded via a namespace (and not attached):
[1] colorspace_1.1-1 dichromat_1.2-4 digest_0.5.2 grid_2.14.1
[5] labeling_0.1 MASS_7.3-17 memoise_0.1 munsell_0.3
[9] plyr_1.7.1 proto_0.3-9.2 RColorBrewer_1.0-5 reshape2_1.2.1
[13] scales_0.2.1 stringr_0.6
最佳答案
鉴于您的 dat
正在返回 dat
的损坏数据帧在我的系统上,这是一种使用带有虚拟数据的基本 R 的更简单方法。
## fake a list of data frames, here, 4, each with two columns
dat <- list(file1 = data.frame(X = runif(20), Y = rnorm(20)),
file2 = data.frame(X = runif(20), Y = runif(20)),
file3 = data.frame(X = runif(20),
Y = rnorm(20) + rnorm(20, mean = 2, sd = 2)),
file4 = data.frame(X = runif(20), Y = rnorm(20, mean = 4)))
## extract the second column from each
## (this is the same as your code extracting the 14 column)
tmp <- lapply(dat, `[[`, 2)
R> str(tmp)
List of 4
$ file1: num [1:20] -1.0225 -0.0302 -0.0987 1.977 0.2579 ...
$ file2: num [1:20] 0.84583 0.49525 0.12287 0.43929 0.00132 ...
$ file3: num [1:20] 2.03 5.27 1.57 2.72 1.12 ...
$ file4: num [1:20] 4.54 4.08 4.28 4.48 6.36 ...
tmp
的第一个分量:
hist(tmp[[1]])
layout(matrix(1:4, ncol = 2))
for(p in seq_along(tmp)) {
hist(tmp[[p]])
}
layout(1)
lapply()
为我们做循环
layout(matrix(1:4, ncol = 2))
lapply(tmp, function(x) {hist(x); invisible()})
layout(1)
关于给定多个输入的R ggplot直方图,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11905136/
我正在从 Stata 迁移到 R(plm 包),以便进行面板模型计量经济学。在 Stata 中,面板模型(例如随机效应)通常报告组内、组间和整体 R 平方。 I have found plm 随机效应
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 想改进这个问题?将问题更新为 on-topic对于堆栈溢出。 6年前关闭。 Improve this qu
我想要求用户输入整数值列表。用户可以输入单个值或一组多个值,如 1 2 3(spcae 或逗号分隔)然后使用输入的数据进行进一步计算。 我正在使用下面的代码 EXP <- as.integer(rea
当 R 使用分类变量执行回归时,它实际上是虚拟编码。也就是说,省略了一个级别作为基础或引用,并且回归公式包括所有其他级别的虚拟变量。但是,R 选择了哪一个作为引用,以及我如何影响这个选择? 具有四个级
这个问题基本上是我之前问过的问题的延伸:How to only print (adjusted) R-squared of regression model? 我想建立一个线性回归模型来预测具有 15
我在一台安装了多个软件包的 Linux 计算机上安装了 R。现在我正在另一台 Linux 计算机上设置 R。从他们的存储库安装 R 很容易,但我将不得不使用 安装许多包 install.package
我正在阅读 Hadley 的高级 R 编程,当它讨论字符的内存大小时,它说: R has a global string pool. This means that each unique strin
我们可以将 Shiny 代码写在两个单独的文件中,"ui.R"和 "server.R" , 或者我们可以将两个模块写入一个文件 "app.R"并调用函数shinyApp() 这两种方法中的任何一种在性
我正在使用 R 通过 RGP 包进行遗传编程。环境创造了解决问题的功能。我想将这些函数保存在它们自己的 .R 源文件中。我这辈子都想不通怎么办。我尝试过的一种方法是: bf_str = print(b
假设我创建了一个函数“function.r”,在编辑该函数后我必须通过 source('function.r') 重新加载到我的全局环境中。无论如何,每次我进行编辑时,我是否可以避免将其重新加载到我的
例如,test.R 是一个单行文件: $ cat test.R # print('Hello, world!') 我们可以通过Rscript test.R 或R CMD BATCH test.R 来
我知道我可以使用 Rmd 来构建包插图,但想知道是否可以更具体地使用 R Notebooks 来制作包插图。如果是这样,我需要将 R Notebooks 编写为包小插图有什么不同吗?我正在使用最新版本
我正在考虑使用 R 包的共享库进行 R 的站点安装。 多台计算机将访问该库,以便每个人共享相同的设置。 问题是我注意到有时您无法更新包,因为另一个 R 实例正在锁定库。我不能要求每个人都关闭它的 R
我知道如何从命令行启动 R 并执行表达式(例如, R -e 'print("hello")' )或从文件中获取输入(例如, R -f filename.r )。但是,在这两种情况下,R 都会运行文件中
我正在尝试使我当前的项目可重现,因此我正在创建一个主文档(最终是一个 .rmd 文件),用于调用和执行其他几个文档。这样我自己和其他调查员只需要打开和运行一个文件。 当前设置分为三层:主文件、2 个读
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 想改进这个问题?将问题更新为 on-topic对于堆栈溢出。 5年前关闭。 Improve this qu
我的 R 包中有以下描述文件 Package: blah Title: What the Package Does (one line, title case) Version: 0.0.0.9000
有没有办法更有效地编写以下语句?accel 是一个数据框。 accel[[2]]<- accel[[2]]-weighted.mean(accel[[2]]) accel[[3]]<- accel[[
例如,在尝试安装 R 包时 curl作为 usethis 的依赖项: * installing *source* package ‘curl’ ... ** package ‘curl’ succes
我想将一些软件作为一个包共享,但我的一些脚本似乎并不能很自然地作为函数运行。例如,考虑以下代码块,其中“raw.df”是一个包含离散和连续类型变量的数据框。函数“count.unique”和“squa
我是一名优秀的程序员,十分优秀!