- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在努力使用具有 3078 个观察值的分层随机抽样来创建大小为 100 的分层样本。分层随机抽样必须满足的条件是:FARMS92<100,介于 100 和 300 之间,介于 300 和 600 之间,并且 FARMS92>600 作为分层,并使用比例分配。
当我遵循分层功能时,我不明白如何进行:https://gist.github.com/mrdwab/6424112
这是我的数据集:
COUNTY STATE ACRES92 ACRES87 FARMS92
1 ALEUTIAN AK 683533 726596 764514
2 ANCHORAGE AK 47146 59297 256709
3 FAIRBANKS AK 141338 154913 204568
4 JUNEAU AK 210 214 127
5 KENAI AK 50810 85712 98035
6 AUTAUGA AL 107259 116050 145044
7 BALDWIN AL 167832 192082 223502
8 BARBOUR AL 177189 207906 222066
9 BIBB AL 48022 50818 49630
10 BLOUNT AL 137426 140107 163638
11 BULLOCK AL 144799 156332 185304
12 BUTLER AL 96427 99997 124491
13 CALHOUN AL 73841 90474 93248
14 CHAMBERS AL 109555 102153 121101
15 CHEROKEE AL 121504 119956 143656
能否请您解释一下如何进行的步骤?
最佳答案
您可以先分成多个箱子,例如<100,介于 100 和 300 之间,等等,使用 cut
函数。
data$cut <- cut(data$FARMS92, breaks = c(0,100,300,600, 1E7), labels = c("A","B","C", "D"), right = TRUE)
然后使用stratify
函数(https://gist.github.com/mrdwab/6424112)。
stratified(data, "cut", size = c(2,2,2,2))
对于这个特定的示例,我使用了 size = c(2,2,2,2)
,它将从每个 bin 中返回 2。由于您想要样本大小 = 100,因此相应地调整大小。例如,对于比例分配,您可以对原始数据集使用如下内容:size = round(100 * prop.table(table(data$cut)), 0)
。
输出:
COUNTY STATE ACRES92 ACRES87 FARMS92 cut
7 BALDWIN AL 167832 192082 22 A
6 AUTAUGA AL 107259 116050 14 A
4 JUNEAU AK 210 214 127 B
12 BUTLER AL 96427 99997 124 B
11 BULLOCK AL 144799 156332 385 C
15 CHEROKEE AL 121504 119956 436 C
9 BIBB AL 48022 50818 49630 D
8 BARBOUR AL 177189 207906 222066 D
我修改了您的数据集以生成更好的工作示例。数据:
data <- read.table(text= "COUNTY STATE ACRES92 ACRES87 FARMS92
1 ALEUTIAN AK 683533 726596 76
2 ANCHORAGE AK 47146 59297 2
3 FAIRBANKS AK 141338 154913 204
4 JUNEAU AK 210 214 127
5 KENAI AK 50810 85712 480
6 AUTAUGA AL 107259 116050 14
7 BALDWIN AL 167832 192082 22
8 BARBOUR AL 177189 207906 222066
9 BIBB AL 48022 50818 49630
10 BLOUNT AL 137426 140107 163638
11 BULLOCK AL 144799 156332 385
12 BUTLER AL 96427 99997 124
13 CALHOUN AL 73841 90474 93248
14 CHAMBERS AL 109555 102153 121
15 CHEROKEE AL 121504 119956 436 ", stringsAsFactors=FALSE, header = TRUE)
关于r - R中的分层随机抽样,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43726614/
在 Django 中如何处理分层 URL?有什么最佳做法吗?例如。如果我有一个像 /blog/category1/category2/myblogentry 这样的 URL(使用例如 django-m
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的,
有没有办法在 R 中创建这样的图表? 以下是图表中显示的数据的摘录: df % group_by(Animal) %>% unite(col=Type, Animal:Name, sep =
我一直在努力处理一些时间戳数据(直到现在才需要处理日期,并且它表明)。希望您能帮忙。 我正在处理来自网站的数据,该数据显示每个客户 (ID) 各自的访问以及这些访问的时间戳。它的分组是指一个客户可能有
我一直在努力处理一些时间戳数据(直到现在才需要处理日期,并且它表明)。希望您能帮忙。 我正在处理来自网站的数据,该数据显示每个客户 (ID) 各自的访问以及这些访问的时间戳。它的分组是指一个客户可能有
我正在尝试完成这段代码: ORDER BY IF(j.groups IS NULL OR j.groups = '', IF(j.title IS NULL, i.title), j.groups)
我有一个非常抽象的问题,因为我不确定如何提出它。我的其中一个 View 上有一个 UIImageView。我想让 ImageView 看起来“压入 super View ”。我不确定技术术语是什么,但
我希望 100% 宽的包含图像的 div 位于我的页面下方。在这些 div 之上,我想要一个 1210 像素宽的 div,我可以在其中放置我的内容。 例子: http://mudchallenger.
我目前正在做一个类似于 http://www.beoplay.com/Products/BeoplayA9#under-the-hood 的元素使用 Javascript、HTML5 和 CSS3。我
我想像上面那样创建图像缩略图..为此,我在下面创建了 XML activity_main.xml
我想知道是否可以定义一个分层 MapReduce 作业?。换句话说,我想要一个 map-reduce 作业,在 mapper 阶段将调用不同的 MapReduce 作业。可能吗?您对如何操作有什么建议
程序设计: A 类,实现较低级别的数据处理 类 B-E,为 A 提供更高级别的接口(interface)以执行各种功能 F 类,它是根据用户输入与 B-E 交互的 UI 对象 在任何给定时间只能有一个
CTE 对我来说有点新,所以我希望有人可以帮助我编写的以下内容将采用类别表并从中构建层次结构以进行显示。我知道这种事情一直被问到,但我认为我的排序情况使它有点独特。 我希望有一些使用 Hierarch
我有关于 的问题群 在聚类分析(层次聚类)中。例如,这是 的完全链式的树状图。虹膜数据集 . 我使用后 > table(cutree(hc, 3), iris$Species) 这是输出 : se
数据 我有以下(简化的)数据集,我们称之为 df从现在开始: species rank value 1
Delphi 2009 中的分层窗口和系统菜单存在问题。也就是说,我们的分层窗口(没有边框)没有系统菜单。当我说系统菜单时,我指的是单击应用程序的图标、右键单击其标题栏或(在 Windows 7 中,
我正在制作一个 pototype HMTL5 Canvas 动画,该动画将导出到 Quicktime。 我有一个动态生成的背景,上面有动态屏蔽的元素。 我可以获取要制作的背景,并将其作为逐帧动画(pn
好吧,我有一个打印棋盘的类和另一个打印国际象棋的类 如何使用 LayeredPane 将它们合并在一起,如上面的示例图片所示?我一整天都在尝试,但似乎没有任何效果。我正在使用 JFrame 打印图片。
这是我的场景。我有两个类(class) ClassA 和 ClassB。 B类继承A类。 我在它们两个上使用@Component注释来使它们成为Spring bean。 @Component publ
这不是一道问题题,而是一道使用工具——leiningen——的题。 在一个主项目下创建分层的 lein 项目是否有优势,如果有,优势是什么? 如果我使用 lein new bene-cmp 创建一个项
我是一名优秀的程序员,十分优秀!