R:从一系列类别中随机抽取偶数个观察值-6ren

R:从一系列类别中随机抽取偶数个观察值

转载作者：行者123 更新时间：2023-12-04 00:35:59

25

4

我之前从我的数据框中随机抽取了邮政编码样本，然后意识到我并没有在所有更高级别的统计单位中进行抽样。我有大约 100 万个邮政编码和 7000 个中间输出统计单位。我希望样本中每个统计单位的邮政编码数量大致相同。

如何从每个更高级别的统计单位中随机抽取 35 个邮政编码？

我之前使用以下代码随机抽取了 250,000 个邮政编码:

total.sample <- total[sample(1:nrow(total), 250000,
                           replace=FALSE),]

如何根据另一个列变量(例如更高级别的统计单位(参见下面数据框结构中的 msoa.rank))指定邮政编码的随机样本配额？

数据库结构:

'data.frame':   1096289 obs. of  25 variables:
$ pcd                : Factor w/ 986055 levels "AL100AB","AL100AD",..: 282268 282258 
$ mbps2              : int  0 1 0 0 0 1 0 0 0 0 ...
$ averagesp          : num  16 7.8 7.8 9.5 9.4 3.2 11.1 19.4 10.5 11.8 ...
$ mediansp           : num  18.2 8 7.8 8.1 8.5 3.2 8.1 18.7 9.7 8.9 ...
$ nga                : int  0 0 0 0 0 0 0 0 0 0 ...
$ x                  : int  533432 532192 533416 533223 532866 531394 532899 532744 
$ total.dps          : int  11 91 10 7 9 10 3 5 21 12 ...
$ connections.density: num  7.909 0.747 3.1 7.714 1.889 ...
$ urban              : int  1 1 1 1 1 1 1 1 1 1 ...
$ gross.pay          : num  36607 36607 36607 36607 36607 ...
$ p.tert             : num  98.8 98.8 98.8 98.8 98.8 ...
$ p.kibs             : num  70.3 70.3 70.3 70.3 70.3 ...
$ density            : num  25.5 25.5 25.5 25.5 25.5 25.5 25.5 25.5 25.5 25.5 ...
$ p_m_s              : num  93.5 93.5 93.5 93.5 93.5 ...
$ p_m_l              : num  6.52 6.52 6.52 6.52 6.52 ...
$ p.edu              : num  62.6 62.6 62.6 62.6 62.6 ...
$ p.claim            : num  1.58 1.58 1.58 1.58 1.58 ...
$ p.non.white        : num  21.4 21.4 21.4 21.4 21.4 21.4 21.4 21.4 21.4 21.4 ...
$ msoa.rank          : int  2 2 2 2 2 2 2 2 2 2 ...
$ oslaua.rank        : int  321 321 321 321 321 321 321 321 321 321 ...
$ nuts2.rank         : int  22 22 22 22 22 22 22 22 22 22 ...
$ gor.rank           : int  8 8 8 8 8 8 8 8 8 8 ...
$ cons               : int  1 1 1 1 1 1 1 1 1 1 ...

pcd = zip

msoa.rank = 每个中间产出统计单元的序数变量

最佳答案

这个 ~~很简单~~ 有望很快在dplyr中得到修复(谢谢，@Henrik!)

library(dplyr)
yourSample <- yourData %>%
    group_by(msoa.rank) %>%
    sample_n(size = 35) # currently buggy

在那之前，这里有一个解决方法，(感谢@beginneR)

yourSample <- yourData %>%
    group_by(msoa.rank) %>%
    do(sample_n(., size = 35))

或者坚持使用普通的旧 plyr 进行分组。

library(plyr)
yourSample <- ddply(yourData, "msoa.rank", .fun = function(x) {sample_n(x, size = 35)})

关于R:从一系列类别中随机抽取偶数个观察值，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/24499066/

25

4

0

文章推荐： php - 登录成功后如何跳转？ [PHP]

文章推荐： bluetooth - BLE 堆栈的开源实现

文章推荐： php - 覆盖模型 tostring 方法

java - 偶数/奇数相加的方法
我有一个包含多个数字的数组: int[] tab = {1,2,3,4}; 我必须创建两个方法，第一个是 sum() 方法，第二个是 numberOdd()。这一步就OK了! int length
javascript - 偶数/非偶数列表项中断功能
我一直在研究这个简单的待办事项列表，现在正处于调试阶段。当我实现不同的更改时，我观察到以下情况保留列表中的所有项目:我添加 1 项，没问题。我添加了 2 个项目，但没有任何效果 - 无法标记完整/不
正则表达式:如何确定给定字符之前的字符出现的奇数/偶数？
我想仅在未引用的术语中将 | 替换为 OR，例如: "this | that" | "the | other" -> "this | that" OR "the | other" 是的，我可以分割空格
c - 如何在C中不使用算术运算符来查找奇数/偶数？
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 7 年前。 Improve this ques
java - 查找奇数/偶数
我在一些练习中得到了这个示例代码，它展示了如何查找整数是奇数还是偶数。 int x = 4; if ( (x & 1) == 0 ) { System.out.prin
javascript 表单中的奇数/偶数
我无法制作简单的 JavaScript 来获取文本框中的数字，并在单击按钮时返回结果。 function check() { var v=document.getElem
c - 偶数 - 初学者
我是一名初学者，我正在尝试创建一个程序，该程序将生成仅由偶数组成的数字，并四舍五入到最接近的偶数。例子: 135 --> 200 2700 --> 2800 我有一个代码，但每当我尝试打印它时，数字
c - 用多个数字返回C中的奇数/偶数
我正在尝试编写一个程序，它将接受两个数字并根据它们的值返回两个都是奇数，两个都是偶数，或者 A 是奇数而 B 是偶数，等等。我设法让程序检查一个变量，但如果我添加第二个变量，我会得到一个我不期望的输
javascript - 从链表中删除奇数/偶数
这是一个带有数据和下一个属性的标准链表。这就是我正在尝试的: class Node { constructor(data, next) { this.data = data;
java - 正则表达式奇数/偶数
我有一个正则表达式问题，我不知道该怎么做。它必须匹配开头包含任意数量的 a 的所有字符串，然后如果 a 的数量是偶数则匹配单个 0，如果 a 的数量是奇数则匹配单个 1。如何跟踪偶数/奇数？示例
php - javascript循环数组中的奇数/偶数
我试图在数组中执行一个循环，对内容进行排序并创建每个具有 2 个值的 div。尝试了很多东西，但我不知道我需要做什么。这就是我需要做的:在数组中循环并创建 div。每个 div 应该有 2 个数组
C# 加载整数并显示奇数/偶数
您好，想知道是否有更简单的方法来显示奇数/偶数。我知道我可以做一个 for 循环并加载一个列表。然后我可以写另一个for循环遍历列表并检查值是否为奇数/偶数: for(i=0; i i % 2 ==
CSS:如果类是奇数/偶数，则更改边距
我正在尝试改变边距以使图像上下呈之字形。我发现this article很接近，但将一项更改应用于所有 .brochureImg 类。我做错了什么？ HTML GP &
java - 堆栈重新排列堆栈奇数偶数
我编写这个方法来重新排列两个堆栈的元素，使堆栈 s1 只包含偶数整数，堆栈 s2 只包含奇数整数。并且 s1 或 s2 中不应存储任何零。 public static void rerange(sta
javascript - 如何将未知整数划分为给定数量的(几乎)偶数
我需要帮助才能将未知整数分成给定数量的偶数部分——或者至少尽可能地均匀。各部分之和应为原值，但各部分应为整数，且应尽可能接近。参数 num: Integer - 应该被分成相等部分的数字 parts
java - 偶数、奇数和偶数消费者-生产者
我在这里想做的是由偶数消费者打印偶数，由奇数消费者打印奇数。有一个 evenodd 方法，它基本上消耗任何数字并打印(无论是偶数还是奇数)。我有 2 个偶数消费者线程、2 个奇数消费者线程、2 个偶
c - 在C中查找BST中奇数/偶数/负数的数量
已关闭。此问题需要 debugging details 。目前不接受答案。编辑问题以包含 desired behavior, a specific problem or error, and the
c# - 奇数/偶数 - 排序数组
谁能帮忙。我必须编写一个程序，让用户输入 10 个数字。并将这些数字按奇数(升序)和偶数(降序)排序。例如:输入:2、8、7、13、23、9、34、11、1、16输出:1、7、9、11、13、23、
python 合并两个列表(偶数/奇数元素)
给定两个列表，我想合并它们，以便第一个列表中的所有元素都是偶数索引(保留它们的顺序)，第二个列表中的所有元素都是奇数索引(也保留它们的顺序)。示例如下: x = [0,1,2] y = [3,4] r
javascript - JQuery 设置总数的奇数、偶数
我有一个表，对列和行进行求和，并显示求和的结果。我必须改变每个总数的颜色。如果是偶数，则将其设置为“绿色”。如果是奇数，则将其设置为“红色” 这是我的 table :

首页

博学

6Ren·AI

商城

R:从一系列类别中随机抽取偶数个观察值