gpt4 book ai didi

google-sheets - 使用随机样本填充新的 Google 表格工作表,其中至少包含给定属性的 X 个样本

转载 作者:行者123 更新时间:2023-12-01 09:23:41 24 4
gpt4 key购买 nike

我有一个数据集,我想从中随机抽取样本并将其放入新工作表中。我有一个额外的约束/分层:我想要每个给定属性的 X 个示例。

例如,如果 COL A 有 5 行苹果、5 行香蕉等,我想要一个随机样本,其中包括 2 行苹果、2 行香蕉等,以获得尽可能多的 COL A 值.

我已经走到一半了 a formula to populate a new sheet with a random sample :

A1: =ArrayFormula(FILTER( SORT('My list of 100000 rows'!A:A ;RANDBETWEEN( 0+ROW('My list of 100000 rows'!A:A) ; ROWS('My list of 100000 rows'!A:A)); TRUE); ROW('My list of 100000 rows'!A:A)<=100))

但这并没有让我能够选择每个唯一属性的实例的最小或确切数量。

感谢任何建议!

最佳答案

I would like a random sample which includes 2 Apple rows, 2 Banana rows and so on for as many values of COL A as there are.

在数据左侧和 A1 中插入两列:

=choose(randbetween(1,10),"12","13","14","15","23","24","25","34","35","45")

在 B1 中复制下来以适应:

=countif(C$1:C1,C1)

然后:

=query(A:D,"select C,D where B contains '"&left(A1)&"' or B contains '"&right(A1)&"' ")

关于google-sheets - 使用随机样本填充新的 Google 表格工作表,其中至少包含给定属性的 X 个样本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50724509/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com