- mongodb - 在 MongoDB mapreduce 中,如何展平值对象?
- javascript - 对象传播与 Object.assign
- html - 输入类型 ="submit"Vs 按钮标签它们可以互换吗?
- sql - 使用 MongoDB 而不是 MS SQL Server 的优缺点
在 pandas 中按行或按列对数据帧进行洗牌的简单而有效的方法是什么? IE。如何编写函数shuffle(df, n, axis=0)
这需要一个数据帧,许多洗牌n
, 和一个轴(axis=0
是行,axis=1
是列)并返回已洗牌的数据帧的副本 n
次。
编辑:关键是在不破坏数据框的行/列标签的情况下执行此操作。如果你只是洗牌df.index
这会丢失所有这些信息。我想要结果 df
除了行的顺序或列的顺序不同之外,与原来的相同。
Edit2:我的问题不清楚。当我说洗牌时,我的意思是独立洗牌每一行。因此,如果您有两列 a
和 b
,我希望每一行都自己洗牌,这样你在 a
之间就没有相同的关联。和 b
就像您只是将每一行作为一个整体重新排序一样。类似的东西:
for 1...n:
for each col in df: shuffle column
return new_df
但希望比简单循环更有效。这对我不起作用:
def shuffle(df, n, axis=0):
shuffled_df = df.copy()
for k in range(n):
shuffled_df.apply(np.random.shuffle(shuffled_df.values),axis=axis)
return shuffled_df
df = pandas.DataFrame({'A':range(10), 'B':range(10)})
shuffle(df, 5)
最佳答案
使用numpy的random.permuation
函数:
In [1]: df = pd.DataFrame({'A':range(10), 'B':range(10)})
In [2]: df
Out[2]:
A B
0 0 0
1 1 1
2 2 2
3 3 3
4 4 4
5 5 5
6 6 6
7 7 7
8 8 8
9 9 9
In [3]: df.reindex(np.random.permutation(df.index))
Out[3]:
A B
0 0 0
5 5 5
6 6 6
3 3 3
8 8 8
7 7 7
9 9 9
1 1 1
2 2 2
4 4 4
关于python - 改组/排列 Pandas 中的DataFrame,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15772009/
我有以下字符串到 json 代码: json = new JSONObject( "{\"Questions\":{"
我在 C++ 中有一个包含 20 个整数的数组,我想打乱它们(随机顺序)。 我还想以这样的方式对它们进行排序,即前 10 个数字按升序排列最小,其余的只是随机的。 有没有办法自动执行此操作? 最佳答案
我正在尝试在 Java 上实现 Fisher-Yates 洗牌算法。它可以工作,但是当我的 ArrayList 的大小大于 100000 时,它会变得非常慢。我将向您展示我的代码,您是否看到任何优化代
有问题的代码: random_items = random.shuffle(Item.query.all())[20:30] 它在 Flask/SQLAlchemy 应用程序中。Item 是模型。
我目前正在尝试找到一种方法来按行随机化数据框中的项目。我在 pandas ( shuffling/permutating a DataFrame in pandas ) 中发现了这个关于 shuffl
在 pandas 中按行或按列对数据帧进行洗牌的简单而有效的方法是什么? IE。如何编写函数shuffle(df, n, axis=0)这需要一个数据帧,许多洗牌n , 和一个轴(axis=0 是行,
我刚开始接触 Objective-C,我正在尝试对数组进行排序,以使其差异尽可能小。 int main() { NSAutoreleasePool * pool = [[NSAutorelea
我正在使用此代码使用 Fisher-Yates 随机化算法的变体生成 vector 的随机排列(我从第一个元素到最后一个元素,而不是相反)。我在一个程序中全局使用 boost::random::mt1
哪些 SSE/AVX 指令将 channel 从 a 打乱为 b 和 c? float4 a = {data[0], data[1], data[2], data[3]}; float4 b = {d
15 个中!数字 1-15 的可能排列,我需要选择 10!他们是随机的。 不幸的是,虽然 this answer 中的方法如果我迭代前 10 个排列,可以避免存储所有排列并对其进行洗牌时遇到的内存不足
我是一名优秀的程序员,十分优秀!