gpt4 book ai didi

java - Spark DataFrame - 选择 n 随机行

转载 作者:搜寻专家 更新时间:2023-10-30 21:17:15 26 4
gpt4 key购买 nike

我有一个包含数千条记录的数据框,我想随机选择 1000 行到另一个数据框中进行演示。我如何在 Java 中执行此操作?

谢谢!

最佳答案

Python 中,您可以打乱行然后取最上面的行:

import org.apache.spark.sql.functions.rand

dataset.orderBy(rand()).limit(n)

关于java - Spark DataFrame - 选择 n 随机行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39344769/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com