- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在尝试拆分 Microsoft SSMS (SQL Server) 中的数据库,以便在机器学习应用程序中使用数据。
我想以 80/20 的比例将数据分成训练表和测试表。不幸的是,我知道这样做的唯一方法是将表中前 20% 的数据作为测试集,然后将其余数据设置为训练集(从...中选择前 20%)。
我不想这样做,因为那时我的测试和训练集完全基于它们在 SQL 中的组织方式,而不是基于一些随机种子。
我的最终目标是实现 80/20 的训练/测试拆分,以便在 SQL Server 中的 Python 存储过程中使用。
最佳答案
要生成随机分布,您可以按 newid() 排序
:
select top 20 percent * from mytable order by newid()
您可能还想查看自 SQL Server 2015 起可用的 tablesample
子句。它有一个名为 repeatable
的选项,可让查询返回相同的随机数每次运行它时都会记录集(只要给定的种子保持不变并且表未修改)。这对您的用例来说可能很方便:
select top 20 percent * from mytable order by tablesample(20 percent) repeatable(10)
关于python - 按百分比随机划分并存储 SQL 表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58550065/
有没有办法在 Vim 中打开一个文本文件,并在同一个窗口中打开它旁边的 shell? 我发现自己打开脚本进行编辑、更改、关闭 Vim、运行脚本进行测试,然后再次打开 Vim,一遍又一遍。我想我可以有两
使用 pip 或 pip3 安装 pytest 将为 Python2 和 pytest 安装 pytest > 分别适用于Python3。但两者都需要通过输入相同的命令pytest来调用......这
我在使 rem 中的 min-width 与百分比宽度共存时遇到了一些问题。 When resizing this jsfiddle the outer right block is going un
对于在 Windows 7 上从 Java 6 迁移到 Java 7 运行时的迁移项目,我们希望获得以下情况: 机器上同时安装了 JRE 6 和 JRE 7 JRE 6 设置为默认值 JRE 7 将由
我是一名优秀的程序员,十分优秀!