- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
sqldf 有一个获取“X”行的限制选项。我们也可以使用 sqldf 做一个 'x%' 样本吗?
例如
> sqldf("select * from iris limit 3")
Loading required package: tcltk
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
> sqldf("select * from iris sample 0.01")
Error in sqliteSendQuery(con, statement, bind.data) :
error in statement: near ".1": syntax error
是否有一些解决方法?
马尼什
最佳答案
这基本上是一个 SQL 问题。由于 sqldf
默认使用 SQLite(这不是绝对正确的,请参阅 ?sqldf
中 drv
的文档以获取更多详细信息),问题沸腾了一直到“如何在 SQLite 中以随机顺序选择行?”。可以在 this SO post 中找到一个简单的答案:
SELECT * FROM table ORDER BY RANDOM() LIMIT 1;
使用问题中的示例:
> sqldf("select * from iris order by RANDOM() limit 3")
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 6.3 3.3 4.7 1.6 versicolor
2 6.0 2.7 5.1 1.6 versicolor
3 5.0 2.0 3.5 1.0 versicolor
编辑:如果给出行的百分比而不是行的数,则以下内容可用作 R 解决方案。可能存在纯 SQLite 解决方案。
percentage <- 0.02
mylimit <- round(nrow(iris) * percentage, 0)
sqldf(sprintf("select * from iris order by RANDOM() limit %d", mylimit))
关于r - 使用 SQLDF 的示例行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32375268/
我希望在 sqldf() 中运行以下 sql 语句: select columnA, "new_column_value" as columnB, "column.C" from mytable wh
我正在尝试使用描述的方法从非常大的 csv 文件中读取选择数据的有效方法 here通过@JD_Long。该方法依赖于同名库中的 sqldf() 函数。我遇到的问题是该函数返回一个空数据框,该数据框具有
我正在读取一个具有'%d/%m/%Y'日期格式的巨大文本文件。我想使用sqldf的read.csv.sql来同时读取和按日期过滤数据。这是为了通过跳过许多我不感兴趣的日期来节省内存使用量和运行时间。我
我需要使用日期字段连接 2 个表 > class(pagos$pseudo_1mes) [1] "Date" > class(pseudo_meses$pseudo_1mes) [1] "Date"
我正在尝试按工作日获取移动平均值,因为我正在使用 sql 查询。数据框是 和sqldf代码: ma_782 = sqldf("SELECT t1.Id_indicator,
我已经在我的系统上全新安装了 sqldf 包,但是每当我运行任何 sql 查询时,我都会得到 Error in rsqlite_send_query(conn@ptr, statement) :
SQLDF 新手在这里。 我有一个大约有 15,000 行和 1 列的数据框。 数据看起来像: cars autocar carsinfo whatisthat donnadrive car tele
我有以下数据框(df11 和 df22)我想使用“UserID=UserID”和日期差 % separate(DateTime, c("Date", "Time"), sep=" ") %>%
今天我发现了一个我无法解释的问题。这是众所周知的行为吗? 数据集: structure(list(Original.Unit = c("some unit", "some unit", "some u
是否可以在 sqldf 中使用 SQL Server 2008 DATEPART() 典型的 SQL 命令? 我正在浏览文档,但没有找到任何与之相关的内容,我不熟悉 SQLite,所以如果我应该那样去
我正在使用 sqldf加入多个表,但我无法保存 times使用 chron 设置的类包上一列。我用了method="name__class" sqldf 的参数函数并用类适本地命名我的列,但我的 ti
我花了一段时间才弄清楚这一点。所以,我是answering my own question . 您有一些 .csv,您想要加载它 fast ,您想使用sqldf包裹。您常用的代码会被一些烦人的字段所困
如何在 R 中使用 sqldf 将 LIKE 子句与内部联接一起使用? 代码: Name <- c("Jack","Jill","Romeo") Name <- as.data.frame(Name)
sqldf 有一个获取“X”行的限制选项。我们也可以使用 sqldf 做一个 'x%' 样本吗? 例如 > sqldf("select * from iris limit 3") Loading re
我正在使用 sqldf 库返回一个具有不同值的数据框,而且只有日期列的最大值。数据框看起来像这样 +------+----------+--------+-----------------+ | NA
这是对此处提供的有关使用 sqldf() 的答案的跟进。 https://stackoverflow.com/a/1820610 在我的特殊情况下,我有一个超过 1.1 亿行的制表符分隔文件。我想选择
这个问题在这里已经有了答案: Regarding sqldf package/regexp function [duplicate] (1 个回答) 关闭 6 年前。 我有以下 mySQL 查询:
我试图用 pandasql::sqldf 循环列表,但这个 sqldf 似乎没有捕获循环变量。以下是我的问题的程式化概述: import pandas as pd from pandasql impo
我在 Linux 上运行 R 版本 2.14.1。当我尝试使用 安装 sqldf 时 install.packages(sqldf, dependencies=TRUE) 我收到以下错误:(这些错误导
我的目标是采用 'matr',按列 c1 对其进行排序,并保持 unique(c1) where c2 = 1。例如,从这段代码... c1 = c("a",'a','a','b','b','b','
我是一名优秀的程序员,十分优秀!