gpt4 book ai didi

r - 使用 RMySQL 包的 dbGetQuery 查询多个表

转载 作者:行者123 更新时间:2023-12-02 04:57:33 25 4
gpt4 key购买 nike

在 dbConnect 的帮助下,与 SQL 数据库(例如 DB1 和 DB2)建立了多个连接。如何编写涉及 DB1 和 DB2 表的查询? dbGetQuery 是否只允许查询一个数据库?建立数据库连接后可以利用 sqldf 包吗?

最佳答案

这不是您要找的答案,但我遇到了同样的问题。

简而言之,我会放弃在 SQL 中的 1 个(或多个)数据库中的表之间进行任何连接/分组/子查询的想法。使用 R 中较新的大数据包,特别是 dplyr 或 data.table 几乎没有必要。我能想到 SQL 更快的唯一异常(exception)是当您的查询结果大到足以占用太多 RAM 时。

对我来说一个有趣的用例如下:我来自 MPP 数据库的表大约有 20B 行。问题:查询整个 2M 行的结果集,并使用 dplyr::group_by() 对 3 个变量进行分组,或者只在 SQL 中执行 GROUP BY 以返回 100k 行的最终结果。

在时间上,总会有一个转折点,即 R 或 SQL 更快,除了 MySQL 中的维表连接外,R 几乎总是更快。 (我的例子是关于我的硬件的临界点。)

由于 dplyr 与 SQL 一样易于使用,我不确定我们是否需要再问这个问题。

关于r - 使用 RMySQL 包的 dbGetQuery 查询多个表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20073703/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com