gpt4 book ai didi

r - R代码库的sqldf和可维护性

转载 作者:行者123 更新时间:2023-12-02 00:00:34 25 4
gpt4 key购买 nike

<分区>

如果要在 R 中构建一个实质性的、组织范围的代码库,依赖 sqldf 包作为数据处理任务的默认方法是否可以接受?或者在可能的情况下,最佳实践是否依赖于使用 R 特定语法的操作?通过依赖 sqldf,人们将大量不同的语法 SQL 引入到他们的 R 代码库中。

我问这个问题时特别考虑到可维护性和风格。我搜索了现有的 R 风格指南,但没有找到任何关于这个主题的内容。

编辑:为了阐明我所关心的工作流程,考虑一个充分使用 sqldf 的数据处理脚本,如下所示:

library(sqldf)
gclust_group<-sqldf("SELECT clust,SUM(trips) AS trips2
FROM gclust
GROUP BY clust")

gclust_group2<-sqldf("SELECT g.*, h.Longitude,h.Latitude,h.withinss, s.trips2
FROM highestd g
LEFT JOIN centers h
ON g.clust=h.clust
LEFT JOIN gclust_group s
ON g.clust=s.clust")

这样的脚本可以持续多行。 (对于熟悉 Hadoop 和 PIG 的人来说,这种风格实际上类似于 PIG 脚本)。大多数工作是使用 SQL 语法完成的,尽管这样做的好处是可以避免复杂的子查询。

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com