gpt4 book ai didi

postgresql - 在 PL/R 中加载、列出和使用 R 模块和函数

转载 作者:行者123 更新时间:2023-11-29 11:54:40 24 4
gpt4 key购买 nike

我遇到了困难:

  • 列出 PostgreSQL 可用的 R 包和函数。
  • 安装用于 PL/R 的包(例如 Kendall)
  • 在 PostgreSQL 中调用 R 函数

列出可用的 R 包

Q.1.您如何找出已加载的 R 模块?

SELECT * FROM r_typenames();

这显示了可用的类型,但是检查是否加载了 Kendall( X, Y ) 呢?例如,documentation显示:

CREATE TABLE plr_modules (
modseq int4,
modsrc text
);

这似乎允许插入记录来指示要加载 Kendall,但是下面的代码没有从语法上解释如何确保它被加载:

INSERT INTO plr_modules
VALUES (0, 'pg.test.module.load <-function(msg) {print(msg)}');

Q.2.如果您尝试加载 Kendall,上面的行会是什么样子?
Q.3.是否适用?

安装 R 包

使用“synaptic”包管理器安装了以下包:

r-base
r-base-core
r-base-dev
r-base-html
r-base-latex
r-cran-acepack
r-cran-boot
r-cran-car
r-cran-chron
r-cran-cluster
r-cran-codetools
r-cran-design
r-cran-foreign
r-cran-hmisc
r-cran-kernsmooth
r-cran-lattice
r-cran-matrix
r-cran-mgcv
r-cran-nlme
r-cran-quadprog
r-cran-robustbase
r-cran-rpart
r-cran-survival
r-cran-vr
r-recommended

Q.4.我怎么知道 Kendall 是否在里面?
Q.5.如果不是,我如何找出它在哪个包中?
Q.6. 如果它不在适合使用 apt-get 安装的包中(aptitudesynapticdpkg,你有什么),我该如何在 Ubuntu 上安装它?
Q.7.安装步骤记录在哪里?

调用 R 函数

我有以下代码:

EXECUTE 'SELECT '
'regr_slope( amount, year_taken ),'
'regr_intercept( amount, year_taken ),'
'corr( amount, year_taken ),'
'sum( measurements ) AS total_measurements '
'FROM temp_regression'
INTO STRICT slope, intercept, correlation, total_measurements;

此代码调用 PostgreSQL 函数 corr 来计算 Pearson 对数据的相关性。理想情况下,我想执行以下操作(通过将 corr 切换为 plr_kendall):

EXECUTE 'SELECT '
'regr_slope( amount, year_taken ),'
'regr_intercept( amount, year_taken ),'
'plr_kendall( amount, year_taken ),'
'sum( measurements ) AS total_measurements '
'FROM temp_regression'
INTO STRICT slope, intercept, correlation, total_measurements;

问题 8. 我必须自己编写 plr_kendall 吗?
Q.9.我在哪里可以找到一个简单的遍历示例:

  1. 将 R 模块加载到 PG。
  2. 为所需的 R 函数编写 PG 包装器。
  3. 从 SELECT 调用 PG 包装器。

例如,最后两个步骤是否如下所示:

create or replace function plr_kendall( _float8, _float8 ) returns float as '
agg_kendall(arg1, arg2)
' language 'plr';

CREATE AGGREGATE agg_kendall (
sfunc = plr_array_accum,
basetype = float8, -- ???
stype = _float8, -- ???
finalfunc = plr_kendall
);

然后是上面的SELECT

谢谢!

最佳答案

概览

这些步骤列出了如何使用 PL/R 从 PostgreSQL 调用 R 函数。

先决条件

您必须已经安装了 PostgreSQL、R 和 PL/R。

步骤

  1. 查找 R 模块名称(例如 Kendall)
  2. 更改为数据库用户: <pre>sudo su - postgres</pre>
  3. 运行 R <pre>R</pre>
  4. 安装 R 模块(接受 $HOME/R/x86_64-pc-linux-gnu-library/2.9/): <pre>install.packages("Kendall", dependencies = TRUE)</pre>
  5. 出现提示时选择一个 CRAN 镜像。
  6. 创建下表: <pre>CREATE TABLE plr_modules (
    modseq int4,
    modsrc text
    );</pre>
  7. 在该表中插入加载相关 R 模块的指令: <pre>INSERT INTO plr_modules
    VALUES (0, 'library(Kendall)' );</pre>
  8. 重启数据库(或 SELECT * FROM reload_plr_modules(); ): <pre>sudo /etc/init.d/postgresql-8.4 restart</pre>
  9. 在 PostgreSQL 中创建一个包装函数: <pre>CREATE OR REPLACE FUNCTION climate.plr_corr_kendall(
    double precision[],
    double precision[] )
    RETURNS double precision AS
    $BODY$
    Kendall(arg1, arg2)
    $BODY$
    LANGUAGE 'plr' VOLATILE STRICT;</pre>
  10. 创建一个使用包装函数的函数。
  11. 测试新功能。

包装函数

此函数执行从数据库收集数据并创建两个数组的工作。这些数组被传递到 plr_corr_kendall包装函数。

CREATE OR REPLACE FUNCTION climate.analysis_vector()
RETURNS double precision AS
$BODY$
DECLARE
v_year_taken double precision[];
v_amount double precision[];
i RECORD;
BEGIN
FOR i IN (
SELECT
extract(YEAR FROM m.taken) AS year_taken,
avg( m.amount ) AS amount
FROM
climate.city c,
climate.station s,
climate.station_category sc,
climate.measurement m
WHERE
c.id = 5148 AND
earth_distance(
ll_to_earth(c.latitude_decimal,c.longitude_decimal),
ll_to_earth(s.latitude_decimal,s.longitude_decimal)) <= 30 AND
s.elevation BETWEEN 0 AND 3000 AND
s.applicable AND
sc.station_id = s.id AND
sc.category_id = 1 AND
extract(YEAR FROM sc.taken_start) >= 1900 AND
extract(YEAR FROM sc.taken_end) <= 2009 AND
m.station_id = s.id AND
m.taken BETWEEN sc.taken_start AND sc.taken_end AND
m.category_id = sc.category_id
GROUP BY
extract(YEAR FROM m.taken)
ORDER BY
extract(YEAR FROM m.taken)
) LOOP
SELECT array_append( v_year_taken, i.year_taken ) INTO v_year_taken;
SELECT array_append( v_amount, i.amount::double precision ) INTO v_amount;
END LOOP;

RAISE NOTICE '%', v_year_taken;
RAISE NOTICE '%', v_amount;

RETURN climate.plr_corr_kendall( v_year_taken, v_amount );
END;
$BODY$
LANGUAGE 'plpgsql' VOLATILE
COST 100;

测试

测试函数如下:

SELECT
*
FROM
climate.analysis_vector();

结果

一个数字:-0.0578900910913944

关于postgresql - 在 PL/R 中加载、列出和使用 R 模块和函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2932028/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com