gpt4 book ai didi

postgresql - 加入 file_fdw 外表和 postgres_fdw 外表

转载 作者:行者123 更新时间:2023-11-29 13:20:16 27 4
gpt4 key购买 nike

在 postgreSQL 9.5 中:

我有一个名为:sheetheight(由 file_fdw 创建)的外表和一个名为:dzlog(由 postgres_fdw 创建)的外表。

1- 为了连接外部表,我有以下查询:

SELECT * from dzlog INNER JOIN sheetheight ON dzlog.ullid = sheetheight.ullid;

EXPLAIN ANALYZE 为上述查询返回:

-------------------------------------------------
Hash Join (cost=111.66..13688.18 rows=20814 width=2180) (actual time=7670.872.
.8527.844 rows=2499 loops=1)
Hash Cond: (sheetheight.ullid = dzlog.ullid)
-> Foreign Scan on sheetheight (cost=0.00..12968.10 rows=106741 width=150)
(actual time=0.116..570.571 rows=223986 loops=1)
Foreign File: D:\code\sources\sheetHeight_20151025_221244_0000000004987
6878996.csv
Foreign File Size: 18786370
-> Hash (cost=111.17..111.17 rows=39 width=2030) (actual time=7658.661..765
8.661 rows=34107 loops=1)
Buckets: 2048 (originally 1024) Batches: 32 (originally 1) Memory Usa
ge: 4082kB
-> Foreign Scan on dzlog (cost=100.00..111.17 rows=39 width=2030) (ac
tual time=47.162..7578.990 rows=34107 loops=1)
Planning time: 8.755 ms
Execution time: 8530.917 ms
(10 rows)

查询的输出有两列名为 ullid。

ullid,date,color,sheetid,dz0,dz1,dz2,dz3,dz4,dz5,dz6,dz7,ullid,sheetid,pass,...

2- 为了从 python 应用程序直接访问 csv 文件和 sql 本地表,我有:我通过不使用 FDW 而是使用 Pandas merge dataframe 从 python 应用程序直接访问 csv 文件和 postgreSQL 本地表来完成相同的查询。这个连接是原始连接,所以我首先获取 csv 文件,然后使用 python 中的 pandas 库获取 sql 表,然后我根据公共(public)列合并两个数据帧

import pandas as pd
def rawjoin(query,connection=psycopg2.connect("dbname='mydb' user='qfsa' host='localhost' password='123' port=5433")):
query=("SELECT * FROM dzlog;")
firstTable= pd.read_csv('.\sources\sheetHeight_20151025_221244_000000000498768789.csv', delimiter=';', header=0)
secondTable =pd.read_sql(query,connection)
merged= pd.merge(firstTable, secondTable, on= 'ullid', how='inner')
return merged

结果是具有一个 ullid 列的连接数据框。

知道这种区别吗?我做了其他类型的连接,RAW访问和FDW访问的结果是一样的,其他查询如下:

 q7=("SELECT dzlog.color FROM dzlog,sheetheight WHERE dzlog.ullid = sheetheight.ullid;")
q8=("SELECT sheetheight.defectfound FROM dzlog, sheetheight WHERE dzlog.ullid = sheetheight.ullid;")
q9=("SELECT dzlog.color, sheetheight.defectfound FROM dzlog, sheetheight WHERE dzlog.ullid= sheetheight.ullid;")

最佳答案

我不知道你的第二个例子是做什么的,所以很难说。使用哪个库?它是生成 SQL 还是在应用程序中执行连接(这几乎总是性能损失)?如果这导致 SQL 语句,语句是什么?

第一个查询返回该列两次,因为您要求它从涉及的所有 表中返回所有 列,并且两个表都有该列,这是连接条件强制执行的平等。

你可以像这样写一个只输出列一次的 SQL 语句:

SELECT *
FROM dzlog
JOIN sheetheight
USING (ullid);

这看起来很像第二个示例中的代码,不是吗?

关于postgresql - 加入 file_fdw 外表和 postgres_fdw 外表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43251160/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com