gpt4 book ai didi

performance - Postgres 中的位图堆扫描非常慢

转载 作者:行者123 更新时间:2023-11-29 11:24:52 25 4
gpt4 key购买 nike

我有以下包含流量测量数据的简单表格:

CREATE TABLE "TrafficData"
(
"RoadID" character varying NOT NULL,
"DateID" numeric NOT NULL,
"ExactDateTime" timestamp NOT NULL,
"CarsSpeed" numeric NOT NULL,
"CarsCount" numeric NOT NULL
)
CREATE INDEX "RoadDate_Idx" ON "TrafficData" USING btree ("RoadID", "DateID");

RoadID 列唯一标识正在记录其数据的道路,而 DateID 标识数据一年中的第几天 (1..365) - 基本上是 ExactDateTime 的四舍五入表示。

我有大约 100.000.000 行; “RoadID”列中有 1.000 个不同的值,“DateID”列中有 365 个不同的值。

然后我运行以下查询:

SELECT * FROM "TrafficData"
WHERE "RoadID"='Station_1'
AND "DateID">20100610 AND "DateID"<20100618;

这需要三秒钟的时间才能完成,我一辈子都想不通为什么。

EXPLAIN ANALYZE 给我以下输出:

Bitmap Heap Scan on "TrafficData"  (cost=104.84..9743.06 rows=2496 width=47) (actual time=35.112..2162.404 rows=2016 loops=1)
Recheck Cond: ((("RoadID")::text = 'Station_1'::text) AND ("DateID" > 20100610::numeric) AND ("DateID" < 20100618::numeric))
-> Bitmap Index Scan on "RoadDate_Idx" (cost=0.00..104.22 rows=2496 width=0) (actual time=1.637..1.637 rows=2016 loops=1)
Index Cond: ((("RoadID")::text = 'Station_1'::text) AND ("DateID" > 20100610::numeric) AND ("DateID" < 20100618::numeric))
Total runtime: 2163.985 ms

我的规范:

  • Windows 7
  • Postgres 9.0
  • 4GB 内存

如果有任何有用的建议,我将不胜感激!

最佳答案

缓慢的部分显然是从表中获取数据,因为索引访问似乎非常快。您可以优化 RAM 使用参数(参见 http://wiki.postgresql.org/wiki/Performance_Optimizationhttp://www.varlena.com/GeneralBits/Tidbits/perf.html),或者通过发出 CLUSTER 命令优化表中数据的布局(参见 http://www.postgresql.org/docs/8.3/static/sql-cluster.html)。

CLUSTER "TrafficData" USING "RoadDate_Idx";

应该这样做。

关于performance - Postgres 中的位图堆扫描非常慢,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4009062/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com