相关疑难解决方法(0)

复合索引是否也适用于第一个字段的查询？

假设我有一个包含字段A和的表B。我在A+上进行常规查询B，所以我在上创建了一个复合索引(A,B)。A复合索引是否也会对查询进行全面优化？

此外，我在上创建了一个索引A，但 Postgres 仍然只使用复合索引来查询A。如果前面的答案是肯定的，我想这并不重要，但是为什么它默认选择复合索引，如果单个A索引可用？

postgresql performance index database-design index-tuning

Luc*_*ano

2014 09-04

104
推荐指数

1
解决办法

4万
查看次数

在大型 PostgresSQL 表中提高 COUNT/GROUP-BY 的性能？

我正在运行 PostgresSQL 9.2 并且有一个 12 列的关系，大约有 6,700,000 行。它包含 3D 空间中的节点，每个节点都引用一个用户（创建它的人）。要查询哪个用户创建了多少个节点，我执行以下操作（添加explain analyze以获取更多信息）：

EXPLAIN ANALYZE SELECT user_id, count(user_id) FROM treenode WHERE project_id=1 GROUP BY user_id;
                                                    QUERY PLAN                                                         
---------------------------------------------------------------------------------------------------------------------------
 HashAggregate  (cost=253668.70..253669.07 rows=37 width=8) (actual time=1747.620..1747.623 rows=38 loops=1)
   ->  Seq Scan on treenode  (cost=0.00..220278.79 rows=6677983 width=8) (actual time=0.019..886.803 rows=6677983 loops=1)
         Filter: (project_id = 1)
 Total runtime: 1747.653 ms

Run Code Online (Sandbox Code Playgroud)

如您所见，这大约需要 1.7 秒。考虑到数据量，这还算不错，但我想知道这是否可以改进。我尝试在用户列上添加 BTree 索引，但这没有任何帮助。

您有其他建议吗？

为了完整起见，这是完整的表定义及其所有索引（没有外键约束、引用和触发器）：

    Column     |           Type           |                      Modifiers                    
---------------+--------------------------+------------------------------------------------------
 id            | bigint                   | not null default nextval('concept_id_seq'::regclass)
 user_id       | bigint …

Run Code Online (Sandbox Code Playgroud)

postgresql performance index count group-by

tom*_*mka

2014 04-09

28
推荐指数

2
解决办法

6万
查看次数

PostgreSQL“临时文件的大小”

我已将数据导入新数据库（大约 600m 行时间戳、整数、双精度）。然后我创建了一些索引并试图改变一些列（有一些空间不足的问题），数据库被清空了。

现在 pgAdmin III 告诉我“临时文件的大小”是 50G~+。

这些临时文件是什么？这些像 SQL Server 事务日志吗？
我怎样才能摆脱它们，似乎数据库比它应该大得多（数据库的总大小为 91 GB）

在Windows 2012 服务器上使用Posgres 9.4.1 。

数据库统计选项卡的屏幕截图：

postgresql pgadmin

Ofi*_*ris

2015 08-16

18
推荐指数

2
解决办法

5万
查看次数

在 PostgreSQL 中使用 GIN 索引时如何加快 ORDER BY 排序？

我有一张这样的表：

CREATE TABLE products (
  id serial PRIMARY KEY, 
  category_ids integer[],
  published boolean NOT NULL,
  score integer NOT NULL,
  title varchar NOT NULL);

Run Code Online (Sandbox Code Playgroud)

一个产品可以属于多个类别。category_ids列包含所有产品类别的 id 列表。

典型的查询看起来像这样（总是搜索单个类别）：

SELECT * FROM products WHERE published
  AND category_ids @> ARRAY[23465]
ORDER BY score DESC, title
LIMIT 20 OFFSET 8000;

Run Code Online (Sandbox Code Playgroud)

为了加快速度，我使用以下索引：

CREATE INDEX idx_test1 ON products
  USING GIN (category_ids gin__int_ops) WHERE published;

Run Code Online (Sandbox Code Playgroud)

除非某一类别中的产品太多，否则这会很有帮助。它会快速过滤掉属于该类别的产品，但随后必须以艰难的方式完成排序操作（没有索引）。

已安装的btree_gin扩展允许我像这样构建多列 GIN 索引：

CREATE INDEX idx_test2 ON products USING GIN (
  category_ids gin__int_ops, score, title) WHERE published; …

Run Code Online (Sandbox Code Playgroud)

postgresql performance index postgresql-performance

Yar*_*hiy

2020 01-08

14
推荐指数

2
解决办法

1万
查看次数

标签统计

postgresql ×4

index ×3

performance ×3

count ×1

database-design ×1

group-by ×1

index-tuning ×1

pgadmin ×1

postgresql-performance ×1

复合索引是否也适用于第一个字段的查询？

在大型 PostgresSQL 表中提高 COUNT/GROUP-BY 的性能？

PostgreSQL“临时文件的大小”

在 PostgreSQL 中使用 GIN 索引时如何加快 ORDER BY 排序？

标签 统计

标签统计