相关疑难解决方法(0)

复合索引是否也适用于第一个字段的查询？

假设我有一个包含字段A和的表B。我在A+上进行常规查询B，所以我在上创建了一个复合索引(A,B)。A复合索引是否也会对查询进行全面优化？

此外，我在上创建了一个索引A，但 Postgres 仍然只使用复合索引来查询A。如果前面的答案是肯定的，我想这并不重要，但是为什么它默认选择复合索引，如果单个A索引可用？

postgresql performance index database-design index-tuning

Luc*_*ano

2014 09-04

104
推荐指数

1
解决办法

4万
查看次数

我应该为 VARCHAR 列添加任意长度限制吗？

根据PostgreSQL 的文档，VARCHAR,VARCHAR(n)和之间没有性能差异TEXT。

我应该为名称或地址列添加任意长度限制吗？

编辑：不是欺骗：

当所有值都是 36 个字符时，使用 char 和 varchar 进行索引查找会明显更快吗

我知道这种CHAR类型是过去的遗物，我不仅对性能感兴趣，而且对其他优缺点感兴趣，例如 Erwin 在他惊人的回答中所述。

postgresql performance datatypes varchar

Dan*_*dio

2018 12-20

55
推荐指数

2
解决办法

5万
查看次数

为读取性能配置 PostgreSQL

我们的系统写入了大量数据（一种大数据系统）。写入性能足以满足我们的需求，但读取性能真的太慢了。

我们所有表的主键（约束）结构都相似：

timestamp(Timestamp) ; index(smallint) ; key(integer).

Run Code Online (Sandbox Code Playgroud)

一个表可以有数百万行，甚至数十亿行，而一个读请求通常是针对特定时间段（时间戳/索引）和标记的。查询返回大约 20 万行是很常见的。目前，我们每秒可以读取大约 15k 行，但我们需要快 10 倍。这是可能的，如果是，如何？

注意： PostgreSQL 是和我们的软件一起打包的，所以不同客户端的硬件是不一样的。

它是一个用于测试的虚拟机。VM 的主机是具有 24.0 GB RAM 的 Windows Server 2008 R2 x64。

服务器规范（虚拟机 VMWare）

Server 2008 R2 x64
2.00 GB of memory
Intel Xeon W3520 @ 2.67GHz (2 cores)

Run Code Online (Sandbox Code Playgroud)

`postgresql.conf` 优化

shared_buffers = 512MB (default: 32MB)
effective_cache_size = 1024MB (default: 128MB)
checkpoint_segment = 32 (default: 3)
checkpoint_completion_target = 0.9 (default: 0.5)
default_statistics_target = 1000 (default: 100)
work_mem = 100MB (default: 1MB)
maintainance_work_mem = 256MB …

Run Code Online (Sandbox Code Playgroud)

postgresql performance postgresql-9.1 query-performance

JPe*_*ier

2020 01-08

47
推荐指数

2
解决办法

4万
查看次数

PostgreSQL 复合索引中的列顺序（和查询顺序）

我有一个有 50K 行的表。它实际上是一个 PostGIS 表。

查询有 4 个部分（1 个强制）（3 个可选）

具有 4 lat,long 的交叉框（地理矩形）（我使用 st_intersects）[强制]
日期字段上的日期范围（最小值、最大值）
当前使用 IN( .....) 的文件类型（一组最多 8 个文本值），但如果需要，我可以将其设为临时表。我看到很多人不喜欢IN。
国家（一个文本值）。

我预计大约有 100 - 4,000 行返回

如果我在表上创建复合索引，我应该先使用哪一列。细粒度的可能是位置（数据分布在世界各地）。我目前将其作为 GIST 索引。

其他索引将是 BTREE。

我的直觉是使用细粒度的，当然最后。例如，只有大约 12 种文件类型，因此对于索引来说这将是非常大的存储桶。

PostgreSQL 和 PostGIS 大师（了解系统内部结构的人）怎么说？

更新：

让我尖锐地回答这个问题。

我不希望任何人不得不做我应该做的工作。我太尊重你的时间了。所以我将在稍后进行解释分析。
我所寻找的只是一些指示、技巧和指导方针。
我读了这篇很棒的小帖子：https : //devcenter.heroku.com/articles/postgresql-indexes#managing-and-maintaining-indexes关于索引
我通常做的是创建 4 个单独的索引（地理框、国家/地区名称、文件类型和日期），但想看看复合查询会做什么。

请告诉我这些假设是否有误。（我对复合索引的想法很陌生）

顺序很重要。选择最能减少行的索引作为第一个索引（在我的情况下，位置（地理）是一个简单的多边形或多多边形会做得最好）。
有时查询会跳过索引。但是，如果我使用键 (#1, #2, #3, #4) 创建一个复合查询，那么即使用户创建了要求 #1, #3 的内容，规划器仍将使用单个复合查询，因为他们订购被维护。
通常我会创建三个 BTREE 查询和一个 GIST（用于地理类型）。PostGIS 不支持从多个索引类型中创建复合。所以我将不得不使用 GIST 复合索引。但这不应该伤害事情。
如果我确实创建了一些额外的复合或单值索引，那么规划器就足够聪明，可以选择最聪明的一个......
Country Name 可以有大约 250 个不同的值，并且显然与位置 (geobox) 密切相关，但是如果减少行大小的下一个最佳索引是 file_type，我接下来应该使用它。我不希望用户经常在他们的查询集中使用国家或日期。
我不必担心创建 …

postgresql postgis

Dr.*_*YSG

2014 03-14

14
推荐指数

1
解决办法

8564
查看次数