相关疑难解决方法(0)

测量 PostgreSQL 表行的大小

我有一个 PostgreSQL 表。select *很慢，但又select id好又快。我认为可能是行的大小非常大并且需要一段时间来运输，或者可能是其他一些因素。

我需要所有字段（或几乎所有字段），因此仅选择一个子集不是一个快速解决方案。选择我想要的字段仍然很慢。

这是我的表架构减去名称：

integer                  | not null default nextval('core_page_id_seq'::regclass)
character varying(255)   | not null
character varying(64)    | not null
text                     | default '{}'::text
character varying(255)   | 
integer                  | not null default 0
text                     | default '{}'::text
text                     | 
timestamp with time zone | 
integer                  | 
timestamp with time zone | 
integer                  |

Run Code Online (Sandbox Code Playgroud)

文本字段的大小可以是任意大小。但是，在最坏的情况下，不会超过几千字节。

问题

有什么关于这叫“疯狂低效”的吗？
有没有办法在 Postgres 命令行中测量页面大小来帮助我调试？

postgresql performance size disk-space postgresql-performance

Joe*_*Joe

2020 06-15

119
推荐指数

5
解决办法

10万
查看次数

如何有效地获得“最近的对应行”？

我有一个一定很常见的查询模式，但我不知道如何为它编写有效的查询。我想查找与“最近日期不晚于”另一个表的行相对应的表的行。

inventory比如说，我有一张表格，它代表了我在某一天持有的库存。

date       | good | quantity
------------------------------
2013-08-09 | egg  | 5
2013-08-09 | pear | 7
2013-08-02 | egg  | 1
2013-08-02 | pear | 2

Run Code Online (Sandbox Code Playgroud)

和一张表，“价格”说，它保存了某一天的商品价格

date       | good | price
--------------------------
2013-08-07 | egg  | 120
2013-08-06 | pear | 200
2013-08-01 | egg  | 110
2013-07-30 | pear | 220

Run Code Online (Sandbox Code Playgroud)

如何有效地获得库存表每一行的“最新”价格，即

date       | pricing date | good | quantity | price
----------------------------------------------------
2013-08-09 | 2013-08-07   | egg  | 5        | 120
2013-08-09 …

Run Code Online (Sandbox Code Playgroud)

postgresql performance greatest-n-per-group query-performance

Tom*_*lis

2020 01-08

68
推荐指数

5
解决办法

13万
查看次数

我应该为 VARCHAR 列添加任意长度限制吗？

根据PostgreSQL 的文档，VARCHAR,VARCHAR(n)和之间没有性能差异TEXT。

我应该为名称或地址列添加任意长度限制吗？

编辑：不是欺骗：

当所有值都是 36 个字符时，使用 char 和 varchar 进行索引查找会明显更快吗

我知道这种CHAR类型是过去的遗物，我不仅对性能感兴趣，而且对其他优缺点感兴趣，例如 Erwin 在他惊人的回答中所述。

postgresql performance datatypes varchar

Dan*_*dio

2018 12-20

55
推荐指数

2
解决办法

5万
查看次数

MD5 字段的最佳数据类型是什么？

我们正在设计一个众所周知的读取量大的系统（每分钟读取数万次）。

有一个表names作为一种中央注册表。每行都有一个text字段representation和一个唯一的字段，key它是该字段的 MD5 哈希值representation。¹该表目前有数千万条记录，预计在应用程序的生命周期内会增长到数十亿条。
还有许多其他表（具有高度变化的模式和记录计数）引用该names表。这些表之一中的任何给定记录都保证有一个name_key，它在功能上是names表的外键。

_{1：顺便说一句，正如您所料，此表中的记录一旦写入便不可变。}

对于表以外的任何给定表names，最常见的查询将遵循以下模式：

SELECT list, of, fields 
FROM table 
WHERE name_key IN (md5a, md5b, md5c...);

Run Code Online (Sandbox Code Playgroud)

我想优化读取性能。我怀疑我的第一站应该是最小化索引的大小（尽管我不介意在那里被证明是错误的）。

问题：和列
的最佳数据类型是什么？有理由使用over吗？或者？keyname_key
hex(32)bit(128)BTREEGIN

postgresql index database-design uniqueidentifier datatypes

bob*_*opy

2015 09-17

45
推荐指数

1
解决办法

3万
查看次数

索引：如果节点数相同，则整数与字符串性能

我正在使用 PostgreSQL (9.4) 数据库在 Ruby on Rails 中开发应用程序。对于我的用例，表中的列将被非常频繁地查找，因为应用程序的重点是在模型上搜索非常具体的属性。

我目前正在决定是对列使用integer类型还是简单地使用典型的字符串类型（例如character varying(255)，这是 Rails 中的默认值），因为我不确定索引上的性能差异是什么。

这些列是 enums。对于它们可以拥有的可能值的数量，它们具有固定的大小。大多数枚举长度不超过 5，这意味着索引在应用程序的整个生命周期中或多或少是固定的；因此，整数和字符串索引在节点数上是相同的。

但是，将被索引的字符串可能有大约 20 个字符长，在内存中大约是整数的 5 倍（如果一个整数是 4 个字节，并且字符串是纯 ASCII 每个字符 1 个字节，那么这成立）。我不知道数据库引擎如何进行索引查找，但是如果它需要“扫描”字符串直到它完全匹配，那么本质上这意味着字符串查找将比整数查找慢 5 倍；整数查找匹配之前的“扫描”将是 4 个字节而不是 20 个。这就是我的想象：

查找值为（整数）4：

扫描………………………………………………………………………………………………………………………………………… 正在获取记录... |BYTE_1|BYTE_2|BYTE_3|BYTE_4|BYTE_5|BYTE_6|BYTE_7|BYTE_8|...|

查找值是（字符串）“some_val”（8 个字节）：

扫描................................................. …………………………………………………………………………………………………………………………………………………………………… 正在获取记录... |BYTE_1|BYTE_2|BYTE_3|BYTE_4|BYTE_5|BYTE_6|BYTE_7|BYTE_8|...|

我希望这是有道理的。基本上，因为整数占用更少的空间，它可以比它的字符串对应物更快地“匹配”。也许这是一个完全错误的猜测，但我不是专家，所以这就是我问你们的原因！我想我刚刚找到的这个答案似乎支持我的假设，但我想确定一下。

列中可能值的数量在使用任何一个时都不会改变，因此索引本身不会改变（除非我向枚举添加了一个新值）。在这种情况下，使用integeror会有性能差异varchar(255)，还是使用整数类型更有意义？

我问的原因是 Rails 的enum类型将整数映射到字符串键，但它们并不是面向用户的列。本质上，您无法验证枚举值是否有效，因为无效值会ArgumentError在运行任何验证之前导致。使用string类型将允许验证，但如果存在性能成本，我宁愿绕过验证问题。

postgresql performance index index-tuning query-performance

Chr*_*ice

2020 01-08

38
推荐指数

1
解决办法

3万
查看次数

CHAR 与 VARCHAR (Postgres) 的索引性能

在这个答案（/sf/ask/36230561/）中，一个评论引起了我的注意：

还要记住，在进行索引比较时，CHAR 和 VARCHAR 之间通常存在很大差异

这是否适用/仍然适用于 Postgres？

我发现 Oracle 上的页面声称这CHAR或多或少是 for 的别名VARCHAR，因此索引性能是相同的，但我在 Postgres 上没有发现任何明确的内容。

postgresql performance varchar

Let*_*t4U

2017 05-23

20
推荐指数

2
解决办法

2万
查看次数

什么是最有效的 UUID 列类型

为了存储 128 位 UUID，有多种存储选项：

一个字节[16]列
两个 bigint/long（64 位）列
CHAR(36) 列 - 32 个十六进制数字 + 4 个破折号。
一个 UUID 数据库特定列，如果 db 支持它

从索引的角度来看，哪些是最有效的？如果数据库不支持专用的 uuid 类型，那么 1、2、3 中的哪一个是最佳选择？

mysql postgresql index oracle sql-server

Vla*_*cea

lucky-day

19
推荐指数

1
解决办法

2万
查看次数

varchar(n) 的开销是多少？

我想从Postgres 文档中询问这个片段关于varchar(n)类型的含义：

短字符串（最多 126 个字节）的存储要求是 1 个字节加上实际字符串，其中包括字符情况下的空格填充。较长的字符串有 4 个字节的开销而不是 1 个字节。

假设我有一个varchar(255)字段。现在，以下声明：

如果该字段包含 10 个字节的字符串，则开销为 1 个字节。因此该字符串将使用 11 个字节。
如果该字段使用 140 个字节保存字符串，则开销为 4 个字节。因此该字符串将使用 144 个字节。

上面的那些说法是真的吗？这里有人理解文档相同的方式，我不过这里有人指出的开销总是4个字节在这里？

postgresql varchar database-internals

key*_*ess

2017 05-23

19
推荐指数

1
解决办法

9984
查看次数

修复表结构以避免“错误：重复键值违反唯一约束”

我有一个以这种方式创建的表：

--
-- Table: #__content
--
CREATE TABLE "jos_content" (
  "id" serial NOT NULL,
  "asset_id" bigint DEFAULT 0 NOT NULL,
   ...
  "xreference" varchar(50) DEFAULT '' NOT NULL,
  PRIMARY KEY ("id")
);

Run Code Online (Sandbox Code Playgroud)

稍后插入一些行并指定 id：

INSERT INTO "jos_content" VALUES (1,36,'About',...)

稍后，一些记录被插入而没有 id 并且它们因错误而失败： Error: duplicate key value violates unique constraint。

显然，id 被定义为一个序列：

在此处输入图片说明

每个失败的插入都会增加序列中的指针，直到它增加到一个不再存在的值并且查询成功。

SELECT nextval('jos_content_id_seq'::regclass)

表定义有什么问题？解决这个问题的聪明方法是什么？

postgresql database-design insert auto-increment sequence

Val*_*spa

2014 03-13

16
推荐指数

1
解决办法

8万
查看次数

将所有列标记为主键是否合理？

我有一张代表电影的表。这些字段是：
id (PK), title, genre, runtime, released_in, tags, origin, downloads。

我的数据库不会被重复的行污染，所以我想强制执行唯一性。问题是不同的电影可能有相同的标题，甚至除了tags和之外的相同字段downloads。如何实现唯一性？

我想到了两种方法：

制作除downloads主键以外的所有字段。downloads因为它是 JSON，所以我一直在外面，它可能会影响性能。
仅id作为主键保留，但为所有其他列添加唯一约束（再次除外downloads）。

我读了这个非常相似的问题，但我不太明白我该怎么做。目前该表与任何其他表都没有关系，但将来可能会。

目前我的记录略少于 20,000 条，但我预计这个数字会增长。我不知道这是否与问题有些相关。

编辑：我修改了架构，这里是我将如何创建表：

CREATE TABLE movies (
    id          serial PRIMARY KEY,
    title       text NOT NULL,
    runtime     smallint NOT NULL CHECK (runtime >= 0),
    released_in smallint NOT NULL CHECK (released_in > 0),
    genres      text[] NOT NULL default ARRAY[]::text[],
    tags        text[] NOT NULL default ARRAY[]::text[],
    origin      text[] NOT NULL …

Run Code Online (Sandbox Code Playgroud)

postgresql database-design primary-key unique-constraint

rub*_*bik

2017 04-13

9
推荐指数

2
解决办法

575
查看次数