标签: performance

SELECT TOP 1 损害查询性能；有没有一种 dba 可访问的方法来克服这个问题？

在生产应用程序（C# 与 SQL Server 2014 Standard 对话）中，有一个如下所示的查询。大多数情况下，它以毫秒为单位运行。但偶尔（对于的某些值@Id），它会发疯并需要一分钟左右的时间。这比应用超时时间长，因此用户的应用失败。

在“疯了”的情况下，返回的结果集是正确的，因为它在许多但不是所有其他情况下都是空的。

幸运的是，这在生产和开发环境中都是可重现的。

开发人员说从查询中删除“TOP 1”，然后确保应用程序使用结果集的额外行，清除性能问题。

查询规划器在TOP 1存在时建议没有索引。（在开发中）。

正在更改查询并修复应用程序。推出需要一段时间。

我的问题：是否有任何 DBA 可访问的方法来调整或调整生产 SQL Server 实例以在新查询推出应用程序更改之前解决此问题？

SELECT TOP 1
       subscription_id 
  FROM subscription AS sub
  JOIN billing_info AS bi ON bi.billing_info_id = sub.billing_info_id   
  JOIN person_group AS apg ON apg.person_id = bi.person_id
  JOIN pplan ON pplan.plan_id = sub.plan_id
  JOIN product ON product.product_id = [plan].product_id 
  JOIN product_attribute ON product_attribute.product_id = product.product_id 
 WHERE apg.group_id = @Id
   AND apg.start_date < GETDATE()
   AND (apg.end_date IS NULL …

Run Code Online (Sandbox Code Playgroud)

performance sql-server database-tuning query-performance

O. *_*nes

2020 01-08

13
推荐指数

1
解决办法

1650
查看次数

postgres_fdw 性能很慢

以下对外部的查询在 320 万行上执行大约需要 5 秒：

SELECT x."IncidentTypeCode", COUNT(x."IncidentTypeCode") 
FROM "IntterraNearRealTimeUnitReflexes300sForeign" x 
WHERE x."IncidentDateTime" >= '05/01/2016' 
GROUP BY x."IncidentTypeCode" 
ORDER BY 1;

Run Code Online (Sandbox Code Playgroud)

当我在普通表上执行相同的查询时，它会在 0.6 秒内返回。执行计划完全不同：

普通表

SELECT x."IncidentTypeCode", COUNT(x."IncidentTypeCode") 
FROM "IntterraNearRealTimeUnitReflexes300sForeign" x 
WHERE x."IncidentDateTime" >= '05/01/2016' 
GROUP BY x."IncidentTypeCode" 
ORDER BY 1;

Run Code Online (Sandbox Code Playgroud)

外表

Sort  (cost=226861.20..226861.21 rows=4 width=4) (actual time=646.447..646.448 rows=7 loops=1) 
  Sort Key: "IncidentTypeCode" 
  Sort Method: quicksort  Memory: 25kB 
  -> HashAggregate (cost=226861.12..226861.16 rows=4 width=4) (actual  time=646.433..646.434 rows=7 loops=1)
     Group Key: "IncidentTypeCode"
     -> Bitmap Heap Scan on "IntterraNearRealTimeUnitReflexes300s" x  (cost=10597.63..223318.41 rows=708542 width=4) …

Run Code Online (Sandbox Code Playgroud)

postgresql performance postgresql-fdw postgresql-9.5 query-performance

J-D*_*awG

2020 01-08

13
推荐指数

1
解决办法

5882
查看次数

用于有效范围聚合查询的数据库？

作为一个简化的例子，假设我有一个这样的表：

seq | value
----+------
102 | 11954
211 | 43292
278 | 19222
499 |  3843

Run Code Online (Sandbox Code Playgroud)

该表可能包含数亿条记录，我需要经常做这样的查询：

SELECT sum(value) WHERE seq > $a and seq < $b

Run Code Online (Sandbox Code Playgroud)

即使seq被索引，典型的数据库实现也会遍历每一行以计算最佳情况下的总和O(n)，其中n是范围的大小。

是否有任何数据库可以像O(log(n))每个查询一样有效地执行此操作？

我所遇到的数据结构称为段树所描述这里。有时也称为范围树或区间树，尽管所有这些名称通常被描述为数据结构的略微不同的变体。

但是，我还没有遇到任何实现这种数据结构的数据库。对于内存结构来说，从头开始实现它很容易，但如果它必须持久化或太大而无法放入内存，则变得棘手。如果有一种在现有数据库之上实现这一点的有效模式，那也会有所帮助。

旁注：这不是仅附加表，因此在这种情况下，诸如保留累积总和之类的解决方案将不起作用。

performance database-design database-recommendation database-internals query-performance

Ral*_*alf

2020 01-08

13
推荐指数

2
解决办法

3250
查看次数

为什么选择此查询的所有结果列比选择我关心的一列更快？

我有一个查询，其中使用select *不仅读取少得多，而且使用的 CPU 时间也比使用select c.Foo.

这是查询：

select top 1000 c.ID
from ATable a
    join BTable b on b.OrderKey = a.OrderKey and b.ClientId = a.ClientId
    join CTable c on c.OrderId = b.OrderId and c.ShipKey = a.ShipKey
where (a.NextAnalysisDate is null or a.NextAnalysisDate < @dateCutOff)
    and b.IsVoided = 0
    and c.ComplianceStatus in (3, 5)
    and c.ShipmentStatus in (1, 5, 6)
order by a.LastAnalyzedDate

Run Code Online (Sandbox Code Playgroud)

这以 2,473,658 次逻辑读取结束，大部分在表 B 中。它使用了 26,562 个 CPU，持续时间为 7,965。

这是生成的查询计划：

关于 PasteThePlan：https ://www.brentozar.com/pastetheplan/ ? …

performance sql-server execution-plan sql-server-2014 query-performance

L. *_*ler

2020 01-08

13
推荐指数

1
解决办法

2051
查看次数

显示估计的执行计划会生成 CXPACKET、PAGELATCH_SH 和 LATCH_EX [ACCESS_METHODS_DATASET_PARENT] 等待

我在4个vCPU VM运行Microsoft SQL Server 2016 SP2-CU6（13.0.5292.0）与max degree of parallelism设置为2和cost threshold for parallelism设置为50。

早上，当我尝试显示SELECT TOP 100查询的估计执行计划时，我遇到了大量等待，并且呈现估计计划的操作需要几分钟，通常在 5 到 7 分钟的范围内。同样，这不是查询的实际执行，这只是显示Estimated Execution Plan 的过程。

sp_WhoIsActive将显示PAGEIOLATCH_SH等待或LATCH_EX [ACCESS_METHODS_DATASET_PARENT]等待，当我在操作期间运行Paul Randal 的 WaitingTasks.sql脚本时，它显示CXPACKET等待，工作线程显示PAGEIOLATCH_SH等待：

*资源描述字段= exchangeEvent id=Port5f6069e600 WaitType=e_waitPortOpen waiterType=Coordinator nodeId=1 tid=0 ownerActivity=notYetOpened waiterActivity=waitForAllOwnersToOpen

工作线程看起来将整个stats表带入内存（因为这些页码以及从 Paul Randal 的查询点显示的后续页码指向stats表的聚集键）。一旦计划确实回来了，即使在我看到stats缓存中的大部分表损耗，只剩下各种记录（我认为由于类似查询的搜索操作而被拉出）之后，它在当天剩余时间内基本上是即时的。

如果查询实际上是使用使用 SCAN 运算符的计划执行的，我会期望这种初始行为，但是为什么在评估执行计划时这样做只是为了到达上面链接的计划中所示的 SEEK 运算符？我可以做些什么（除了在办公时间之前运行此语句以便适当缓存我的数据）来帮助提高性能？我假设一对覆盖索引将是有益的，但它们真的能保证行为的任何变化吗？我必须在此处处理一些存储和维护窗口限制，并且查询本身是从供应商解决方案生成的，因此此时欢迎任何其他建议（除了更好的索引）。

performance sql-server sql-server-2016

Joh*_*ner

lucky-day

13
推荐指数

2
解决办法

820
查看次数