标签: parallelism

为什么使用 GROUP BY 子句的聚合查询比不使用 GROUP BY 子句要快得多？

我只是很好奇为什么聚合查询使用GROUP BY子句比没有子句运行得更快。

例如，这个查询需要将近 10 秒才能运行

SELECT MIN(CreatedDate)
FROM MyTable
WHERE SomeIndexedValue = 1

Run Code Online (Sandbox Code Playgroud)

虽然这个只需不到一秒钟

SELECT MIN(CreatedDate)
FROM MyTable
WHERE SomeIndexedValue = 1
GROUP BY CreatedDate

Run Code Online (Sandbox Code Playgroud)

CreatedDate在这种情况下只有一个，因此分组查询返回与未分组查询相同的结果。

我注意到两个查询的执行计划是不同的 - 第二个查询使用 Parallelism 而第一个查询没有。

Query1 执行计划 Query2 执行计划

如果 SQL Server 没有 GROUP BY 子句，它以不同的方式评估聚合查询是否正常？在不使用GROUP BY子句的情况下，我可以做些什么来提高第一个查询的性能？

编辑

我刚刚了解到我可以使用OPTION(querytraceon 8649)将并行性的开销开销设置为 0，这使得查询使用一些并行性并将运行时间减少到 2 秒，尽管我不知道使用此查询提示是否有任何缺点。

SELECT MIN(CreatedDate)
FROM MyTable
WHERE SomeIndexedValue = 1
OPTION(querytraceon 8649)

Run Code Online (Sandbox Code Playgroud)

在此处输入图片说明

我仍然更喜欢较短的运行时间，因为查询旨在根据用户选择填充一个值，因此理想情况下应该像分组查询一样是即时的。现在我只是结束我的查询，但我知道这并不是一个理想的解决方案。

SELECT Min(CreatedDate)
FROM
(
    SELECT Min(CreatedDate) as CreatedDate
    FROM MyTable WITH (NOLOCK) 
    WHERE SomeIndexedValue = 1
    GROUP …

Run Code Online (Sandbox Code Playgroud)

performance sql-server-2005 aggregate parallelism query-performance

Rac*_*hel

2020 01-08

12
推荐指数

1
解决办法

3万
查看次数

在 Debian 上使用多个内核进行单个 MySQL 查询

我正在运行 MySQL 服务器，以在 Debian 作为来宾操作系统的 VM (VMWare) 上进行测试。来宾有四个模拟 CPU 内核，因此我将 thread_concurrency 设置为四个。

我在大型表上执行昂贵的连接，这可能需要几分钟，但我在来宾操作系统上看到，一次只使用一个核心。无论用于所涉及的表的存储引擎如何（使用 MyISAM 和 InnoDB 测试），都会发生这种情况。此外，在执行这些大型查询时，整个数据库似乎都被阻塞了，我无法并行执行任何其他查询。奇怪的是 htop 显示，用于查询的核心在查询运行时发生了变化！

为什么会发生这种情况？

这是来自SHOW FULL PROCESSLIST;（没有其他查询）的相关条目：

| 153 | root       | localhost | pulse_stocks  | Query   |   50 | Copying to tmp table | 
SELECT DISTINCT * FROM 
`pulse_stocks`.`stocks` sto,
`pulse_new`.`security` sec
WHERE
(sto.excntry = sec.excntry AND sto.stock_id = sec.ibtic) OR
( sto.isin = sec.isin AND sto.isin <> "" AND sec.isin <> "" )
ORDER BY
sto.id
LIMIT 0, 30

Run Code Online (Sandbox Code Playgroud)

没有其他待处理的查询。另一个有趣的观察是，如果我省略这 …

mysql innodb myisam concurrency parallelism

Tho*_*mas

2012 03-16

11
推荐指数

1
解决办法

2万
查看次数

MAXDOP = 1，查询提示和并行成本阈值

如果实例MAXDOP设置为 1 并且查询提示用于允许特定查询并行执行，SQL 是否仍使用并行成本阈值值来决定是否实际并行执行？

我一直无法挖掘出这些特定信息，尽管此链接表明如果MAXDOP为 1 ，则 CTFP 将被忽略。这在没有查询提示的情况下是有意义的，因为没有请求，无论成本如何，当MAXDOP为 1时都会并行。

谁能让我知道这两个请求的预期行为是什么？

示例 1：

Instance Maxdop: 1 
CTFP: 50 
Query hint: Maxdop=2 
Query cost: 30

Run Code Online (Sandbox Code Playgroud)

示例 2：

Instance Maxdop: 1
CTFP: 50
Query hint: Maxdop=2
Query cost: 70

Run Code Online (Sandbox Code Playgroud)

sql-server optimization parallelism sql-server-2012 maxdop

Mar*_*sey

2018 08-22

11
推荐指数

1
解决办法

4001
查看次数

当构建端为空时，SQL Server 为什么/何时评估内部散列连接的探测端？

设置

DROP TABLE IF EXISTS #EmptyTable, #BigTable

CREATE TABLE #EmptyTable(A int);
CREATE TABLE #BigTable(A int);

INSERT INTO #BigTable
SELECT TOP 10000000 CRYPT_GEN_RANDOM(3)
FROM   sys.all_objects o1,
       sys.all_objects o2,
       sys.all_objects o3;

Run Code Online (Sandbox Code Playgroud)

询问

WITH agg
     AS (SELECT DISTINCT a
         FROM   #BigTable)
SELECT *
FROM   #EmptyTable E
       INNER HASH JOIN agg B
                    ON B.A = E.A;

Run Code Online (Sandbox Code Playgroud)

执行计划

问题

这是我今天之前没有注意到的现象的简化再现。我对内部散列连接的期望是，如果构建输入为空，则不应执行探测端，因为连接不会返回任何行。上面的示例与此相反，并从表中读取了 1000 万行。这使查询的执行时间增加了 2.196 秒 (99.9%)。

其他观察

使用OPTION (MAXDOP 1)执行计划从#BigTable. 该ActualExecutions是0对哈希连接内所有的运营商。
对于查询SELECT * FROM #EmptyTable E INNER …

sql-server parallelism execution-plan sql-server-2017

Mar*_*ith

2019 12-06

11
推荐指数

1
解决办法

702
查看次数

对并行标量 UDF 的支持是一个合理的功能请求吗？

标量 UDF 强制执行整体串行计划，这是有据可查的。

并行运行函数

给定大量行进入管道中必须计算 UDF 的点，为什么引擎不能将它们分配给处理器？如果 UDF 中没有状态，那么顺序应该无关紧要。

有人声称 UDF 是一个必须使用光标的黑匣子。我可以看到，对于在迭代之间维护某些状态但似乎应该可以并行化的情况，用户游标无法在 SP 中并行化。

解释为什么引擎强制整个计划是串行的，而不仅仅是 UDF 计算阶段的额外要点。

对并行 UDF 的支持是一个合理的要求吗？

sql-server parallelism functions

cro*_*sek

2017 04-13

10
推荐指数

2
解决办法

2600
查看次数

将标量函数转换为用于并行执行的 TVF 函数 - 仍在串行模式下运行

我的一个查询在发布后以串行执行模式运行，我注意到在从应用程序生成的 LINQ to SQL 查询中引用的视图中使用了两个新函数。所以我将这些 SCALAR 函数转换为 TVF 函数，但查询仍然以串行模式运行。

早些时候我在其他一些查询中做了 Scalar 到 TVF 的转换，它解决了强制串行执行的问题。

这是标量函数：

CREATE FUNCTION [dbo].[FindEventReviewDueDate]
(
       @EventNumber VARCHAR(20),
       @EventID VARCHAR(25),
          @EventIDDate BIT
)

RETURNS DateTime
AS
BEGIN

DECLARE @CurrentEventStatus VARCHAR(20)
DECLARE @EventDateTime DateTime
DECLARE @ReviewDueDate DateTime


SELECT @CurrentEventStatus = (SELECT cis.EventStatus
                                 FROM CurrentEventStatus cis 
                                 INNER JOIN Event1 r WITH (NOLOCK) ON (cis.Event1Id = r.Id)
                                 WHERE (r.EventNumber = @EventNumber) AND r.EventID = @EventID)

SELECT @EventDateTime = (SELECT EventDateTime FROM Event1 r 
                          WHERE (r.EventNumber = @EventNumber) AND r.EventID = …

Run Code Online (Sandbox Code Playgroud)

performance sql-server parallelism functions query-performance performance-tuning

use*_*827

2020 01-08

10
推荐指数

3
解决办法

574
查看次数

并行最佳实践

一般设置并行性的最佳实践是什么？我知道 SQL Server 默认0使用所有可用的处理器，但是在什么情况下您要更改此默认行为？

我记得在某处读到过（我必须寻找这篇文章），对于 OLTP 工作负载，您应该关闭并行性（将 maxdop 设置为1）。我不认为我完全理解你为什么要这样做。

您什么时候将 maxdop 保持到 SQL Server (0)？您何时会关闭并行性 (1)？您何时会明确说明特定数量的处理器的 maxdop？

什么导致并行？

sql-server best-practices parallelism

作者

2011 09-29

9
推荐指数

1
解决办法

1万
查看次数

我有一个非常大的查询（约 630 行），它涉及大量嵌套SELECT语句并从多个视图中提取。我们的 SQL Server 将并行度设置为 2，阈值为 95（这样设置是因为我们的 DBA 正在根据其他一些应用程序对其进行优化）。此查询最近开始需要 5-10 分钟才能完成，而通常不到一分钟。在调查原因时，我们注意到它似乎永远不会触发并行，总是串行运行，并怀疑这可能与它的性能有关。奇怪的是，在实验过程中，我们甚至将阈值降回了默认值 5 秒，它仍然无法并行运行。什么可以阻止它？

我们一直在当时没有其他人使用的非生产环境中进行测试，因此这是唯一运行的查询。我们的DBA也尝试过清除缓存和计划，甚至回收系统，但都没有效果。

更新 1：根据评论，我已经确认统计数据每晚更新，但问题仍然存在。我们实际上将代码回滚到没有如此严重性能问题的早期版本，但将继续测试此代码，因为它应该提高旧代码的性能，并且在初始测试中确实做到了。将在此处相应地更新。

sql-server parallelism

tha*_*nby

2016 04-07

9
推荐指数

1
解决办法

7016
查看次数