Wor*_*SQL 5 sql-server parallelism
在这里继续我的另一个问题,我想要一种简单的方法来形象化答案。
我试过使用这样的查询,但“运行”线程的数量有时会超过 DOP。
SELECT ost.session_id,
ost.exec_context_id,
ost.scheduler_id,
qp.node_id,
w.worker_address,
qp.physical_operator_name,
ost.task_state,
qp.row_count
FROM sys.dm_os_tasks AS ost
JOIN sys.dm_os_workers AS w
ON ost.worker_address = w.worker_address
LEFT JOIN sys.dm_exec_query_profiles AS qp
ON w.task_address = qp.task_address
WHERE ost.session_id = 57
AND ost.task_state = 'RUNNING'
ORDER BY ost.exec_context_id, ost.scheduler_id, qp.node_id, w.worker_address;
Run Code Online (Sandbox Code Playgroud)
我也尝试过使用query_thread_profile扩展事件,但是对于具有多个并行分支的计划,它显示了相同的 N 个线程 ID。这似乎与给出的答案相反,因为 DOP 没有明确限制使用的线程总数。对于以 DOP 4 运行的查询,它看起来像这样。我确信相同的四个线程(加上协调器)不会用于所有分支和运算符。
因此,在 DOP 8 上运行这样的查询会给我三个并行分支。
SELECT COUNT(DISTINCT t1.Data)
FROM dbo.t1
JOIN dbo.t2
ON t1.Id = t2.f_Id
JOIN t3
ON t1.Id = t3.f_Id
OPTION(FORCE ORDER, HASH JOIN);
Run Code Online (Sandbox Code Playgroud)
但有时我的查询会返回:
有时它会返回:
以下是一些示例数据:
CREATE TABLE dbo.t1 ( Id INT IDENTITY PRIMARY KEY CLUSTERED, Data INT NOT NULL );
CREATE TABLE dbo.t2 ( Id INT IDENTITY PRIMARY KEY CLUSTERED, f_Id INT NOT NULL );
CREATE TABLE dbo.t3 ( Id INT IDENTITY PRIMARY KEY CLUSTERED, f_Id INT NOT NULL );
INSERT dbo.t1 WITH (TABLOCKX) ( Data )
SELECT ROW_NUMBER() OVER (ORDER BY (SELECT NULL)) % 2000
FROM (
SELECT TOP 1000000 1 AS num
FROM master..spt_values AS sv
CROSS JOIN master..spt_values AS sv2
CROSS JOIN master..spt_values AS sv3
) AS nums
INSERT dbo.t2 WITH (TABLOCKX) ( f_Id )
SELECT TOP 15000000 t.Id
FROM dbo.t1 AS t
CROSS JOIN dbo.t1 AS t2
INSERT dbo.t3 WITH (TABLOCKX) ( f_Id )
SELECT TOP 25000000 t.Id
FROM dbo.t1 AS t
CROSS JOIN dbo.t1 AS t2
Run Code Online (Sandbox Code Playgroud)
谢谢!
我试过使用这样的查询,但“运行”线程的数量有时会超过 DOP。
从dm_os_tasksto的 joindm_os_workers是一对一的,因为一个工作线程只运行一个任务。从 task/workers 到 joindm_exec_query_profiles是一对多的,因为每个线程可能运行多个计划节点。
您需要查看与状态关联的唯一任务/执行上下文/调度程序的数量RUNNING:
SELECT
COUNT(DISTINCT DOT.scheduler_id) -- or task_address / exec_context_id
FROM sys.dm_os_tasks AS DOT
WHERE
DOT.task_state = N'RUNNING'
AND DOT.session_id = 72 -- specify the session id
AND DOT.parent_task_address IS NOT NULL; -- additional workers only
Run Code Online (Sandbox Code Playgroud)
我也尝试过使用
query_thread_profile扩展事件,但是对于具有多个并行分支的计划,它显示了相同的 N 个线程 ID。
此调试通道事件的扩展事件描述不准确:
的文档sys.dm_exec_query_profiles提供了更好的描述thread_id:
区分属于同一查询运算符节点的线程(对于并行查询)。
在每个分支中,每个线程都有一个 ID,类似于 showplan 中的每个线程细分。在 DOP x 处,每个分支都有从 1 到 x 的线程 ID,但它只是一个序列号(想想行号)。
您可以通过收集任务/工作程序/系统线程 id 来区分扩展事件中的线程。如果您对整个执行计划的线程 ID 感兴趣,那么最好的代理是execution_context_id. 每个执行上下文都与一个线程相关联。
并行执行的可视化可以通过许多不同的方式完成,具体取决于正在调查的特定方面。可以通过多种方式加入和订购 DMV。
例如,下面显示了每个线程最近做了什么,以及它当前正在等待什么(如果有的话):
DECLARE @session_id smallint = 72;
SELECT
DOT.task_state,
DOT.scheduler_id,
DOT.exec_context_id,
DEQP.physical_operator_name,
DEQP.node_id,
DEQP.thread_id,
DEQP.row_count,
DOWT.wait_duration_ms,
DOWT.wait_type,
DOWT.resource_description
FROM sys.dm_os_tasks AS DOT
OUTER APPLY
(
-- What each thread did most recently
SELECT *
FROM sys.dm_exec_query_profiles AS DEQP
WHERE
DEQP.session_id = DOT.session_id
AND DEQP.request_id = DOT.request_id
AND DEQP.task_address = DOT.task_address
ORDER BY
DEQP.last_active_time DESC
OFFSET 0 ROWS FETCH FIRST 1 ROW ONLY
) AS DEQP
OUTER APPLY
(
-- Longest wait, if any
SELECT *
FROM sys.dm_os_waiting_tasks AS DOWT
WHERE
DOWT.session_id = DOT.session_id
AND DOWT.exec_context_id = DOT.exec_context_id
ORDER BY
DOWT.wait_duration_ms DESC
OFFSET 0 ROWS FETCH FIRST 1 ROW ONLY
) AS DOWT
WHERE
DOT.session_id = @session_id
--AND DOT.task_state = N'RUNNING'
ORDER BY
DEQP.node_id,
DOT.exec_context_id;
Run Code Online (Sandbox Code Playgroud)
演示查询的示例输出:
| 归档时间: |
|
| 查看次数: |
255 次 |
| 最近记录: |