在初涉SQL Server性能问题(1/4)里,我们知道了如何快速检查服务器实例上正运行的任务数和IO等待的任务数。这个是轻量级的脚本,不会给服务器造成任何压力,即使服务器在高负荷下,也可以正常获得结果。
问题检测的第2步是获取在进行任何资源等待的会话。下面的脚本会帮助我们获得这些信息。这个查询需要预建立一个函数,如果会话是由SQL Server代理启动的话,会显示具体的作业名。
1 /***************************************************************************************** 2 PREREQUISITE FUNCTION 3 ******************************************************************************************/ 4 USE MASTER 5 GO 6 CREATE FUNCTION ConvertStringToBinary ( @hexstring VARCHAR(100) 7 ) RETURNS BINARY(34) AS 8 BEGIN 9 10 RETURN(SELECT CAST('' AS XML).value('xs:hexBinary( substring(sql:variable("@hexstring"), sql:column("t.pos")) )', 'varbinary(max)')11 FROM (SELECT CASE SUBSTRING(@hexstring, 1, 2) WHEN '0x' THEN 3 ELSE 0 END) AS t(pos)) 12 END13 /***************************************************************************************14 STEP 2: List the session which are currently waiting for resource15 ****************************************************************************************/16 SELECT node.parent_node_id AS Node_id,17 es.HOST_NAME,18 es.Login_name,19 CASE WHEN es.program_name LIKE '%SQLAgent - TSQL JobStep%' THEN20 (21 SELECT 'SQL AGENT JOB: '+name FROM msdb..sysjobs WHERE job_id=22 MASTER.DBO.ConvertStringToBinary (LTRIM(RTRIM((SUBSTRING(es.program_name,CHARINDEX('(job',es.program_name,0)+4,35)))))23 )24 ELSE es.program_name END AS [Program Name] ,25 DB_NAME(er.database_id) AS DatabaseName,26 er.session_id, 27 wt.blocking_session_id,28 wt.wait_duration_ms,29 wt.wait_type,30 wt.NoThread ,31 er.command,32 er.status,33 er.wait_resource,34 er.open_transaction_count,35 er.cpu_time,36 er.total_elapsed_time AS ElapsedTime_ms,37 er.percent_complete ,38 er.reads,39 er.writes,40 er.logical_reads,41 wlgrp.name AS ResoursePool ,42 SUBSTRING (sqltxt.TEXT,(er.statement_start_offset/2) + 1, 43 ((CASE WHEN er.statement_end_offset = -1 44 THEN LEN(CONVERT(NVARCHAR(MAX), sqltxt.TEXT)) * 2 45 ELSE er.statement_end_offset 46 END - er.statement_start_offset)/2) + 1) AS [Individual Query], 47 sqltxt.TEXT AS [Batch Query] 48 FROM (SELECT session_id, SUM(wait_duration_ms) AS 49 wait_duration_ms,wait_type,blocking_session_id,COUNT(*) AS NoThread 50 FROM SYS.DM_OS_WAITING_TASKS GROUP BY session_id, wait_type,blocking_session_id) wt 51 INNER JOIN SYS.DM_EXEC_REQUESTS er ON wt.session_id=er.session_id INNER JOIN SYS.DM_EXEC_SESSIONS es ON es.session_id= er.session_id52 INNER JOIN SYS.DM_RESOURCE_GOVERNOR_WORKLOAD_GROUPS wlgrp ON wlgrp.group_id=er.group_id 53 INNER JOIN (SELECT os.parent_node_id ,task_address FROM SYS.DM_OS_SCHEDULERS OS INNER JOIN 54 SYS.DM_OS_WORKERS OSW ON OS.scheduler_address=OSW.scheduler_address 55 WHERE os.status='VISIBLE ONLINE' GROUP BY os.parent_node_id ,task_address ) node 56 ON node.task_address=er.task_address57 CROSS APPLY SYS.DM_EXEC_SQL_TEXT(er.sql_handle) AS sqltxt58 WHERE sql_handle IS NOT NULL AND wt.wait_type NOT IN ('WAITFOR','BROKER_RECEIVE_WAITFOR')59 GO
输出结果的每列说明介绍如下:
- Node_id NUMA节点ID。可以被调度者查询的节点映射。
- HOST_NAME 建立连接的计算机名。
- Login_name 连接到数据库服务器的会话用户名。
- Program Name 使用会话的对应程序名。在连接字符串里可以设置程序名。如果会话是SQL Server代理的一部分,则显示作业名。
- DatabaseName 会话的当前数据库名。
- session_id 会话ID。
- blocking_session_id 阻塞语句的会话ID。
- wait_duration_ms 等待时间,单位为毫秒。这个时间不包括信号等待时间(signal wait time )。
- wait_type 等待类型名称,例如:SLEEP_TASK,CXPACKET等。
- NoThread 当前会话的线程数,如果当前会话是并行执行(parallel execution)的话。
- command 标识当前类型的命令,即T-SQL语句,例如Select,insert,update,delete等。
- status 请求状态:Background,Running,Runnable,Sleeping 和 Suspended。
- wait_resource 请求当前等待的资源。
- open_transaction_count 当前会话打开的事务数。
- cpu_time 请求使用的CPU时间,单位毫秒。
- ElapsedTime_ms 自请求到达后,占用的CPU时间,单位毫秒。
- percent_complete 指定操作的工作完成进度,例如备份、还原、回滚等。
- reads 请求执行的读数。
- writes 请求执行的写数。
- logical_reads 请求执行的逻辑读数。
- ResoursePool 资源管理池名称。
- Individual Query 在会话里运行的批处理SQL语句。
- Batch Query 在会话里运行的批处理(存储过程/一系列的语句)。
上述查询多次执行后,输出结果有很长wait_duration_ms的会话,这个会话不被其他会话阻塞,且一直在输出结果里。我们就要看看这个会话的程序名,主机名,登录用户名,还有对应的执行语句,具体进行什么操作造成的。根据这些信息,我们可以选择性的去终止这个会话,然后分析下具体的执行语句。如果会话是被阻塞的,我们要用另外的语句来找出阻塞的会话。
第3步,列出服务器上正运行的会话清单。
1 /*************************************************************************************** 2 STEP 3: List the session which are currently waiting/running 3 ****************************************************************************************/ 4 SELECT node.parent_node_id AS Node_id, 5 es.HOST_NAME, 6 es.login_name, 7 CASE WHEN es.program_name LIKE '%SQLAgent - TSQL JobStep%' THEN 8 (SELECT 'SQL AGENT JOB: '+name FROM msdb..sysjobs WHERE job_id=DBO.ConvertStringToBinary (LTRIM(RTRIM((SUBSTRING(es.program_name,CHARINDEX('(job',es.program_name,0)+4,35))))) 9 )ELSE es.program_name END AS program_name ,10 DB_NAME(er.database_id) AS DatabaseName,11 er.session_id, 12 wt.blocking_session_id,13 wt.wait_duration_ms,14 wt.wait_type,15 wt.NoThread ,16 er.command,17 er.status,18 er.wait_resource,19 er.open_transaction_count,20 er.cpu_time,21 er.total_elapsed_time AS ElapsedTime_ms,22 er.percent_complete ,23 er.reads,er.writes,er.logical_reads,24 wlgrp.name AS ResoursePool ,25 SUBSTRING (sqltxt.TEXT,(er.statement_start_offset/2) + 1, 26 ((CASE WHEN er.statement_end_offset = -1 27 THEN LEN(CONVERT(NVARCHAR(MAX), sqltxt.TEXT)) * 2 28 ELSE er.statement_end_offset 29 END - er.statement_start_offset)/2) + 1) AS [Individual Query],30 sqltxt.TEXT AS [Batch Query] 31 FROM 32 SYS.DM_EXEC_REQUESTS er INNER JOIN SYS.DM_EXEC_SESSIONS es ON es.session_id= er.session_id33 INNER JOIN SYS.DM_RESOURCE_GOVERNOR_WORKLOAD_GROUPS wlgrp ON wlgrp.group_id=er.group_id 34 INNER JOIN (SELECT os.parent_node_id ,task_address FROM SYS.DM_OS_SCHEDULERS OS 35 INNER JOIN SYS.DM_OS_WORKERS OSW ON OS.scheduler_address=OSW.scheduler_address36 WHERE os.status='VISIBLE ONLINE' GROUP BY os.parent_node_id ,task_address ) node ON node.task_address=er.task_address37 LEFT JOIN 38 (SELECT session_id, SUM(wait_duration_ms) AS 39 wait_duration_ms,wait_type,blocking_session_id,COUNT(*) AS NoThread 40 FROM SYS.DM_OS_WAITING_TASKS GROUP BY session_id, wait_type,blocking_session_id) wt 41 ON wt.session_id=er.session_id42 CROSS apply SYS.DM_EXEC_SQL_TEXT(er.sql_handle) AS sqltxt43 WHERE sql_handle IS NOT NULL AND ISNULL(wt.wait_type ,'') NOT IN 44 ('WAITFOR','BROKER_RECEIVE_WAITFOR')45 ORDER BY er.total_elapsed_time DESC46 47 GO
这里的输出列和第2步完全相同,我会分析total_elapsed_time占用时间较长的会话,酌情考虑是否终止这些会话,并分析下对应的执行SQL语句。大多数情况下(服务器一致运行稳定,突然卡住了),使用上述步骤就可以解决问题。下一篇文章我们会看下阻塞的会话,还有打开未活动事务的会话。