微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

SQLSERVER排查CPU占用高的情况

今天中午,有朋友叫我帮他看一下数据库,操作系统是Windows2008R2,数据库sql2008R2 64位

64G内存,16核cpu

硬件配置还是比较高的,他说服务器运行的是金蝶K3软件,数据库实例里有多个数据库

他说是这几天才出现的,而且在每天的某一个时间段才会出现cpu占用高的情况

内存占用也很高,占用了30个G

-----------------------------------------------华丽的分割线-------------------------------------------------------

一般排查都是用下面的脚本,一般会用到三个视图sys.sysprocesses ,dm_exec_sessions ,dm_exec_requests

1 USE master
2 GO
3 --如果要指定数据库就把注释去掉
4 SELECT * FROM sys.[sysprocesses] WHERE spid]>50 AND DB_NAME([dbid])='gposdb'
5 SELECT COUNT(*) FROM sys].dm_exec_sessionssession_id50

看一下当前的数据库用户连接有多少

然后使用下面语句看一下各项指标是否正常,是否有阻塞,这个语句选取了前10个最耗cpu间的会话

复制代码

 1 SELECT TOP 10
 2 ], 3 request_id 4 start_timeAS '开始时间' 5 status状态 6 command命令 7 dest.textsql语句 8 DB_NAME(database_id]) 数据库 9 blocking_session_id正在阻塞其他会话的会话ID10 wait_type等待资源类型11 wait_time等待时间12 wait_resource等待的资源13 reads物理读次数14 writes次数15 logical_reads逻辑读次数16 row_count返回结果行数'
17 dm_exec_requestsAS der 
18 CROSS APPLY 
19 sys.dm_exec_sql_text](der.sql_handle dest 
20 50 AND DB_NAME(der.])=gposdb'  
21 ORDER BY cpu_timeDESC

复制代码


如果想看具体的sql语句可以执行下面的sql语句,记得在SSMS里选择以文本格式显示结果

在SSMS里选择以文本格式显示结果 10 3 dest.6 sys.7 50 8

复制代码

模拟了一些耗cpu间的动作

-----------------------------------------华丽的分割线-----------------------------------------------------------

还有查看cpu数和user scheduler数和最大工作线程数,检查worker是否用完也可以排查cpu占用情况

查看cpu数和user scheduler数目 SELECT cpu_count,scheduler_count FROM sys.dm_os_sys_info 查看最大工作线程数 SELECT max_workers_count FROM sys.dm_os_sys_info

查看机器上的所有schedulers包括user 和system
通过下面语句可以看到worker是否用完,当达到最大线程数的时候就要检查blocking了


对照下面这个表
各种cpusqlSERVER版本组合自动配置的最大工作线程数
cpu数                 32位计算机                        64位计算机
<=4                     256                                   512
  8                        288                                   576
 16                       352                                   704
 32                       480                                   960

SELECT scheduler_address,0)">scheduler_id,0)">cpu_id,0)">status,128)">6 current_tasks_count,0)">current_workers_count,active_workers_count FROM sys.dm_os_schedulers

复制代码

 如果大家有什么需要补充的,或者文章有不正确的,欢迎大家拍砖!!

----------------------------------------------------------------------------------------------

 2013-6-15 做了一下补充,如果sqlSERVER存在要等待的资源,那么执行下面语句就会显示出会话中有多少个worker在等待

结合[sys].[dm_os_wait_stats]视图,如果当前sqlSERVER里面没有任何等待资源,那么下面的sql语句不会显示任何结果

2 3 4 5 6 7 dest. 8 9 10 der.11 12 13 dowswaiting_tasks_count当前正在进行等待的任务数14 15 16 17 18 19 INNER JOIN dm_os_wait_stats dows 20 ON der.] 21 22 sys.23 24

复制代码

 比如我当前执行了查询SalesOrderDetail_test表100次,由于表数据非常多,所以SSMS需要把sqlSERVER执行的结果慢慢的取走,

造成了ASYNC_NETWORK_IO等待

USE AdventureWorksFROM dbo.SalesOrderDetail_testGO 100

------------------------------------------------------------------------------------------------

经过排查和这几天的观察情况,确定是某些表缺失索引导致,现在在这些表上增加了索引,问题解决

select from t_AccessControl 权限控制表权限控制 from t_GroupAccess 用户组权限表用户组权限 from t_GroupAccesstype 用户组权限类表用户组权限类 from t_ObjectAccess 对象权限表对象权限 from t_ObjectAccesstype 对象权限类型表对象权限类型 from t_ObjectType 对象类型表对象类型

复制代码

查询cpu占用高的语句

2 total_worker_time/execution_count avg_cpu_cost,plan_handle,128)"> 3 execution_count,128)"> 4 (SUBSTRING(text,statement_start_offset/2 + 1 5 (CASE WHEN statement_end_offset = -1 6 THEN LEN(CONVERT(nvarchar(max),text)) * 2 7 ELSE statement_end_offset 8 END - statement_start_offset)2) 9 FROM sys.dm_exec_sql_text(sql_handle)) query_text 10 sys.dm_exec_query_stats 11 avg_cpu_cost

复制代码

查询缺失索引

SELECT 2 DatabaseName = DB_NAME(database_id) 3,Number Indexes Missing] count(*) sys.dm_db_missing_index_details GROUP BY 2 DESC;

复制代码

SELECT 2 Total Cost] ROUND(avg_total_user_cost * avg_user_impact * (user_seeks + user_scans),0 4,TableName = statement 5,0)">EqualityUsage equality_columns 6,0)">InequalityUsage inequality_columns 7,0)">Include Cloumns included_columns 8 sys.dm_db_missing_index_groups g 9 JOIN sys.dm_db_missing_index_group_stats s 10 ON s.group_handle g.index_group_handle sys.dm_db_missing_index_details d 12 ON d.index_handle g.index_handle 13

复制代码

定位问题后,新建非聚集索引

CREATE NONCLUSTERED INDEX IX_t_AccessControl_F4 ON dbo.t_AccessControl ( FObjectType 4 )include(FUserID],0)">FAccesstypeFAccessMaskWITH( STATISTICS_norECOmpuTE = OFF,IGnorE_DUP_KEY ON,ALLOW_PAGE_LOCKS ON) ON PRIMARY6 drop index IX_t_AccessControl_F4 on t_AccessControl

复制代码

 cpu占用恢复正常

跟踪模板和跟踪文件下载,请使用sql2008R2 版本:files.cnblogs.com/lyhabc/跟踪模板和trace.rar

 

 

4
0
(请您对文章做出评价)
« 上一篇YourSQLDba的总结
» 下一篇关于鬼影记录的翻译一
posted @  2013-06-12 22:34  桦仔 阅读( 1219) 评论( 11编辑  收藏
  
#1楼   2013-06-13 21:28  潇湘隐者   
我上次也碰到过这种情况,一个使用频繁的大表,被开发人员删除一个索引,结果引起很多脚本性能问题,导致cpu接近100%
  
#2楼 [ 楼主2013-06-13 23:24  桦仔 
@潇湘隐者
引用 我上次也碰到过这种情况,一个使用频繁的大表,被开发人员删除一个索引,结果引起很多脚本性能问题,导致cpu接近100%

那你当时怎麽知道是因为删除了索引的原因呢?
  
#3楼   2013-06-14 08:10 
@桦仔
方法跟你差不多,还结合了“活动与监视器”这个工具
  
#5楼 [ 楼主2013-06-15 17:44 
@nzperfect
引用 我是来看排查过程及结果的,结果呢?

我这里只是演示哦,您也可以使用我给出的sql语句测试一下的
  
#6楼   2013-06-15 18:16 
从你第一个cpu图上可以看到cpu同时都在做相同的变化曲线,估计max degree of parallelism值是认的,一般oltp的还是建议调整下这里;另外最快的定位问题方法可以直接在cpu高时,查看该时间点到底在运行哪些sql语句,并看每个语句在等待什么。
  
#7楼 [ 楼主2013-06-15 19:15 
引用 从你第一个cpu图上可以看到cpu同时都在做相同的变化曲线,估计max degree of parallelism值是认的,一般oltp的还是建议调整下这里;另外最快的定位问题方法可以直接在cpu高时,查看该时间点到底在运行哪些sql语句,并看每个语句在等待什么。
max degree of parallelism是认的,最大值64
因为我的机器是私人笔记本所以没有特别设置
生产环境一般都要设置,以防用完所有cpu资源

  
#9楼 [ 楼主2013-09-17 10:42 
@wdwwtzy
引用 话说,跟踪模板和trace.rar是怎么用的?不太明白,不好意思

跟踪模版是你创建一个跟踪的时候需要指定一些跟踪选项,这些跟踪选项会存储到一个模板里,sql profiler就会按照这个模板去抓取信息
你创建好跟踪之后就将这个跟踪模版另存
下次再打开sql profiler的时候就可以直接导入这个跟踪模板,不用重新选择跟踪选项了


  
#10楼   2013-09-17 10:57 
多谢作者,回复的这么快。那你提供的那个就是跟踪cpu过高语句的模板呗?
  
#11楼 [ 楼主2013-09-17 11:12 
引用 多谢作者,回复的这么快。那你提供的那个就是跟踪cpu过高语句的模板呗?
跟踪cpu没有模板哦



因为每个事件都会显示这个事件执行时候消耗的cpu

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐