我们可以优化数据库查询,升级数据库服务器,但仍不足以保证应用程序良好的数据库性能。这是因为问题可能产生于系统中并发(指同步)地执行查询操作。实际上,在产品化的数据库系统中,同步执行查询可能引发的问题是再多的查询优化也不能解决的。我们可以有最优化的、执行最快的查询,但是,如果这些查询因为并发问题得不到需要的数据,说明优化工作还做得不够充分。
从根本上讲,我们必须保证数据库查询和执行查询的连接必须能够在并发执行中没有错误(如死锁或更新冲突),并能在可接受的等待时间内得到结果。如果不能做到,就要定位并发问题并找出原因:为什么独立运行查询时正确,并发运行时就出问题。
解决并发问题的过程是一个基于经验的过程。模仿产品环境并不容易,从许多同步连接中预测查询操作并发时的行为也很难。这就是为什么必须经常保留系统状态,才能在并发问题发生时诊断问题的原因。
大多数情况下并发问题是一个SQL Server进程(或任务)等待某种资源,而这种资源还没有被其他进程释放。如果两个进程串行,就不会有冲突;当它们并行时,对某种资源的冲突就产生了。这些等待大多由对用户资源的锁请求造成的。
在本章中,我们将会学习到解决并发问题的技术。概括地讲,就是诊断和解决以下情况:锁、阻塞和死锁。基本的方法简单明了:
识别并发问题;
分析和找出原因;
修改并解决问题。
使用这种方法需要我们熟悉相当多的背景资料。本章假设读者已经阅读或已经熟悉Kalen Delaney写的Inside SQL Server 2005:The Storage Engine第8章"锁和并发"中的内容(见本书参考书目中的引用:其他资源和引用)。确切地说,那个章节包含必需的资料,关于SQL Server 2005中事务、隔离级别和锁等解决并发问题需要的内容。
6.1 解决并发问题的新工具
SQL Server 2005增加了一些重要的解决并发问题的新工具。除了新增的工具,它仍然包含原来的一些工具,如sp_who2等系统存储过程、Perfmon计数器,解决并发问题的SQL Trace/Profiler工具等。
为了检测和分析并发问题,SQL Server 2005包括了以下新工具:
DMV,特别是sys.dm_os_wait_stats和sys.dm_os_waiting_tasks。
加强的SQLDiag.exe功能,收集运行系统的信息。
基于行版本的隔离选项("快照"和"已提交读快照"隔离级别)。
新的1222跟踪标识和SQL Trace检测分析死锁的"死锁图表"事件类。
SQL Trace/Profiler中的被阻进程报告事件类,和检测长阻塞的"被阻塞进程阈值"服务器配置选项。
新计数器 "SQLServer:Transactions Perfmon"对象,用来检测"快照隔离"事务中的更新冲突,计算在tempdb中版本存储的使用量。
目前,新工具中有两个最基本的工具值得注意:用于检测的sys.dm_os_waiting_tasks DMV和为了决议的基于行版本的隔离级别。在这里我们只概括地进行介绍,讲到解决问题的特定技术时再介绍更多的细节。
6.1.1 新阻塞检测工具:sys.dm_os_waiting_tasks
sys.dm_os_waiting_tasks是SQL Server 2005检测并发问题阻塞类型最重要的新工具。这个DMV显示所有任务的等待信息。并不是所有等待任务都是阻塞的,因为任务可能等待I/O或内存授权。当一个任务等待另一个任务相对长时间时,它就会被阻塞。当一个任务A被另一个任务B阻塞,阻塞任务B将在视图中显示。
这个视图的优点之一是它列出了任务和进程。任务表现出比SPID(服务器进程ID)更详细的SQL Server执行细节。如果进程是并行的,一个给定的SPID可能包含一些同步任务;如果spid不是并行的,任务就只有一个spid。
导致任务等待的原因有很多,许多和并发没有任何关系。所以从视图中过滤出不相干的行很重要,从而可以更好地关注由于资源锁定引起的阻塞问题。
6.1.2 新阻塞决议工具:基于行版本控制的隔离级别
另一个主要的新工具由使用基于行版本的"快照隔离"选项组成,它减少了锁的数量,从而减少阻塞和死锁。确切地说,行版本可以减少或去除事务内外部的共享锁。因此,由于发行共享锁而可能被阻塞的查询和事务就不再被阻塞了。和使用NOLOCK提示不同,这些查询只会读取已提交的数据。
使用基于行版本的隔离级别在某些方面有一定作用,包括tempdb中由于行版本增长的活动、使用某个或全部"快照隔离"选项时触发器需要的代码改动,以及使用SNAPSHOT隔离级别时DDL选项与可能丢失的更新之间的冲突。
6.1.3 并发问题的类型
当一个SQL Server进程或任务在等待时,它通常在等待某种被另一个SQL Server锁定的资源。最可能遇到的并发问题和锁有关,包括下面的内容:
锁定
阻塞
死锁
tempdb使用
更新冲突
前3种与以下内容相关:锁定是SQL Server基本的并发机制,阻塞发生于一个任务必须等待被另一个任务锁定的资源时,死锁发生于任务之间互相阻塞时。
列表中后面两种产生于使用行版本。一般来说,我们可能看到增长的tempdb活动与行版本使用有关,可能还有一些性能问题与之相关。(我们可能也需要定位其他与tempdb相关的并发问题,例如与高频率创建临时表格相关的高tempdb活动性。)此外,当使用写数据库事务的"快照"隔离级别时,我们可能发现更新冲突的案例。