网络中心 专题网 网站地图 RSS订阅   
提升SQL Server 2005统计的性能
发布时间:2008-10-20 来源:SQL专家 责任编辑:【Bander】
  内置函数count(*)在获取整个表的记录总数时,非常消耗时间,特别是在数据表中存在数以百万计条记录时,更为明显。本文介绍的row_count用户自定义函数,取决于对象目录视图提供准确的结果,与count(*)函数相比,速度更快,性能更佳。

  【IT专家网独家】  当我们想统计数据表的记录总数时,我们使用的T-SQL函数count(*) 。如果在一个包含了数百万行的大表中执行这个函数的话,,可以要花很长时间才能返回整个表的记录总数,这导致了查询性能的下降。

  一、常规办法:采用Count ()函数

  每个数据库管理员知道如何使用count(*) 函数。SQL Server在执行这个函数时,为了返回总表的行计数,需要对索引/表进行完整的扫描。因此建议DBA们尽量避免针对整个表使用聚合函数count(*),因为它影响了数据库的性能。

  下面我们来看个AdventureWorks数据库中的例子。

  在查询分析器中执行下面的查询语句:


  use AdventureWorks
  go
  select count (*) from Sales.SalesOrderDetail

  查询分析器执行后,显示有121317行。

  当我们点击SQL Server 2005 Management Studio的工具栏上的“显示估计的执行计划”图标时,我们可以得到以下的图表: 

SQL Server 2005中如何提升记录总数统计的性能

  图1:count(*)函数的执行计划

  从右到左来看,我们可以了解到SQL语句的执行过程:

  l 第一步中对整个表进行索引扫描,这是个非常耗时的过程(占81%)。

  l 第二步中应用流聚合也较耗时(占19%)。

  二、新方法:采用 row_count ()自定义函数

  在SQL Server 2005中的两个对象目录视图:sys.partitions和sys.allocation_units包含了这些信息,可以用来获取整个表的总记录数。

  sys.partitions 目录视图

  sys.partitions视图包含了数据库中每个连续分区的所有表和索引。SQL Server 2005中的所有表格和索引,即使他们没有明确划分,也包含这个视图的至少一个分区中。

  数据库中所有表和索引的每个分区在表中各对应一行。即使 SQL Server 2005 中的所有表和索引并未显式分区,也认为它们至少包含一个分区。

  在新的实现方法中,我们用到了sys. partitions 视图中的以下字段:

字段名称
数据类型
描述
partition_id
bigint
分区的 ID。在数据库中是唯一的。
object_id
int
此分区所属的对象的 ID。每个表或视图都至少包含一个分区。
index_id
 Int
此分区所属的对象内的索引的 ID。
0表示是堆表中
1表示是集群表
rows    
bigint
此分区中的大约行数。
上一页12 3 下一页