非聚集索引,这个是大家都非常熟悉的一个东西,有时候我们由于业务原因,sql写的非常复杂,需要join很多张表,然后就泪流满面了。。。这时候就有DBA或者资深的开发给你看这个猥琐的sql,通过执行计划一分析。。。或许就看出了不该有的表扫描。。。万恶之源。。。然后给你在关键的字段加上非聚集索引后。。。才发现提速比阿斯顿马丁还要快。。。那么一个问题来了,为什么非聚集索引能提速这么快。。。怎么做到的???是不是非常的好奇???
这篇我们来解开神秘面纱。
一:现象
先让我们一睹非聚集索引的真容,看看到底在执行计划看来是个什么玩意。。。我这里有个product表,里面灌了8w多数据,然后在Name列上建立
一个非聚集索引,就像下图一样:
从上图中看到了两个好玩的东西,一个就是我想看到的“索引查找[nonclustered]”,这个大家很熟悉,也是这篇要说的,然后我们还看到了一个“RID查找”,乍一看这是什么鸡巴玩意。。。非聚集索引跟它扯上什么关系了???
二:什么是RID
通过前面几篇,我想大家都知道了数据页中的记录是如何寻找的?秘密就是通过slot槽位中的偏移量决定的,那问题来了,如果上升到数据页层面,我只需要(pageID:slotID)就可以找到记录了,对不对?那如果我上升了文件层面,那是不是只需要知道(fileID:pageID:slotID)就可以找到数据页中的 记录了?其实这里的RID就是站在文件的高度通过(fileID:pageID:slotID)找到表记录的。。。既RID=RowID=(fileID:pageID:slotID),如果你非要眼见实的话,在sq中l还真提供了这么个函数(sys.fn_PhysLocFormatter(%%physloc%%)),我们看下图:
看了上面的图,是不是很兴奋,一目了然,比如productID=18088这条记录,然来是在1号文件,34941号数据页,0号槽位上,productID=18089是在1号槽位上,好了,当你知道RID是个什么东西的时候,我想你已经离彻底理解非聚集索引不远啦。。。
三:非聚集索引
有一点我们肯定知道,就是非聚集索引是可以加速查找的,要是跟表扫描那样的龟速,那也就失去了索引的目的,既然能加速,是因为它和聚集索引一样,在底层都玩起了B树,首先我们插入一些样例数据。
DROP TABLE dbo.Person CREATE TABLE Person(ID INT IDENTITY,NAME CHAR(900)) CREATE INDEX idx_Person_Name ON dbo.Person(Name) DECLARE @ch AS INT=97 WHILE @ch<=122 BEGIN INSERT INTO dbo.Person VALUES(REPLICATE(CHAR(@ch),5)) SET @ch=@ch+1 END
查看更多关于SqlServer中的非聚集索引详细介的详细内容...