SQL SERVER聚集索引

一、聚集索引

1、数据存储在数据页中

  表的数据是存储在数据页中(数据页的PageType标记为1),SqlServer一页是8k,存满一页就开辟下一页存储。

  如果表有聚集索引,那么一笔一笔物理数据就是按聚集索引字段的大小升/降排序存储在页中。当对聚集索引字段更新或中间插入/删除数据时,都会导致表数据移动(造成性能一定影响),因为它要保持升/降排序。

  注意,主键只是默认是聚集索引,它也可以设置为非聚集索引,也可以在非主键字段上设置为聚集索引,全表只能有一个聚集索引。

2、聚集索引字段特性

  一个优秀的聚集索引字段一般包含以下4个特性:

  • (A).自增长
    总是在末尾增加记录,减少分页和索引碎片。
  • (B).不被更改
    减少数据移动。
  • (C).唯一性
    唯一性是任何索引最理想的特性,可以明确索引键值在排序中的位置。
  • (D).字段长度小
    聚集索引键长度越小,一页索引页就可以容纳更多索引记录,进而减少索引B树结构的深度。

3、索引“键值”的唯一性

  索引键值唯一的话,它在每条记录里才可以正确指向源数据行RID。
  如果聚集索引键值不唯一,SqlServer就需要内部生成uniquifier 列组合当作聚集键保证“键值”唯一性;如果非聚集索引键值不唯一,就会增加RID列(聚集索引键或者堆表中的行指针)保证“键值”唯一性。

  • 为了“键值”唯一性,对于聚集索引,uniquifier 列只在索引值重复时增加。
    对于非聚集索引,如果创建索引时没定义唯一,RID会在所有记录增加,就算索引值是唯一的;如果创建索引时定义唯一,RID只在叶子层增加,用于查找源数据行,即书签查找操作。

4、字段长度小的优点举例

  • 查询执行的大部分开销是I/O

  • 例如,一个百万记录的表有一个int聚集索引,可能只需要3层的B树结构。
    如果把聚集索引定义在更宽的列(比如uniqueidentifier列需要16 字节),那么索引的深度会增加到4层。
    任何聚集索引查找需要4个I/O操作(确切的说是4个逻辑读),原先只要3个I/O操作。

  • 同样,非聚集索引里会包含聚集索引键值,聚集索引键长度越小非聚集索引记录也就越小,一页索引页就可以容纳更多索引记录。

5、参考资料

参考资料:https://www.jb51.net/article/143528.htm

版权声明:
作者:Zad
链接:https://www.techfm.club/p/47731.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>