可以使用以下步骤估算在聚集索引中存储数据所需的空间量:
计算用于在聚集索引的叶级别存储数据的空间。
计算用于存储聚集索引的索引信息的空间。
计算值总数。
步骤 1. 计算用于在叶级别存储数据的空间
指定表中将存在的行数:
Num_Rows = 表中的行数
指定固定长度和可变长度列的数目,并计算其存储所需的空间:
计算其中每组列在数据行中占用的空间。 列的大小取决于数据类型和长度规范。
Num_Cols = 列总数(固定长度和可变长度)
Fixed_Data_Size = 所有固定长度列的总字节大小
Num_Variable_Cols = 可变长度列数
Max_Var_Size = 所有可变长度列的最大字节大小
如果聚集索引是非唯一的,请考虑 uniqueifier 列。
唯一化器是可为 null 的可变长度列。 在具有非统一键值的行中,它的大小为非 null 和 4 个字节。 此值是索引键的一部分,需要确保每行都具有唯一键值。
= Num_ColsNum_Cols + 1
Num_Variable_Cols = Num_Variable_Cols + 1
= Max_Var_SizeMax_Var_Size + 4
这些修改假定所有值都是非统一的。
行的一部分,称为 null 位图,用于管理列的可空性。 计算其大小:
Null_Bitmap = 2 + ((Num_Cols + 7) / 8)
应仅使用上一个表达式的整数部分;放弃任何余数。
计算可变长度的数据大小:
如果表中存在可变长度的列,请确定用于在行中存储列的空间量:
Variable_Data_Size = 2 + (Num_Variable_Cols x 2) + Max_Var_Size
添加到 Max_Var_Size 的字节用于跟踪每个变量列。 此公式假定所有可变长度列都已满 100%。 如果预计将使用较小百分比的可变长度列存储空间,则可以按该百分比调整 Max_Var_Size 值,从而更准确地估计整个表大小。
注释
可以合并
varchar、nvarchar、varbinary或sql_variant列,这可能导致定义的表宽度总数超过 8,060 字节。 这些列中的每一列的长度仍然必须限制在 8,000 字节以内(对于varchar、varbinary或sql_variant列),而对于nvarchar列则限制在 4,000 字节以内。 但是,它们的组合宽度可能超过表中的 8,060 字节限制。如果没有可变长度的列, 请将Variable_Data_Size 设置为 0。
计算总行大小:
Row_Size = 固定数据大小 + 可变数据大小 + Null_Bitmap + 4
数值 4 是数据行的行标题开销。
计算每页的行数(每页 8096 个可用字节):
Rows_Per_Page = 8096 / (Row_Size + 2)
由于行不跨页,因此每页的行数应向下舍入到最接近的整行。 公式中的数值 2 是页面插槽数组中行的条目。
根据指定的 填充因子 计算每页保留的免费行数:
Free_Rows_Per_Page = 8096 x ((100 - Fill_Factor) / 100) / (Row_Size + 2)
计算中使用的填充因子是整数值,而不是百分比。 由于行不跨页,因此每页的行数应向下舍入到最接近的整行。 随着填充因子的增长,每个页面上将存储更多的数据,并且页面将减少。 公式中的数值 2 是页面插槽数组中行的条目。
计算存储所有行所需的页数:
Num_Leaf_Pages = Num_Rows / (Rows_Per_Page - Free_Rows_Per_Page)
估计的页数应向上舍入到最接近的整页。
计算在叶级别(每页 8192 个总字节数)中存储数据所需的空间量:
Leaf_space_used = 8192 x Num_Leaf_Pages
步骤 2. 计算用于存储索引信息的空间
可以使用以下步骤来估计存储索引的上限所需的空间量:
在索引键中指定固定长度和可变长度列的数目,并计算其存储所需的空间:
索引的键列可以包括固定长度和可变长度列。 若要估计内部级别索引行大小,请计算这些列组在索引行中占用的空间。 列的大小取决于数据类型和长度规范。
Num_Key_Cols = 键列的总数(固定长度和可变长度)
Fixed_Key_Size = 所有固定长度键列的总字节大小
Num_Variable_Key_Cols = 可变长度键列数
Max_Var_Key_Size = 所有可变长度键列的最大字节大小
如果索引不统一,则考虑所需的任何唯一器:
唯一化器是可为 null 的可变长度列。 在具有非唯一索引键值的行中,它将为非空且大小为 4 个字节。 此值是索引键的一部分,需要确保每行都具有唯一键值。
= Num_Key_ColsNum_Key_Cols + 1
= Num_Variable_Key_ColsNum_Variable_Key_Cols + 1
Max_Var_Key_Size = Max_Var_Key_Size + 4
这些修改假定所有值都是非统一的。
计算空值位图的大小:
如果索引键中存在可为 null 的列,则索引行的一部分保留为 null 位图。 计算其大小:
Index_Null_Bitmap = 2 + (索引行中的列数 + 7) / 8)
只应使用上一个表达式的整数部分。 放弃任何余数。
如果没有可以为 null 的键列,请将 Index_Null_Bitmap 设置为 0。
计算可变长度的数据大小:
如果索引中有可变长度的列,请确定用于在索引行中存储列的空间量:
Variable_Key_Size = 2 + (Num_Variable_Key_Cols x 2) + Max_Var_Key_Size
添加到 Max_Var_Key_Size 的字节用于跟踪每个可变长度列。 此公式假定所有可变长度列都已满 100%。 如果预计将使用较小百分比的可变长度列存储空间,则可以按该百分比调整 Max_Var_Key_Size 值,从而更准确地估计整个表大小。
如果没有可变长度的列,请将 Variable_Key_Size 设置为 0。
计算索引行大小:
= Index_Row_SizeFixed_Key_Size + + Variable_Key_SizeIndex_Null_Bitmap + 1 (索引行的行标题开销) + 6 (对于子页 ID 指针)
计算每页索引行数(每页 8096 个可用字节):
Index_Rows_Per_Page = 8096 / (Index_Row_Size + 2)
由于索引行不跨页,因此每个页的索引行数应向下舍入到最接近的整行。 公式中的 2 表示页面槽数组中行的一个条目。
计算索引中的级别数:
非叶层级 = 1 + 对数 Index_Rows_Per_Page (Num_Leaf_Pages / Index_Rows_Per_Page)
将此值向上取整为最接近的整数值。 此值不包括聚集索引的叶级别。
计算索引中非叶子页面的数量:
Num_Index_Pages = ∑Level (Num_Leaf_Pages / (Index_Rows_Per_Page级别)
其中 1 <= Level <= Non-leaf_Levels
将每个求和结果向上舍入到最接近的整数。 作为简单的示例,请考虑一个索引,其中Num_Leaf_Pages = 1000,以及Index_Rows_Per_Page = 25。 叶级别上方的第一个索引级别存储 1000 个索引行,每个叶页有一个索引行,每个页可以容纳 25 个索引行。 这意味着需要 40 页来存储这 1000 个索引行。 索引的下一级别必须存储 40 行。 这意味着它需要 2 页。 索引的最终级别必须存储 2 行。 这意味着它需要 1 页。 这提供了 43 个非叶索引页。 在前面的公式中使用这些数字时,结果如下所示:
非叶等级 = 1 + log25 (1000 / 25) = 3
Num_Index_Pages = 1000/(253)+ 1000/(252) + 1000/(251) = 1 + 2 + 40 = 43,这是示例中所述的页数。
计算索引的大小(每页 8192 个总字节):
Index_Space_Used = 8192 x Num_Index_Pages
步骤 3. 计算值总数
前两个步骤中获取的值总数:
聚集索引大小 (字节) = Leaf_Space_Used + Index_Space_used
此计算不考虑以下事项:
分区
分区的空间开销很小,但计算起来较为复杂。 包括这一点并不重要。
分配页
用于跟踪分配给堆的页面的至少有一个 IAM 页,尽管空间开销很小,但没有算法可以准确计算将使用多少个 IAM 页。
大型对象 (LOB) 值
用于确定将有多少空间用于存储 LOB 数据类型
varchar(max)、varbinary(max)、nvarchar(max)、text、ntext和xmlimage值的算法很复杂。 只需添加预期 LOB 值的平均大小、乘 以Num_Rows,并将其添加到聚集索引总大小即可。压缩
无法预先计算压缩索引的大小。
稀疏列
有关稀疏列的空间要求的信息,请参阅 “使用稀疏列”。
另请参阅
描述的聚集索引和非聚集索引
估计表的大小
创建聚集索引
创建非聚集索引
估计非聚集索引的大小
估计堆的大小
估计数据库的大小