你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

BinaryQuantizationCompression interface

包含特定于索引和查询期间使用的二进制量化压缩方法的配置选项。

扩展

属性

kind

多态鉴别器,它指定此对象可以的不同类型的

继承属性

compressionName

要与此特定配置关联的名称。

defaultOversampling

默认过度采样因子。 在初始搜索中,过度采样将在内部请求更多文档(由此乘数指定)。 这会增加使用全精度向量重新计算相似性分数重新计算的结果集。 最小值为 1,这意味着没有过度采样(1x)。 仅当 rerankWithOriginalVectors 为 true 时,才能设置此参数。 较高的值会以牺牲延迟为代价提高召回率。

rerankWithOriginalVectors

如果设置为 true,则获取使用压缩向量计算的有序结果集后,将通过重新计算全精度相似性分数来重新计算结果集。 这将提高召回率,代价是延迟。

rescoringOptions

包含用于重新记录的选项。

truncationDimension

要截断向量到的维度数。 截断向量可减少向量的大小,以及搜索期间需要传输的数据量。 这可以节省存储成本,并降低搜索性能,以牺牲召回率。 它只应用于使用 Matryoshka 表示法学习(MRL)训练的嵌入,例如 OpenAI 文本嵌入-3-large(小型)。 默认值为 null,表示不截断。

属性详细信息

kind

多态鉴别器,它指定此对象可以的不同类型的

kind: "binaryQuantization"

属性值

"binaryQuantization"

继承属性详细信息

compressionName

要与此特定配置关联的名称。

compressionName: string

属性值

string

继承自VectorSearchCompression.compressionName

defaultOversampling

默认过度采样因子。 在初始搜索中,过度采样将在内部请求更多文档(由此乘数指定)。 这会增加使用全精度向量重新计算相似性分数重新计算的结果集。 最小值为 1,这意味着没有过度采样(1x)。 仅当 rerankWithOriginalVectors 为 true 时,才能设置此参数。 较高的值会以牺牲延迟为代价提高召回率。

defaultOversampling?: number

属性值

number

继承自VectorSearchCompression.defaultOversampling

rerankWithOriginalVectors

如果设置为 true,则获取使用压缩向量计算的有序结果集后,将通过重新计算全精度相似性分数来重新计算结果集。 这将提高召回率,代价是延迟。

rerankWithOriginalVectors?: boolean

属性值

boolean

继承自VectorSearchCompression.rerankWithOriginalVectors

rescoringOptions

包含用于重新记录的选项。

rescoringOptions?: RescoringOptions

属性值

继承自VectorSearchCompression.rescoringOptions

truncationDimension

要截断向量到的维度数。 截断向量可减少向量的大小,以及搜索期间需要传输的数据量。 这可以节省存储成本,并降低搜索性能,以牺牲召回率。 它只应用于使用 Matryoshka 表示法学习(MRL)训练的嵌入,例如 OpenAI 文本嵌入-3-large(小型)。 默认值为 null,表示不截断。

truncationDimension?: number

属性值

number

继承自VectorSearchCompression.truncationDimension