BaseVectorSearchCompression interface
包含特定于索引或查询期间使用的压缩方法的配置选项。
属性
| compression |
要与此特定配置关联的名称。 |
| default |
默认过度采样因子。 在初始搜索中,过度采样将在内部请求更多文档(由此乘数指定)。 这会增加使用全精度向量重新计算相似性分数重新计算的结果集。 最小值为 1,这意味着没有过度采样(1x)。 仅当 rerankWithOriginalVectors 为 true 时,才能设置此参数。 较高的值会以牺牲延迟为代价提高召回率。 |
| kind | 多态鉴别器,它指定此对象可以的不同类型的 |
| rerank |
如果设置为 true,则获取使用压缩向量计算的有序结果集后,将通过重新计算全精度相似性分数来重新计算结果集。 这将提高召回率,代价是延迟。 |
| rescoring |
包含用于重新记录的选项。 |
| truncation |
要截断向量到的维度数。 截断向量可减少向量的大小,以及搜索期间需要传输的数据量。 这可以节省存储成本,并降低搜索性能,以牺牲召回率。 它只应用于使用 Matryoshka 表示法学习(MRL)训练的嵌入,例如 OpenAI 文本嵌入-3-large(小型)。 默认值为 null,表示不截断。 |
属性详细信息
compressionName
要与此特定配置关联的名称。
compressionName: string
属性值
string
defaultOversampling
默认过度采样因子。 在初始搜索中,过度采样将在内部请求更多文档(由此乘数指定)。 这会增加使用全精度向量重新计算相似性分数重新计算的结果集。 最小值为 1,这意味着没有过度采样(1x)。 仅当 rerankWithOriginalVectors 为 true 时,才能设置此参数。 较高的值会以牺牲延迟为代价提高召回率。
defaultOversampling?: number
属性值
number
kind
多态鉴别器,它指定此对象可以的不同类型的
kind: "binaryQuantization" | "scalarQuantization"
属性值
"binaryQuantization" | "scalarQuantization"
rerankWithOriginalVectors
如果设置为 true,则获取使用压缩向量计算的有序结果集后,将通过重新计算全精度相似性分数来重新计算结果集。 这将提高召回率,代价是延迟。
rerankWithOriginalVectors?: boolean
属性值
boolean
rescoringOptions
truncationDimension
要截断向量到的维度数。 截断向量可减少向量的大小,以及搜索期间需要传输的数据量。 这可以节省存储成本,并降低搜索性能,以牺牲召回率。 它只应用于使用 Matryoshka 表示法学习(MRL)训练的嵌入,例如 OpenAI 文本嵌入-3-large(小型)。 默认值为 null,表示不截断。
truncationDimension?: number
属性值
number