Vektorlager i Azure Cosmos DB för MongoDB vCore

2025-09-17
Gäller för: ✅ MongoDB vCore

Använd den integrerade vektordatabasen i Azure Cosmos DB for MongoDB (vCore) för att sömlöst ansluta AI-baserade program till dina data som lagras i Azure Cosmos DB. Den här integreringen kan omfatta appar som du har skapat med hjälp av Azure OpenAI-inbäddningar. Med den inbyggda integrerade vektordatabasen kan du effektivt lagra, indexera och köra frågor mot högdimensionella vektordata som direkt lagras i Azure Cosmos DB för MongoDB (vCore), tillsammans med den ursprungliga data som vektordata skapas ifrån. Det eliminerar behovet av att överföra dina data till alternativa vektorlager och medför extra kostnader.

Vad är ett vektorlager?

Ett vektorlager eller en vektordatabas är en databas som är utformad för att lagra och hantera inbäddningar av vektorer, som är matematiska representationer av data i ett högdimensionellt utrymme. I det här utrymmet motsvarar varje dimension en funktion i data och tiotusentals dimensioner kan användas för att representera avancerade data. En vektors position i det här utrymmet representerar dess egenskaper. Ord, fraser eller hela dokument och bilder, ljud och andra typer av data kan alla vektoriseras.

Hur fungerar ett vektorlager?

I ett vektorlager används algoritmer för vektorsökning för att indexera och fråga inbäddningar. Några välkända vektorsökningsalgoritmer är HNSW (Hierarchical Navigable Small World), Inverted File (IVF) och DiskANN. Vektorsökning är en metod som hjälper dig att hitta liknande objekt baserat på deras dataegenskaper i stället för exakta matchningar i ett egenskapsfält. Den här tekniken är användbar i program som att söka efter liknande text, hitta relaterade bilder, göra rekommendationer eller till och med identifiera avvikelser. Den används för att fråga vektorinbäddningar (listor med siffror) för dina data som du skapade med hjälp av en maskininlärningsmodell med hjälp av ett INBÄDDNINGS-API. Exempel på inbäddnings-API:er är Azure OpenAI-inbäddningar eller Hugging Face på Azure. Vektorsökning mäter avståndet mellan datavektorerna och frågevektorn. De datavektorer som är närmast din frågevektor är de som är mest lika semantiskt.

I den integrerade vektordatabasen i Azure Cosmos DB for MongoDB (vCore) kan inbäddningar lagras, indexeras och efterfrågas tillsammans med de ursprungliga data. Den här metoden eliminerar den extra kostnaden för att replikera data i en separat ren vektordatabas. Dessutom håller den här arkitekturen samman vektorbäddningar och ursprungliga data, vilket bättre underlättar multimodala dataåtgärder och ger bättre datakonsekvens, skalning och prestanda.

Utföra vektorlikhetssökning

Azure Cosmos DB for MongoDB (vCore) ger robusta vektorsökningsfunktioner, så att du kan utföra sökningar med höghastighetslikhet i komplexa datauppsättningar. Om du vill utföra vektorsökning i Azure Cosmos DB för MongoDB måste du först skapa ett vektorindex. Azure Cosmos DB for MongoDB (vCore) erbjuder flera alternativ, men här är några allmänna riktlinjer som hjälper dig att komma igång baserat på storleken på din datauppsättning:

	IVF	HNSW	DiskANN (rekommenderas)
Beskrivning	Ett IVFFlat-index delar in vektorer i listor och söker sedan efter en delmängd närmast frågevektorn.	Ett HNSW-index skapar ett flerskiktsdiagram.	DiskANN är en ungefärlig algoritm för närliggande sökning som är utformad för effektiv vektorsökning i valfri skala.
Viktiga kompromisser	Proffsen: Snabbare byggtider, lägre minnesanvändning. Nackdelar: Lägre frågeprestanda (när det gäller hastighetsåterkallningsavvägning).	Fördelar: Bättre frågeprestanda (när det gäller avvägning mellan hastighet och återkallning) kan möjliggöras på en tom tabell. Nackdelar: Långsammare byggtider, högre minnesanvändning.	Fördelar: Effektiv i alla storlekar, hög återkallelse, högt dataflöde, låg svarstid.
Antal vektorer	Under 10 000	Upp till 50 000	Upp till 500 000+
Rekommenderad klusternivå	M10 eller M20	M30 och senare	M30 och senare

DiskANN-index är tillgängliga på M30- och högre nivåer. Om du vill skapa DiskANN-indexet anger du parametern "kind" enligt "vector-diskann" följande mall:

{ 
    "createIndexes": "<collection_name>",
    "indexes": [
        {
            "name": "<index_name>",
            "key": {
                "<path_to_property>": "cosmosSearch"
            },
            "cosmosSearchOptions": { 
                "kind": "vector-diskann", 
                "dimensions": <integer_value>,
                "similarity": <string_value>,
                "maxDegree" : <integer_value>, 
                "lBuild" : <integer_value>, 
            } 
        } 
    ] 
}

Fält	Typ	Beskrivning
`index_name`	sträng	Unikt namn på indexet.
`path_to_property`	sträng	Sökväg till egenskapen som innehåller vektorn. Den här sökvägen kan vara en egenskap på högsta nivån eller en pricknoteringssökväg till egenskapen. Vektorer måste vara en `number[]` som ska indexeras och användas i vektorsökningsresultat. Om du använder en annan typ, till exempel `double[]`, förhindras dokumentet från att indexeras. Icke-indexerade dokument returneras inte i resultatet av en vektorsökning.
`kind`	sträng	Typ av vektorindex som ska skapas. Alternativen är `vector-ivf`, `vector-hnsw`och `vector-diskann`.
`dimensions`	heltal	Antal dimensioner för vektorlikhet. DiskANN stöder upp till 16 000 dimensioner (med produktkvantisering), med framtida stöd planerat för 40 000+.
`similarity`	sträng	Likhetsmått att använda med indexet. Möjliga alternativ är `COS` (cosinusavstånd), `L2` (Euklidiska avstånd) och `IP` (inre produkt).
`maxDegree`	heltal	Maximalt antal kanter per nod i diagrammet. Den här parametern sträcker sig från 20 till 2048 (standardvärdet är 32). Högre `maxDegree` är lämpligt för datauppsättningar med höga krav på dimensionalitet och/eller hög noggrannhet.
`lBuild`	heltal	Anger antalet kandidatgrannarna som utvärderas under indexkonstruktionen i DiskANN. Den här parametern, som sträcker sig från 10 till 500 (standardvärdet är 50), balanserar noggrannhet och beräkningskostnader: högre värden förbättrar indexkvaliteten och noggrannheten men ökar byggtiden

Utföra en vektorsökning med DiskANN

Om du vill utföra en vektorsökning använder du $search sammansättningens pipelinesteg och frågar med operatorn cosmosSearch . DiskANN tillåter högpresterande sökningar över massiva datauppsättningar med valfri filtrering, till exempel geospatiala eller textbaserade filter.

{
  "$search": {
    "cosmosSearch": {
      "path": "<path_to_property>",
      "query": "<query_vector>",  
      "k": <num_results_to_return>,  
      "filter": {"$and": [
        { "<attribute_1>": { "$eq": <value> } },
        {"<location_attribute>": {"$geoWithin": {"$centerSphere":[[<longitude_integer_value>, <latitude_integer_value>], <radius>]}}}
      ]}
    }
  }
},

Fält	Typ	Beskrivning
`lSearch`	heltal	Anger storleken på den dynamiska kandidatlistan för sökning. Standardvärdet är 40, med ett konfigurerbart intervall från 10 till 1 000. Att öka värdet förbättrar återkallandet, men kan minska sökhastigheten.
`k`	heltal	Definierar antalet sökresultat som ska returneras. Värdet `k` måste vara mindre än eller lika med `lSearch`.

Exempel med ett DiskANN-index med filtrering

Lägga till vektorer i databasen

Om du vill använda vektorsökning med geospatiala filter lägger du till dokument som innehåller både vektorinbäddningar och platskoordinater. Du kan skapa inbäddningarna med hjälp av din egen modell, Azure OpenAI-inbäddningar eller ett API som Hugging Face på Azure.

from pymongo import MongoClient

client = MongoClient("<your_connection_string>")
db = client["test"]
collection = db["testCollection"]

documents = [
    {"name": "Eugenia Lopez", "bio": "CEO of AdventureWorks", "is_open": 1, "location": [-118.9865, 34.0145], "contentVector": [0.52, 0.20, 0.23]},
    {"name": "Cameron Baker", "bio": "CFO of AdventureWorks", "is_open": 1, "location": [-0.1278, 51.5074], "contentVector": [0.55, 0.89, 0.44]},
    {"name": "Jessie Irwin", "bio": "Director of Our Planet initiative", "is_open": 0, "location": [-118.9865, 33.9855], "contentVector": [0.13, 0.92, 0.85]},
    {"name": "Rory Nguyen", "bio": "President of Our Planet initiative", "is_open": 1, "location": [-119.0000, 33.9855], "contentVector": [0.91, 0.76, 0.83]}
]

collection.insert_many(documents)

Skapa ett DiskANN-vektorindex

I följande exempel visas hur du konfigurerar ett DiskANN-vektorindex med filtreringsfunktioner. Detta inkluderar att skapa vektorindexet för likhetssökning, lägga till dokument med vektor- och geospatiala egenskaper och indexeringsfält för mer filtrering.

db.command({
    "createIndexes": "testCollection",
    "indexes": [
        {
            "name": "DiskANNVectorIndex",
            "key": {
                "contentVector": "cosmosSearch"
            },
            "cosmosSearchOptions": {
                "kind": "vector-diskann",
                "dimensions": 3,
                "similarity": "COS",
                "maxDegree": 32,
                "lBuild": 64
            }
        },
        { 
            "name": "is_open",
            "key": { 
                "is_open": 1 
            }      
        },
        {
            "name": "locationIndex",
            "key": {
                "location": 1
            }
        }
    ]
})

Det här kommandot skapar ett DiskANN-vektorindex på contentVector fältet i exampleCollection, vilket möjliggör likhetssökningar. Den lägger också till:

Ett index för fältet is_open så att du kan filtrera resultat baserat på om företag är öppna.
Ett geospatialt index på fältet location för att filtrera efter geografisk närhet.

Utföra en vektorsökning

Om du vill hitta dokument med liknande vektorer inom en specifik geografisk radie anger du queryVector för likhetssökning och inkluderar ett geospatialt filter.

query_vector = [0.52, 0.28, 0.12]
pipeline = [
    {
        "$search": {
            "cosmosSearch": {
                "path": "contentVector",
                "vector": query_vector,
                "k": 5,
                "filter": {
                    "$and": [
                        {"is_open": {"$eq": 1}},
                        {"location": {"$geoWithin": {"$centerSphere": [[-119.7192861804, 34.4102485028], 100 / 3963.2]}}}
                    ]
                }
            }
        }
    }
]

results = list(collection.aggregate(pipeline))
for result in results:
    print(result)

I det här exemplet returnerar vektorlikhetssökningen de översta k närmaste vektorerna baserat på det angivna COS likhetsmåttet, samtidigt som resultaten filtreras så att de endast omfattar öppna företag inom en radie på 100 mil.

[
  {
    similarityScore: 0.9745354109084544,
    document: {
      _id: ObjectId("645acb54413be5502badff94"),
      name: 'Eugenia Lopez',
      bio: 'CEO of AdventureWorks',
      is_open: 1,
      location: [-118.9865, 34.0145],
      contentVector: [0.52, 0.20, 0.23]
    }
  },
  {
    similarityScore: 0.9006955671333992,
    document: {
      _id: ObjectId("645acb54413be5502badff97"),
      name: 'Rory Nguyen',
      bio: 'President of Our Planet initiative',
      is_open: 1,
      location: [-119.7302, 34.4005],
      contentVector: [0.91, 0.76, 0.83]
    }
  }
]

Det här resultatet visar de vanligaste liknande dokumenten som queryVector, begränsade till en radie på 160 mil och öppna företag. Varje resultat innehåller likhetspoäng och metadata som visar hur DiskANN i Cosmos DB för MongoDB stöder kombinerade vektor- och geospatiala frågor för berikade, platskänsliga sökupplevelser.

Du kan skapa HNSW-index på M30- och högre klusternivåer. Om du vill skapa HSNW-indexet måste du skapa ett vektorindex med parametern "kind" inställd på följande "vector-hnsw" mall:

{ 
    "createIndexes": "<collection_name>",
    "indexes": [
        {
            "name": "<index_name>",
            "key": {
                "<path_to_property>": "cosmosSearch"
            },
            "cosmosSearchOptions": { 
                "kind": "vector-hnsw", 
                "m": <integer_value>, 
                "efConstruction": <integer_value>, 
                "similarity": "<string_value>", 
                "dimensions": <integer_value> 
            } 
        } 
    ] 
}

Fält	Typ	Beskrivning
`m`	heltal	Det maximala antalet anslutningar per lager (16 som standard är minimivärdet 2, maxvärdet är 100). Högre m lämpar sig för datamängder med hög dimensionalitet och/eller höga noggrannhetskrav.
`efConstruction`	heltal	storleken på den dynamiska kandidatlistan för att konstruera grafen (64 som standard är minimivärdet 4, maxvärdet är 1 000). Högre `efConstruction` resultat ger bättre indexkvalitet och högre noggrannhet, men det ökar också den tid som krävs för att skapa indexet. `efConstruction` måste vara minst `2 * m`

Utföra en vektorsökning med HNSW

Om du vill utföra en vektorsökning använder du $search aggregeringspipelinesteget och operatorn cosmosSearch .

{
    "$search": {
        "cosmosSearch": {
            "vector": <query_vector>,
            "path": "<path_to_property>",
            "k": <num_results_to_return>,
            "efSearch": <integer_value>
        },
    }
}

Fält	Typ	Beskrivning
`efSearch`	heltal	Storleken på den dynamiska kandidatlistan för sökning (40 som standard). Ett högre värde ger bättre träffsäkerhet på bekostnad av hastigheten.

Anteckning

Om du skapar ett HSNW-index med stora datamängder kan det leda till att din Azure Cosmos DB for MongoDB vCore-resurs får slut på minne eller kan begränsa prestandan för andra åtgärder som körs i databasen. Om du stöter på sådana problem kan du minimera dessa genom att skala resursen till en högre klusternivå eller skapa ett nytt DiskANN-vektorindex.

Exempel med ett HNSW-index

I följande exempel visas hur du indexar vektorer, lägger till dokument som har vektoregenskaper, utför en vektorsökning och hämtar indexkonfigurationen.

use test;

db.createCollection("exampleCollection");

db.runCommand({ 
    "createIndexes": "exampleCollection",
    "indexes": [
        {
            "name": "VectorSearchIndex",
            "key": {
                "contentVector": "cosmosSearch"
            },
            "cosmosSearchOptions": { 
                "kind": "vector-hnsw", 
                "m": 16, 
                "efConstruction": 64, 
                "similarity": "COS", 
                "dimensions": 3
            } 
        } 
    ] 
});

Det här kommandot skapar ett HNSW-index mot contentVector egenskapen i dokumenten som lagras i den angivna samlingen, exampleCollection. Egenskapen cosmosSearchOptions anger parametrarna för HNSW-vektorindexet. Om ditt dokument har vektorn lagrad i en kapslad egenskap kan du ange denna egenskap med hjälp av punktnotation. Du kan till exempel använda text.contentVector om contentVector är en undereproperty av text.

Lägga till vektorer i databasen

Om du vill lägga till vektorer i databasens samling måste du först skapa inbäddningarna med hjälp av din egen modell, Azure OpenAI-inbäddningar eller ett API som Hugging Face on Azure. I det här exemplet läggs nya dokument till via exempelinbäddningar:

db.exampleCollection.insertMany([
  {name: "Eugenia Lopez", bio: "Eugenia is the CEO of AdvenureWorks.", contentVector: [0.51, 0.12, 0.23]},
  {name: "Cameron Baker", bio: "Cameron Baker CFO of AdvenureWorks.", contentVector: [0.55, 0.89, 0.44]},
  {name: "Jessie Irwin", bio: "Jessie Irwin is the former CEO of AdventureWorks and now the director of the Our Planet initiative.", contentVector: [0.13, 0.92, 0.85]},
  {name: "Rory Nguyen", bio: "Rory Nguyen is the founder of AdventureWorks and the president of the Our Planet initiative.", contentVector: [0.91, 0.76, 0.83]},
]);

Utföra en vektorsökning

Om du fortsätter med det sista exemplet skapar du en annan vektor, queryVector. Vektorsökning mäter avståndet mellan queryVector och vektorerna i contentVector-banan av dina dokument. Du kan ange antalet resultat som sökningen returnerar genom att ange parametern k, som är inställd på 2 här. Du kan också ange efSearch, vilket är ett heltal som styr storleken på kandidatvektorlistan. Ett högre värde kan förbättra noggrannheten, men sökningen är långsammare som ett resultat. Det här är en valfri parameter med standardvärdet 40.

const queryVector = [0.52, 0.28, 0.12];
db.exampleCollection.aggregate([
  {
    "$search": {
        "cosmosSearch": {
            "vector": queryVector,
            "path": "contentVector",
            "k": 2,
            "efSearch": 40
        },
    }
  }
}
]);

I det här exemplet utförs en vektorsökning genom att använda queryVector som indata via Mongo-kommandoraden. Sökresultatet är en lista över två objekt som mest liknar frågevektorn, sorterade efter deras likhetspoäng.

[
  {
    similarityScore: 0.9465376,
    document: {
      _id: ObjectId("645acb54413be5502badff94"),
      name: 'Eugenia Lopez',
      bio: 'Eugenia is the CEO of AdvenureWorks.',
      vectorContent: [ 0.51, 0.12, 0.23 ]
    }
  },
  {
    similarityScore: 0.9006955,
    document: {
      _id: ObjectId("645acb54413be5502badff97"),
      name: 'Rory Nguyen',
      bio: 'Rory Nguyen is the founder of AdventureWorks and the president of the Our Planet initiative.',
      vectorContent: [ 0.91, 0.76, 0.83 ]
    }
  }
]

Om du vill skapa ett vektorindex med IVF-algoritmen använder du följande createIndexes mall och anger parametern "kind" till "vector-ivf":

{
  "createIndexes": "<collection_name>",
  "indexes": [
    {
      "name": "<index_name>",
      "key": {
        "<path_to_property>": "cosmosSearch"
      },
      "cosmosSearchOptions": {
        "kind": "vector-ivf",
        "numLists": <integer_value>,
        "similarity": "<string_value>",
        "dimensions": <integer_value>
      }
    }
  ]
}

Fält	Typ	Beskrivning
`numLists`	heltal	Det här heltalet är antalet kluster som IVF-indexet använder för att gruppera vektordata. Vi rekommenderar att `numLists` sätts till `documentCount/1000` för upp till 1 miljon dokument och att det sätts till `sqrt(documentCount)` för mer än 1 miljon dokument. Att använda värdet `numLists` 1 liknar att utföra brute-force-sökning, som har begränsad prestanda.

Viktigt!

Det är viktigt att ställa in parametern numLists korrekt för att uppnå god noggrannhet och prestanda. Vi rekommenderar att det numLists är inställt på documentCount/1000 för upp till 1 miljon dokument. För mer än 1 miljon dokument rekommenderar vi att du använder DiskANN-vektorindex för optimala resultat.

När antalet objekt i databasen växer bör du justera numLists till större för att uppnå bra svarstidsprestanda för vektorsökning.

Om du experimenterar med ett nytt scenario eller skapar en liten demo kan du börja med numLists inställt på 1 för att utföra en brute-force-sökning över alla vektorer. Detta bör ge dig de mest exakta resultaten från vektorsökningen, men sökhastigheten och svarstiden är långsammare. Efter den första installationen bör du gå vidare och finjustera parametern numLists med hjälp av föregående vägledning.

Utföra en vektorsökning med IVF

Om du vill utföra en vektorsökning använder du aggregeringspipeline-stegen $search i en MongoDB-fråga. Använd den nya cosmosSearch operatorn om du vill använda indexetcosmosSearch.

{
  {
  "$search": {
    "cosmosSearch": {
        "vector": <query_vector>,
        "path": "<path_to_property>",
        "k": <num_results_to_return>,
      },
      "returnStoredSource": True }},
  {
    "$project": { "<custom_name_for_similarity_score>": {
           "$meta": "searchScore" },
            "document" : "$$ROOT"
        }
  }
}

Om du vill hämta likhetspoängen (searchScore) tillsammans med de dokument som hittas av vektorsökningen använder du operatorn $project för att inkludera searchScore och byta namn på den som <custom_name_for_similarity_score> i resultatet. Sedan projiceras dokumentet också som kapslat objekt. Observera att likhetspoängen beräknas med hjälp av måttet som definierats i vektorindexet.

Viktigt!

Vektorer måste vara en number[] som ska indexeras. Om du använder en annan typ, till exempel double[], förhindras dokumentet från att indexeras. Icke-indexerade dokument returneras inte i resultatet av en vektorsökning.

Exempel med ett IVF-index

Inverterad filindexering (IVF) är en metod som organiserar vektorer i kluster. Under en vektorsökning jämförs frågevektorn först med mitten av dessa kluster. Sökningen utförs sedan i klustret vars centrum ligger närmast frågevektorn.

Parametern numLists avgör hur många kluster som ska skapas. Ett enda kluster innebär att sökningen utförs mot alla vektorer i databasen, som liknar en brute-force- eller kNN-sökning. Den här inställningen ger högsta noggrannhet men också den högsta svarstiden.

numLists Att öka värdet resulterar i fler kluster som var och en innehåller färre vektorer. Om till exempel numLists=2innehåller varje kluster fler vektorer än om numLists=3, och så vidare. Färre vektorer per kluster påskyndar sökningen (kortare svarstid, högre frågor per sekund). Detta ökar dock sannolikheten för att den mest liknande vektorn i databasen saknas med frågevektorn. Detta beror på klustrings ofullständiga karaktär, där sökningen kan fokusera på ett kluster medan den faktiska "närmaste" vektorn finns i ett annat kluster.

Parametern nProbes styr antalet kluster som ska genomsökas. Som standard är den inställd på 1, vilket innebär att den endast söker i klustret med det centrum som är närmast frågevektorn. Genom att öka det här värdet kan sökningen täcka fler kluster, förbättra noggrannheten men också öka svarstiden (vilket minskar antalet frågor per sekund) när fler kluster och vektorer genomsöks.

I följande exempel visas hur du indexar vektorer, lägger till dokument som har vektoregenskaper, utför en vektorsökning och hämtar indexkonfigurationen.

Skapa ett vektorindex

use test;

db.createCollection("exampleCollection");

db.runCommand({
  createIndexes: 'exampleCollection',
  indexes: [
    {
      name: 'vectorSearchIndex',
      key: {
        "vectorContent": "cosmosSearch"
      },
      cosmosSearchOptions: {
        kind: 'vector-ivf',
        numLists: 3,
        similarity: 'COS',
        dimensions: 3
      }
    }
  ]
});

Det här kommandot skapar ett vector-ivf index mot vectorContent egenskapen i dokumenten som lagras i den angivna samlingen, exampleCollection. Egenskapen cosmosSearchOptions anger parametrarna för IVF-vektorindexet. Om ditt dokument har vektorn lagrad i en kapslad egenskap kan du ange denna egenskap med hjälp av punktnotation. Du kan till exempel använda text.vectorContent om vectorContent är en undereproperty av text.

Lägga till vektorer i databasen

db.exampleCollection.insertMany([
  {name: "Eugenia Lopez", bio: "Eugenia is the CEO of AdvenureWorks.", vectorContent: [0.51, 0.12, 0.23]},
  {name: "Cameron Baker", bio: "Cameron Baker CFO of AdvenureWorks.", vectorContent: [0.55, 0.89, 0.44]},
  {name: "Jessie Irwin", bio: "Jessie Irwin is the former CEO of AdventureWorks and now the director of the Our Planet initiative.", vectorContent: [0.13, 0.92, 0.85]},
  {name: "Rory Nguyen", bio: "Rory Nguyen is the founder of AdventureWorks and the president of the Our Planet initiative.", vectorContent: [0.91, 0.76, 0.83]},
]);

Utföra en vektorsökning

Om du vill utföra en vektorsökning använder du aggregeringspipeline-stegen $search i en MongoDB-fråga. Använd den nya cosmosSearch operatorn om du vill använda indexetcosmosSearch.

{
  {
  "$search": {
    "cosmosSearch": {
        "vector": <vector_to_search>,
        "path": "<path_to_property>",
        "k": <num_results_to_return>,
      },
      "returnStoredSource": True }},
  {
    "$project": { "<custom_name_for_similarity_score>": {
           "$meta": "searchScore" },
            "document" : "$$ROOT"
        }
  }
}

Frågevektorer och vektoravstånd (likhetspoäng) med hjälp av $search"

Om du fortsätter med det sista exemplet skapar du en annan vektor, queryVector. Vektorsökning mäter avståndet mellan queryVector och vektorerna i vectorContent-banan av dina dokument. Du kan ange antalet resultat som sökningen returnerar genom att ange parametern k, som är inställd på 2 här. Du kan också ange nProbes, vilket är ett heltal som styr antalet närliggande kluster som inspekteras i varje sökning. Ett högre värde kan förbättra noggrannheten, men sökningen är långsammare som ett resultat. Det här är en valfri parameter med standardvärdet 1 och får inte vara större än det numLists värde som anges i vektorindexet.

const queryVector = [0.52, 0.28, 0.12];
db.exampleCollection.aggregate([
  {
    $search: {
      "cosmosSearch": {
        "vector": queryVector,
        "path": "vectorContent",
        "k": 2
      },
    "returnStoredSource": true }},
  {
    "$project": { "similarityScore": {
           "$meta": "searchScore" },
            "document" : "$$ROOT"
        }
  }
]);

[
  {
    similarityScore: 0.9465376,
    document: {
      _id: ObjectId("645acb54413be5502badff94"),
      name: 'Eugenia Lopez',
      bio: 'Eugenia is the CEO of AdvenureWorks.',
      vectorContent: [ 0.51, 0.12, 0.23 ]
    }
  },
  {
    similarityScore: 0.9006955,
    document: {
      _id: ObjectId("645acb54413be5502badff97"),
      name: 'Rory Nguyen',
      bio: 'Rory Nguyen is the founder of AdventureWorks and the president of the Our Planet initiative.',
      vectorContent: [ 0.91, 0.76, 0.83 ]
    }
  }
]

Hämta definitioner för vektorindex

Om du vill hämta vektorindexdefinitionen från samlingen använder du listIndexes kommandot:

db.exampleCollection.getIndexes();

I det här exemplet vectorIndex returneras med alla cosmosSearch parametrar som användes för att skapa indexet:

[
  { v: 2, key: { _id: 1 }, name: '_id_', ns: 'test.exampleCollection' },
  {
    v: 2,
    key: { vectorContent: 'cosmosSearch' },
    name: 'vectorSearchIndex',
    cosmosSearch: {
      kind: <index_type>, // options are `vector-ivf`, `vector-hnsw`, and `vector-diskann`
      numLists: 3,
      similarity: 'COS',
      dimensions: 3
    },
    ns: 'test.exampleCollection'
  }
]

Filtrerad vektorsökning

Nu kan du köra vektorsökningar med valfritt frågefilter som stöds, till exempel $lt, $lte, $eq, $neq$gte, $gt, $in, $ninoch $regex.

Om du vill använda förfiltrering måste du först definiera ett standardindex för den egenskap som du tänker filtrera efter, utöver ditt vektorindex. Här är ett exempel på hur du skapar ett filterindex:

db.runCommand({
  "createIndexes": "<collection_name>",
  "indexes": [ {
    "key": {
      "<property_to_filter>": 1
    },
    "name": "<name_of_filter_index>"
  }
  ]
});

När filterindexet är på plats kan du införliva "filter" satsen direkt i vektorsökningsfrågan. Det här exemplet visar hur du filtrerar resultat där "title" egenskapens värde inte finns i den angivna listan:

db.exampleCollection.aggregate([
  {
    '$search': {
      "cosmosSearch": {
        "vector": "<query_vector>",
        "path": <path_to_vector>,
        "k": num_results,
        "filter": {<property_to_filter>: {"$nin": ["not in this text", "or this text"]}}
      },
      "returnStoredSource": True }},
  {'$project': { 'similarityScore': { '$meta': 'searchScore' }, 'document' : '$$ROOT' }
}
]);

Viktigt!

Om du vill optimera prestanda och noggrannhet för dina förfiltrerade vektorsökningar bör du överväga att justera vektorindexparametrarna. För DiskANN-index kan det ge bättre resultat att öka maxDegree eller lBuild. För HNSW-index kan du experimentera med högre värden för m, efConstructioneller efSearch förbättra prestandan. På samma sätt, för IVF-index , justering numLists eller nProbes kan leda till mer tillfredsställande resultat. Det är viktigt att testa din specifika konfiguration med dina data för att säkerställa att resultaten uppfyller dina krav. Dessa parametrar påverkar indexstrukturen och sökbeteendet, och optimala värden kan variera beroende på dina dataegenskaper och frågemönster.

Använda LLM-orkestreringsverktyg

Använda som vektordatabas med semantisk kernel

Använd semantisk kernel för att orkestrera din informationshämtning från Azure Cosmos DB för MongoDB vCore och din LLM. Mer information finns i GitHub-lagringsplatsen.

Använda som vektordatabas med LangChain

Använd LangChain för att samordna din informationshämtning från Azure Cosmos DB för MongoDB vCore och din LLM. Mer information finns i Azure Cosmos DB Mongo vCore.

Använda som en semantisk cache med LangChain

Använd LangChain och Azure Cosmos DB for MongoDB (vCore) för att orkestrera semantisk cachelagring med hjälp av tidigare inspelade LLM-svar som kan spara kostnader för LLM API och minska svarstiden. Mer information finns i Azure Cosmos DB Mongo vCore

Funktioner och begränsningar

Avståndsmått som stöds: L2 (Euklidiska), inre produkt och cosinus.
Indexeringsmetoder som stöds: IVFFLAT, HNSW och DiskANN.
Med DiskANN och produktkvantisering kan du indexisera vektorer upp till 16 000 dimensioner.
Om du använder HNSW eller IVF med halv precision kan du indexera vektorer upp till 4 000 dimensioner.
Utan komprimering är den maximala standardvektordimensionen för indexering 2 000.
Indexering gäller endast för en vektor per sökväg.
Endast ett index kan skapas per vektorsökväg.

Sammanfattning

Den här guiden visar hur du skapar ett vektorindex, lägger till dokument som har vektordata, utför en likhetssökning och hämtar indexdefinitionen. Med hjälp av vår integrerade vektordatabas kan du effektivt lagra, indexeras och köra frågor mot högdimensionella vektordata direkt i Azure Cosmos DB för MongoDB vCore. Det gör att du kan frigöra den fulla potentialen för dina data via vektorbäddningar, och det ger dig möjlighet att skapa mer exakta, effektiva och kraftfulla program.

Gå vidare

Skapa ett vCore-kluster med livstids kostnadsfri nivå för Azure Cosmos DB för MongoDB

Feedback

Var den här sidan till hjälp?

Dela via

Vektorlager i Azure Cosmos DB för MongoDB vCore

Vad är ett vektorlager?

Hur fungerar ett vektorlager?

Utföra vektorlikhetssökning

Utföra en vektorsökning med DiskANN

Exempel med ett DiskANN-index med filtrering

Lägga till vektorer i databasen

Skapa ett DiskANN-vektorindex

Utföra en vektorsökning

Hämta definitioner för vektorindex

Filtrerad vektorsökning

Använda LLM-orkestreringsverktyg

Använda som vektordatabas med semantisk kernel

Använda som vektordatabas med LangChain

Använda som en semantisk cache med LangChain

Funktioner och begränsningar

Sammanfattning

Relaterat innehåll

Gå vidare

Feedback

Ytterligare resurser