Anteckning
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Funktionen ai.similarity använder generativ AI för att jämföra två stränguttryck och sedan beräkna en semantisk likhetspoäng. Den använder bara en enda kodrad. Du kan jämföra textvärden från en kolumn i en DataFrame med ett enda gemensamt textvärde eller med parvis textvärden i en annan kolumn.
Anmärkning
- Den här artikeln beskriver hur du använder ai.similarity med pandas. Mer information om hur du använder ai.similarity med PySpark finns i den här artikeln.
- Se andra AI-funktioner i den här översiktsartikeln.
- Lär dig hur du anpassar konfigurationen av AI-funktioner.
Översikt
Klassen ai.similarity utökas av funktionen .
Om du vill beräkna den semantiska likheten för varje indatarad för ett enda gemensamt textvärde anropar du funktionen i en pandas DataFrame-textkolumn . Funktionen kan också beräkna den semantiska likheten för varje rad för motsvarande parvis värden i en annan kolumn som har samma dimensioner som indatakolumnen.
Funktionen returnerar en Pandas-serie som innehåller likhetspoäng, som kan lagras i en ny DataFrame-kolumn.
Syntax
df["similarity"] = df["col1"].ai.similarity("value")
Parameterar
| Namn | Description |
|---|---|
other Krävs |
En sträng som innehåller antingen: – Ett enda gemensamt textvärde som används för att beräkna likhetspoäng för varje indatarad. – En annan Pandas-serie med samma dimensioner som indata. Den innehåller textvärden som ska användas för att beräkna parvis likhetspoäng för varje indatarad. |
Retur
Funktionen returnerar en Pandas-serie som innehåller likhetspoäng för varje textrad för indata. Utdatalikhetspoängen är relativa och används bäst för rangordning. Poängvärden kan variera från -1 (motsatser) till 1* (identiska). Ett poängvärde 0 för anger att värdena inte har någon betydelse.
Example
# This code uses AI. Always review output for mistakes.
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/.
df = pd.DataFrame([
("Bill Gates"),
("Satya Nadella"),
("Joan of Arc")
], columns=["name"])
df["similarity"] = df["name"].ai.similarity("Microsoft")
display(df)
Den här exempelkodcellen innehåller följande utdata:
Relaterat innehåll
Använd ai.similarity med PySpark.
Identifiera sentiment med ai.analyze_sentiment.
Kategorisera text med ai.classify.
Extrahera entiteter med ai_extract.
Åtgärda grammatik med ai.fix_grammar.
Svara på anpassade användarfrågor med ai.generate_response.
Sammanfatta text med ai.summarize.
Översätt text med ai.translate.
Läs mer om den fullständiga uppsättningen AI-funktioner.
Anpassa konfigurationen av AI-funktioner.
Missade vi en funktion som du behöver? Föreslå det på forumet Fabric Ideas.