Transformera och berika data med AI-funktioner (förhandsversion)

2025-10-31

Important

Den här funktionen är i förhandsversion.

Med Microsoft Fabric AI Functions kan alla affärsproffs (från utvecklare till analytiker) transformera och utöka sina företagsdata med generativ AI.

AI-funktioner använder branschledande stora språkmodeller (LLM) för sammanfattning, klassificering, textgenerering med mera. Med en enda kodrad kan du:

ai.analyze_sentiment: Identifiera det känslomässiga tillståndet för indatatext.
ai.classify: Kategorisera indatatext enligt dina etiketter.
ai.extract: Extrahera specifika typer av information från indatatext (till exempel platser eller namn).
ai.fix_grammar: Korrigera stavning, grammatik och skiljetecken för indatatext.
ai.generate_response: Generera svar baserat på dina egna instruktioner.
ai.similarity: Jämför innebörden av indatatext med ett enda textvärde eller med text i en annan kolumn.
ai.summarize: Hämta sammanfattningar av indatatext.
ai.translate: Översätta indatatext till ett annat språk.

Du kan införliva dessa funktioner som en del av arbetsflöden för datavetenskap och datateknik, oavsett om du arbetar med Pandas eller Spark. Det finns ingen detaljerad konfiguration och ingen komplex infrastrukturhantering. Du behöver ingen specifik teknisk expertis.

Prerequisites

Om du vill använda AI-funktioner med den inbyggda AI-slutpunkten i Fabric måste administratören aktivera klientväxeln för Copilot och andra funktioner som drivs av Azure OpenAI.
Beroende på din plats kan du behöva aktivera en klientinställning för cross-geo-bearbetning. Läs mer om tillgängliga regioner för Azure OpenAI Service.
Du behöver en betald Fabric-kapacitet (F2 eller högre, eller någon P-version).

Note

AI-funktioner stöds i Fabric Runtime 1.3 och senare.
Om du inte konfigurerar en annan modell är AI-funktioner som standard gpt-4.1-mini. Läs mer om fakturerings- och förbrukningspriser.
Även om den underliggande modellen kan hantera flera språk är de flesta AI-funktionerna optimerade för användning på engelskspråkiga texter."

Komma igång med AI-funktioner

AI-funktioner kan användas med pandas (Python- och PySpark-körningar) samt med PySpark (PySpark-körning). De nödvändiga installations- och importstegen för var och en beskrivs i följande avsnitt följt av motsvarande kommandon.

Installera beroenden

Pandas (Python-körningsmiljö)
- synapseml_internal och synapseml_core krävs installation av whl-filer (kommandon anges i följande kodcell)
- openai paketinstallation krävs (kommandot anges i följande kodcell)
Pandas (PySpark-körtid)
- openai paketinstallation krävs (kommandot anges i följande kodcell)
PySpark (PySpark runtime)
- Ingen installation krävs

pandas (PySpark runtime)
pandas (Python runtime)

# The pandas AI functions package requires OpenAI version 1.99.5 or later
%pip install -q --force-reinstall openai==1.99.5 2>/dev/null

# Install latest versions of AI functions library whl
!wget -q https://aka.ms/fabric-aifunctions-whl -O synapseml_internal-latest-py3-none-any.whl
!wget -q https://aka.ms/fabric-synapseml-core-whl -O synapseml_core-latest-py3-none-any.whl

# The pandas AI functions package requires OpenAI version 1.99.5 or later
%pip install -q --force-reinstall openai==1.99.5 synapseml_internal-latest-py3-none-any.whl synapseml_core-latest-py3-none-any.whl

Importera nödvändiga bibliotek

Följande kodcell importerar AI-funktionsbiblioteket och dess beroenden.

pandas
PySpark

# Required imports
import synapse.ml.aifunc as aifunc
import pandas as pd

import synapse.ml.spark.aifunc as aifunc

# SparkSession with accessor `spark` in PySpark environments is pre-setup and available for use

Använda AI-funktioner

Med var och en av följande funktioner kan du anropa den inbyggda AI-slutpunkten i Fabric för att transformera och berika data med en enda kodrad. Du kan använda AI-funktioner för att analysera Pandas DataFrames eller Spark DataFrames.

Tip

Lär dig hur du anpassar konfigurationen av AI-funktioner.

Identifiera sentiment med ai.analyze_sentiment

Funktionen ai.analyze_sentiment anropar AI för att identifiera om det känslomässiga tillstånd som uttrycks av indatatext är positivt, negativt, blandat eller neutralt. Om AI inte kan göra den här bedömningen lämnas utdata tomma. Mer detaljerade anvisningar om hur du använder ai.analyze_sentiment med Pandas finns i den här artikeln. För ai.analyze_sentiment med PySpark, se den här artikeln.

pandas
PySpark

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/.

df = pd.DataFrame([
        "The cleaning spray permanently stained my beautiful kitchen counter. Never again!",
        "I used this sunscreen on my vacation to Florida, and I didn't get burned at all. Would recommend.",
        "I'm torn about this speaker system. The sound was high quality, though it didn't connect to my roommate's phone.",
        "The umbrella is OK, I guess."
    ], columns=["reviews"])

df["sentiment"] = df["reviews"].ai.analyze_sentiment()
display(df)

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/.

df = spark.createDataFrame([
        ("The cleaning spray permanently stained my beautiful kitchen counter. Never again!",),
        ("I used this sunscreen on my vacation to Florida, and I didn't get burned at all. Would recommend.",),
        ("I'm torn about this speaker system. The sound was high quality, though it didn't connect to my roommate's phone.",),
        ("The umbrella is OK, I guess.",)
    ], ["reviews"])

sentiment = df.ai.analyze_sentiment(input_col="reviews", output_col="sentiment")
display(sentiment)

Kategorisera text med ai.classify

Funktionen ai.classify anropar AI för att kategorisera indatatext enligt anpassade etiketter som du väljer. Mer information om användningen av ai.classify med Pandas finns i den här artikeln. För ai.classify med PySpark, se den här artikeln.

pandas
PySpark

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/.

df = pd.DataFrame([
        "This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",
        "Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",
        "Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!"
    ], columns=["descriptions"])

df["category"] = df['descriptions'].ai.classify("kitchen", "bedroom", "garage", "other")
display(df)

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/.

df = spark.createDataFrame([
        ("This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",),
        ("Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",),
        ("Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!",)
    ], ["descriptions"])
    
categories = df.ai.classify(labels=["kitchen", "bedroom", "garage", "other"], input_col="descriptions", output_col="categories")
display(categories)

Extrahera entiteter med ai.extract

Funktionen ai.extract anropar AI för att skanna indatatext och extrahera specifika typer av information som anges av etiketter som du väljer (till exempel platser eller namn). Mer detaljerade anvisningar om hur du använder ai.extract med Pandas finns i den här artikeln. För ai.extract med PySpark, se den här artikeln.

pandas
PySpark

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/.

df = pd.DataFrame([
        "MJ Lee lives in Tucson, AZ, and works as a software engineer for Microsoft.",
        "Kris Turner, a nurse at NYU Langone, is a resident of Jersey City, New Jersey."
    ], columns=["descriptions"])

df_entities = df["descriptions"].ai.extract("name", "profession", "city")
display(df_entities)

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/.

df = spark.createDataFrame([
        ("MJ Lee lives in Tucson, AZ, and works as a software engineer for Microsoft.",),
        ("Kris Turner, a nurse at NYU Langone, is a resident of Jersey City, New Jersey.",)
    ], ["descriptions"])

df_entities = df.ai.extract(labels=["name", "profession", "city"], input_col="descriptions")
display(df_entities)

Åtgärda grammatik med ai.fix_grammar

Funktionen ai.fix_grammar anropar AI för att korrigera stavning, grammatik och skiljetecken för indatatext. Mer detaljerade anvisningar om hur du använder ai.fix_grammar med Pandas finns i den här artikeln. För ai.fix_grammar med PySpark, se den här artikeln.

pandas
PySpark

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/.

df = pd.DataFrame([
        "There are an error here.",
        "She and me go weigh back. We used to hang out every weeks.",
        "The big picture are right, but you're details is all wrong."
    ], columns=["text"])

df["corrections"] = df["text"].ai.fix_grammar()
display(df)

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/.

df = spark.createDataFrame([
        ("There are an error here.",),
        ("She and me go weigh back. We used to hang out every weeks.",),
        ("The big picture are right, but you're details is all wrong.",)
    ], ["text"])

corrections = df.ai.fix_grammar(input_col="text", output_col="corrections")
display(corrections)

Svara på anpassade användarprompter med ai.generate_response

Funktionen ai.generate_response anropar AI för att generera anpassad text baserat på dina egna instruktioner. Mer detaljerade anvisningar om hur du använder ai.generate_response med Pandas finns i den här artikeln. För ai.generate_response med PySpark, se den här artikeln.

pandas
PySpark

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/.

df = pd.DataFrame([
        ("Scarves"),
        ("Snow pants"),
        ("Ski goggles")
    ], columns=["product"])

df["response"] = df.ai.generate_response("Write a short, punchy email subject line for a winter sale.")
display(df)

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/.

df = spark.createDataFrame([
        ("Scarves",),
        ("Snow pants",),
        ("Ski goggles",)
    ], ["product"])

responses = df.ai.generate_response(prompt="Write a short, punchy email subject line for a winter sale.", output_col="response")
display(responses)

Beräkna likhet med ai.similarity

Funktionen ai.similarity jämför varje indatatextvärde med en gemensam referenstext eller motsvarande värde i en annan kolumn (parvis läge). Utdatalikhetspoängvärdena är relativa och kan variera från -1 (motsatser) till 1 (identiska). 0 Poängen indikerar att värdena inte har någon betydelse. Mer detaljerade anvisningar om hur du använder ai.similarity med Pandas finns i den här artikeln. För ai.similarity med PySpark, se den här artikeln.

pandas
PySpark

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/.

df = pd.DataFrame([ 
        ("Bill Gates", "Technology"), 
        ("Satya Nadella", "Healthcare"), 
        ("Joan of Arc", "Agriculture") 
    ], columns=["names", "industries"])
    
df["similarity"] = df["names"].ai.similarity(df["industries"])
display(df)

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/.

df = spark.createDataFrame([
        ("Bill Gates", "Technology"), 
        ("Satya Nadella", "Healthcare"), 
        ("Joan of Arc", "Agriculture")
    ], ["names", "industries"])

similarity = df.ai.similarity(input_col="names", other_col="industries", output_col="similarity")
display(similarity)

Sammanfatta text med ai.summarize

Funktionen ai.summarize anropar AI för att generera sammanfattningar av indatatext (antingen värden från en enda kolumn i en DataFrame eller radvärden i alla kolumner). Mer detaljerade anvisningar om hur du använder ai.summarize med Pandas finns i den här artikeln. För ai.summarize med PySpark, se den här artikeln.

pandas
PySpark

# This code uses AI. Always review output for mistakes.
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/.

df= pd.DataFrame([
        ("Microsoft Teams", "2017",
        """
        The ultimate messaging app for your organization—a workspace for real-time 
        collaboration and communication, meetings, file and app sharing, and even the 
        occasional emoji! All in one place, all in the open, all accessible to everyone.
        """),
        ("Microsoft Fabric", "2023",
        """
        An enterprise-ready, end-to-end analytics platform that unifies data movement, 
        data processing, ingestion, transformation, and report building into a seamless, 
        user-friendly SaaS experience. Transform raw data into actionable insights.
        """)
    ], columns=["product", "release_year", "description"])

df["summaries"] = df["description"].ai.summarize()
display(df)

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/.

df = spark.createDataFrame([
        ("Microsoft Teams", "2017",
        """
        The ultimate messaging app for your organization—a workspace for real-time 
        collaboration and communication, meetings, file and app sharing, and even the 
        occasional emoji! All in one place, all in the open, all accessible to everyone.
        """,),
        ("Microsoft Fabric", "2023",
        """
        An enterprise-ready, end-to-end analytics platform that unifies data movement, 
        data processing, ingestion, transformation, and report building into a seamless, 
        user-friendly SaaS experience. Transform raw data into actionable insights.
        """,)
    ], ["product", "release_year", "description"])

summaries = df.ai.summarize(input_col="description", output_col="summary")
display(summaries)

Översätta text med ai.translate

Funktionen ai.translate anropar AI för att översätta indatatext till ett nytt valfritt språk. Mer detaljerade anvisningar om hur du använder ai.translate med Pandas finns i den här artikeln. För ai.translate med PySpark, se den här artikeln.

pandas
PySpark

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/.

df = pd.DataFrame([
        "Hello! How are you doing today?", 
        "Tell me what you'd like to know, and I'll do my best to help.", 
        "The only thing we have to fear is fear itself."
    ], columns=["text"])

df["translations"] = df["text"].ai.translate("spanish")
display(df)

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/.

df = spark.createDataFrame([
        ("Hello! How are you doing today?",),
        ("Tell me what you'd like to know, and I'll do my best to help.",),
        ("The only thing we have to fear is fear itself.",),
    ], ["text"])

translations = df.ai.translate(to_lang="spanish", input_col="text", output_col="translations")
display(translations)

Identifiera sentiment med ai.analyze_sentiment in pandas eller ai.analyze_sentiment in pyspark.
Kategorisera text med ai.classify in pandas eller ai.classify in PySpark.
Extrahera entiteter med ai.extract in pandas eller ai.extract in PySpark.
Korrigera grammatik med ai.fix_grammar in pandas eller ai.fix_grammar in PySpark.
Svara på anpassade användarprompter med ai.generate_response in pandas eller ai.generate_response in PySpark.
Beräkna likhet med ai.similarity in pandas eller ai.similarity in PySpark.
Sammanfatta text med ai.summarize in pandas eller ai.summarize in PySpark.
Översätta text med ai.translate in pandas eller ai.translate in PySpark.
Anpassa konfigurationen av AI-funktioner i Pandas eller konfigurationen av AI-funktioner i PySpark .
Missade vi en funktion som du behöver? Föreslå det på forumet Fabric Ideas.

Feedback

Var den här sidan till hjälp?