Dela via


Använda ai.extract med Pandas

Funktionen ai.extract använder generativ AI för att skanna indatatext och extrahera specifika typer av information som du väljer (till exempel platser eller namn). Den använder bara en enda kodrad.

Anmärkning

Översikt

Klassen ai.extract utökas av funktionen . Om du vill extrahera anpassade entitetstyper från varje rad med indata anropar du funktionen i en pandas DataFrame-textkolumn .

Till skillnad från andra AI-funktioner returnerar ai.extract en Pandas DataFrame, i stället för en serie, med en separat kolumn för varje angiven entitetstyp som innehåller extraherade värden för varje indatarad.

Syntax

df_entities = df["text"].ai.extract("entity1", "entity2", "entity3")

Parameterar

Namn Description
labels
Krävs
En eller flera strängar som representerar uppsättningen entitetstyper som ska extraheras från indatatextvärdena.

Retur

Funktionen returnerar en Pandas DataFrame- med en kolumn för varje angiven entitetstyp. Kolumnen eller kolumnerna innehåller de entiteter som extraheras för varje rad med indatatext. Om funktionen identifierar mer än en matchning för en entitet returnerar den bara en av dessa matchningar. Om ingen matchning hittas blir resultatet null.

Example

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/.

df = pd.DataFrame([
        "MJ Lee lives in Tuscon, AZ, and works as a software engineer for Microsoft.",
        "Kris Turner, a nurse at NYU Langone, is a resident of Jersey City, New Jersey."
    ], columns=["descriptions"])

df_entities = df["descriptions"].ai.extract("name", "profession", "city")
display(df_entities)

Den här exempelkodcellen innehåller följande utdata:

Skärmbild som visar en ny dataram med kolumnerna