Dela via


Så här använder du namngiven entitetsigenkänning (NER)

FUNKTIONEN NER kan utvärdera ostrukturerad text och extrahera namngivna entiteter från text i flera fördefinierade kategorier, till exempel person, plats, händelse, produkt och organisation.

Utvecklingsalternativ

Om du vill använda namngiven entitetsigenkänning skickar du ostrukturerad ostrukturerad text för analys och hanterar API-utdata i ditt program. Analysen utförs som den är, utan ytterligare anpassning till den modell som används för dina data. Det finns två sätt att använda namngiven entitetsigenkänning:

Utvecklingsalternativ beskrivning
Azure AI Foundry Azure AI Foundry är en webbaserad plattform där du kan använda namngiven entitetsigenkänning med textexempel med dina egna data när du registrerar dig. Mer information finns på Azure AI Foundry-webbplatsen eller Azure AI Foundry-dokumentationen.
REST API eller klientbibliotek (Azure SDK) Integrera namngiven entitetsigenkänning i dina program med hjälp av REST-API:et eller klientbiblioteket som är tillgängligt på flera olika språk. Mer information finns i snabbstarten för namngivna entitetsigenkänning.

Bestämma hur data ska bearbetas (valfritt)

Inmatningsspråk

När du skickar indatatext som ska bearbetas kan du ange vilket av de språk som stöds som de är skrivna i. Om du inte anger något språk är extrahering av nyckelfraser standardvärdet engelska. API:et kan returnera förskjutningar i svaret för att stödja olika flerspråkiga kodningar och emojikodningar.

Skicka in data

Analysen utförs när begäran har tagits emot. Att använda NER-funktionen synkront är utan tillstånd. Inga data lagras i ditt konto och resultatet returneras omedelbart i svaret.

När du använder den här funktionen asynkront är API-resultaten tillgängliga i 24 timmar från den tidpunkt då begäran matades in och anges i svaret. Efter den här tidsperioden rensas resultaten och är inte längre tillgängliga för hämtning.

API:et försöker identifiera de definierade entitetskategorierna för ett visst textspråk för indata.

Att få NER-resultat

När du får resultat från NER kan du strömma resultatet till ett program eller spara utdata till en fil i det lokala systemet. API-svaret innehåller identifierade entiteter, inklusive deras kategorier och underkategorier, samt konfidenspoäng.

Välj vilka entiteter som ska returneras

API:et försöker identifiera de definierade entitetstyperna och taggarna för ett visst textspråk för indata. Entitetstyperna och taggarna ersätter de kategorier och underkategorier som de äldre modellerna använder för att definiera entiteter för mer flexibilitet. Du kan också ange vilka entiteter som identifieras och returneras, använda valfria inclusionList och exclusionList parametrar med lämpliga entitetstyper. I följande exempel identifieras endast Location. Du kan ange en eller flera entitetstyper som ska returneras. Med tanke på den typ- och taggarhierarki som introducerades för den här versionen har du flexibiliteten att filtrera på olika kornighetsnivåer så här:

Inmatning:

Anteckning

I det här exemplet returneras endast entitetstypen "Plats" .

{
    "kind": "EntityRecognition",
    "parameters": 
    {
        "inclusionList" :
        [
            "Location"
        ]
    },
    "analysisInput":
    {
        "documents":
        [
            {
                "id":"1",
                "language": "en",
                "text": "We went to Contoso foodplace located at downtown Seattle last week for a dinner party, and we adore the spot! They provide marvelous food and they have a great menu. The chief cook happens to be the owner (I think his name is John Doe) and he is super nice, coming out of the kitchen and greeted us all. We enjoyed very much dining in the place! The pasta I ordered was tender and juicy, and the place was impeccably clean. You can even pre-order from their online menu at www.contosofoodplace.com, call 112-555-0176 or send email to order@contosofoodplace.com! The only complaint I have is the food didn't come fast enough. Overall I highly recommend it!"
            }
        ]
    }
}

Ovanstående exempel returnerar entiteter som faller under Location-entitetstypen, såsom GPE, Structural och Geological-taggade entiteter, så som det framgår av beskrivningen av entitetstyper och taggar. Vi kan också ytterligare filtrera de returnerade entiteterna genom att filtrera med någon av entitetstaggar för Location entitetstypen, till exempel filtrering över GPE tagg endast enligt beskrivningen:


    "parameters": 
    {
        "inclusionList" :
        [
            "GPE"
        ]
    }
    

Den här metoden returnerar endast de Location-entiteter som faller under taggen GPE och ignorerar alla andra entiteter som faller under typen Location men som är taggade med andra entitetstags som Structural eller Geological-taggade Location-entiteter. Vi kan också analysera våra resultat ytterligare med hjälp av parametern exclusionList . GPEtaggade entiteter kan taggas med följande taggar: City, State, CountryRegion, . Continent Vi kan till exempel exkludera Continent och CountryRegion taggar för vårt exempel:


    "parameters": 
    {
        "inclusionList" :
        [
            "GPE"
        ],
        "exclusionList": :
        [
            "Continent",
            "CountryRegion"
        ]
    }
    

Med hjälp av dessa parametrar kan vi framgångsrikt filtrera på endast Location entitetstyper, eftersom GPE entitetstaggen som ingår i parametern inclusionList tillhör Location typen. Sedan filtrerar vi endast på geopolitiska entiteter och exkluderar alla entiteter som taggats med Continent eller CountryRegion taggar.

Utdataattribut som stöds

För att ge användarna mer insikt i en entitets typer och ge ökad användbarhet stöder NER dessa attribut i utdata:

Namnet på attributet Typ Definition
type Sträng Den mest specifika typen av identifierad entitet.

Till exempel är "Seattle" en City, en GPE (geo politisk entitet) och en Location. Den mest detaljerade klassificeringen för "Seattle" är City. Typen är City för texten "Seattle".
tags Lista (taggar) En lista över taggobjekt som uttrycker tillhörigheten för den identifierade entiteten till en hierarki eller någon annan gruppering.

En tagg innehåller två fält:
- name: Ett unikt namn för taggen.
- confidenceScore: Den associerade konfidenspoängen för en tagg som sträcker sig från 0 till 1.

Detta unika 'tagName' används för att filtrera parametrarna inclusionList och exclusionList.
metadata Objekt Metadata är ett objekt som innehåller mer data om den identifierade entitetstypen. Den ändras baserat på fältet metadataKind.

Exempelresultat

Det här exempelutdata innehåller ett exempel på utdataattribut.

{ 
    "kind": "EntityRecognitionResults", 
    "results": { 
        "documents": [ 
            { 
                "id": "1", 
                "entities": [ 
                    { 
                        "text": "Microsoft", 
                        "category": "Organization", 
                        "type": "Organization", 
                        "offset": 0, 
                        "length": 9, 
                        "confidenceScore": 0.97, 
                        "tags": [ 
                            { 
                                "name": "Organization", 
                                "confidenceScore": 0.97 
                            } 
                        ] 
                    }, 
                    { 
                        "text": "One", 
                        "category": "Quantity", 
                        "type": "Number", 
                        "subcategory": "Number", 
                        "offset": 21, 
                        "length": 3, 
                        "confidenceScore": 0.9, 
                        "tags": [ 
                            { 
                                "name": "Number", 
                                "confidenceScore": 0.8 
                            }, 
                            { 
                                "name": "Quantity", 
                                "confidenceScore": 0.8 
                            }, 
                            { 
                                "name": "Numeric", 
                                "confidenceScore": 0.8 
                            } 
                        ], 
                        "metadata": { 
                            "metadataKind": "NumberMetadata", 
                            "numberKind": "Integer", 
                            "value": 1.0 
                        } 
                    } 
                ], 
                "warnings": [] 
            } 
        ], 
        "errors": [], 
        "modelVersion": "2023-09-01" 
    } 
} 

Ange NER-modellen

Som standard använder den här funktionen den senaste tillgängliga AI-modellen i din text. Du kan också konfigurera dina API-begäranden att använda en specifik modellversion.

Tjänst- och datagränser

Information om storleken och antalet begäranden som du kan skicka per minut och sekund finns i artikeln om tjänstbegränsningar .

Nästa steg

Översikt över namngiven entitetsigenkänning