Dela via


Användningsfall för anpassad namngiven entitetsigenkänning

Viktigt!

Översättningar som inte är engelska tillhandahålls endast för enkelhetens skull. Se versionen EN-US av det här dokumentet för den slutgiltiga versionen.

Vad är en transparensanteckning?

Ett AI-system omfattar inte bara tekniken, utan även de personer som ska använda den, de personer som påverkas av den och miljön där den distribueras. Att skapa ett system som är lämpligt för sitt avsedda syfte kräver en förståelse för hur tekniken fungerar, dess funktioner och begränsningar och hur du uppnår bästa prestanda.

Microsoft tillhandahåller Transparensanteckningar som hjälper dig att förstå hur vår AI-teknik fungerar. Detta inkluderar de val systemägare kan göra som påverkar systemets prestanda och beteende, och vikten av att tänka på hela systemet, inklusive tekniken, människorna och miljön. Du kan använda Transparensanteckningar när du utvecklar eller distribuerar ditt eget system eller delar dem med de personer som kommer att använda eller påverkas av systemet.

Transparensanteckningar är en del av ett bredare arbete på Microsoft för att omsätta våra AI-principer i praktiken. Mer information finns i Microsoft AI-principer.

Introduktion till anpassad namngiven entitetsigenkänning

Anpassad namngiven entitetsigenkänning (anpassad NER) är en molnbaserad API-tjänst för informationsextrahering. Tjänsten tillämpar maskininlärningsinformation så att du kan skapa anpassade modeller för informationsextraheringsuppgifter.

Anpassad NER kan användas för att extrahera information från .txt filer. Ett finansinstitut kanske till exempel vill skapa ett automatiserat meddelandesystem för att påminna kunderna om deras förfallna betalningar. Organisationen använder anpassad NER för att extrahera relevant information från låneavtal, till exempel klientnamn, lånebelopp, ränta och betalningsdatum. Systemet kan bearbeta de extraherade entiteterna ytterligare för att skicka en påminnelse till klienten med nästa betalningsdatum och förfallna belopp.

Grunderna i anpassad namngiven entitetsigenkänning

Med anpassad namngiven entitetsigenkänning kan användarna skapa anpassade maskininlärningsmodeller för att extrahera domänspecifika entiteter från ostrukturerad text, till exempel kontrakt eller finansiella dokument.

Genom att skapa ett anpassat NER-projekt kan utvecklare iterativt tagga entiteter i data, träna, utvärdera och förbättra modellprestanda innan de gör dem tillgängliga för förbrukning. Kvaliteten på taggade data påverkar modellens prestanda avsevärt. För att förenkla skapandet och anpassningen av din modell erbjuder tjänsten en anpassad webbportal som kan nås via Language Studio.

Anpassad NER-terminologi

Följande termer används ofta med den här funktionen:

Begrepp Definition
Projekt Ett projekt är ett arbetsområde för att skapa dina anpassade ML-modeller baserat på dina data. Ditt projekt kan bara nås av dig och andra som har åtkomst till den Azure-resurs som används. I ett projekt kan du tagga entiteter i data, skapa modeller, utvärdera och förbättra modeller vid behov och så småningom distribuera en modell. Du kan ha flera modeller i projektet som bygger på samma datauppsättning.
Modell En modell är ett objekt som tränas att utföra en viss uppgift, i det här fallet anpassad entitetsigenkänning. Modeller tränas genom att tillhandahålla taggade data att lära av så att de senare kan användas för igenkänningsuppgifter.
Enhet En entitet är ett textintervall som anger en viss typ av information. Textintervallet kan bestå av ett eller flera ord. I omfånget för anpassad NER representerar entiteter den information som användaren vill extrahera från texten. Utvecklare taggar entiteter i sina data med de nödvändiga entiteterna innan de skickar dem till modellen för träning. Till exempel "Fakturanummer", "Startdatum", "Leveransnummer", "Födelseplats", "Ursprungsstad", "Leverantörsnamn" eller "Klientadress".

Exempel på användningsfall

Här följer några exempel på när du kan använda anpassad NER:

  • Kunskapsutvinning för att förbättra semantisk sökning: Sökningen är grundläggande för alla appar som visar textinnehåll för användarna. Vanliga scenarier är katalog- eller dokumentsökning, produktsökning i detaljhandeln eller kunskapsutvinning för datavetenskap. Många företag i olika branscher vill skapa en omfattande sökupplevelse över privat, heterogent innehåll, som innehåller både strukturerade och ostrukturerade dokument. Som en del av pipelinen kan utvecklare använda anpassad NER för att extrahera entiteter från texten som är relevanta för deras bransch. Dessa entiteter kan användas för att utöka indexeringen av filen för en mer anpassad sökupplevelse.

  • Extrahering av information från ostrukturerad text: Många finansiella och juridiska organisationer extraherar och normaliserar data från tusentals komplexa, ostrukturerade textkällor dagligen. Sådana källor omfattar bankutdrag, juridiska avtal eller bankformulär. Till exempel kan det ta flera dagar för mänskliga granskare att manuellt utvinna låneansökningsdata. Genom att automatisera de här stegen förenklas processen och kostnader, tid och arbete sparas.

  • Granskning och efterlevnad: I stället för att manuellt granska betydligt långa textfiler för granskning och tillämpning av principer kan IT-avdelningar i finansiella eller juridiska företag använda anpassad NER för att skapa automatiserade lösningar. De här lösningarna kan vara användbara för att tillämpa efterlevnadsprinciper och konfigurera nödvändiga affärsregler baserat på kunskapsutvinningspipelines som bearbetar strukturerat och ostrukturerat innehåll.

Att tänka på när du väljer ett användningsfall

Tänk på följande vägledning när du använder anpassad NER:

  • Undvik att använda anpassad NER för beslut som kan ha allvarliga negativa effekter. Undvik till exempel scenarier som inkluderar medicinsk diagnos eller hälsodiagnos baserat på extraherad information från en individs medicinska historikformulär eller debiterar en användares bankkonto baserat på extraherade värden. Dessutom är det lämpligt att inkludera mänsklig granskning av beslut som har potential för allvarliga effekter på individer.

  • Undvik att skapa anpassade entiteter som extraherar onödig eller känslig information. Undvik att extrahera känslig användarinformation om den inte krävs för ditt användningsfall. Om ditt scenario till exempel kräver att användarens stad och land extraheras skapar du entiteter som endast extraherar staden och landet från en användares adress i stället för att extrahera hela adressen

  • Juridiska och regelmässiga överväganden: Organisationer måste utvärdera potentiella specifika juridiska och regelmässiga skyldigheter när de använder AI-tjänster och lösningar, vilket kanske inte är lämpligt för användning i alla branscher eller scenarion. Dessutom är AI-tjänster eller lösningar inte utformade för och får inte användas på sätt som är förbjudna i tillämpliga användningsvillkor och relevanta uppförandekoder.

Nästa steg