Anteckning
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Det här innehållet gäller för:checkmarkv4.0 (GA)Föregående version:blue-checkmark v3.1 (GA) :::moniker-end
Det här innehållet gäller för:
BockmarkeringSenaste version: | purple-checkmarkv4.0 (GA)
Kontraktsmodellen för dokumentinformation använder kraftfulla OCR-funktioner (Optisk teckenigenkänning) för att analysera och extrahera nyckelfält och radobjekt från en utvald grupp med viktiga kontraktentiteter. Kontrakt kan ha olika format och kvalitet, inklusive telefonbilder, skannade dokument och digitala PDF-filer. API:et analyserar dokumenttext; extraherar viktig information såsom parter, jurisdiktioner, kontrakts-ID och titel; och returnerar en strukturerad JSON-datarepresentation. Modellen stöder för närvarande engelskspråkiga dokumentformat.
Automatiserad kontraktsbearbetning
Automatiserad kontraktsbearbetning är processen för att extrahera viktiga kontraktfält från dokument. Tidigare har kontraktanalysprocessen uppnåtts manuellt och därmed mycket tidskrävande. Korrekt extrahering av viktiga data från kontrakt är vanligtvis det första och ett av de mest kritiska stegen i kontraktautomatiseringsprocessen.
Utvecklingsalternativ
Document Intelligence v4.0: 2024-11-30 (GA) stöder följande verktyg, program och bibliotek:
| Funktion | Resurser | Modell-ID |
|---|---|---|
| Kontraktsmodell | • Document Intelligence Studio• • • • • |
prebuilt-contract |
Document Intelligence v3.1 stöder följande verktyg, program och bibliotek:
| Funktion | Resurser | Modell-ID |
|---|---|---|
| Kontraktsmodell | • Document Intelligence Studio• • • • • |
prebuilt-contract |
Document Intelligence v3.0 stöder följande verktyg, program och bibliotek:
| Funktion | Resurser | Modell-ID |
|---|---|---|
| Kontraktsmodell | • Document Intelligence Studio• • • • • |
prebuilt-contract |
Indatakrav
Följande filformat stöds.
| Modell | Bild: JPEG/JPG, PNG, BMP, TIFF, HEIF |
Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML |
|
|---|---|---|---|
| Lästa | ✔ | ✔ | ✔ |
| Layout | ✔ | ✔ | ✔ |
| Allmänt dokument | ✔ | ✔ | |
| Inbyggda | ✔ | ✔ | |
| Anpassad extrahering | ✔ | ✔ | |
| Anpassad klassificering | ✔ | ✔ | ✔ |
- Foton och genomsökningar: För bästa resultat, ge ett tydligt foto eller högkvalitativ genomsökning per dokument.
- PDF-filer och TIFF:er: För PDF-filer och TIFF:er kan upp till 2 000 sidor bearbetas. (Med en prenumeration på den kostnadsfria nivån bearbetas endast de två första sidorna.)
- Filstorlek: Filstorleken för att analysera dokument är 500 MB för den betalda nivån (S0) och 4 MB för den kostnadsfria nivån (F0).
- Bilddimensioner: Dimensionerna måste vara mellan 50 bildpunkter x 50 bildpunkter och 10 000 bildpunkter x 10 000 bildpunkter.
- Lösenordslås: Om dina PDF-filer är lösenordslåsta måste du ta bort låset innan det skickas in.
- Texthöjd: Den minsta höjden på texten som ska extraheras är 12 bildpunkter för en bild på 1 024 x 768 bildpunkter. Den här dimensionen motsvarar cirka 8-punktstext vid 150 punkter per tum.
- Anpassad modellträning: Det maximala antalet sidor för träningsdata är 500 för den anpassade mallmodellen och 50 000 för den anpassade neurala modellen.
- Anpassad extraheringsmodellträning: Den totala storleken på träningsdata är 50 MB för mallmodellen och 1 GB för den neurala modellen.
- Anpassad klassificeringsmodellträning: Den totala storleken på träningsdata är 1 GB med högst 10 000 sidor. För 2024-11-30 (GA) är den totala storleken på träningsdata 2 GB med högst 10 000 sidor.
- Office-filtyper (DOCX, XLSX, PPTX): Den maximala stränglängdsgränsen är 8 miljoner tecken.
Prova extrahering av kontraktsdokumentdata
Se hur data, inklusive kundinformation, leverantörsinformation och radobjekt, extraheras från kontrakt. Du behöver följande resurser:
En Azure-prenumeration – du kan skapa en kostnadsfritt.
En instans av dokumentinformation i Azure Portal. Du kan använda den kostnadsfria prisnivån (
F0) för att prova tjänsten. När resursen har distribuerats väljer du Gå till resurs för att hämta din nyckel och slutpunkt.
Document Intelligence Studio
På startsidan för Document Intelligence Studio väljer du Skattedokument.
Du kan analysera exempelskattedokumenten eller ladda upp dina egna filer.
Välj knappen Kör analys och konfigurera vid behov alternativen Analysera:
Språk och nationella inställningar som stöds
En fullständig lista över språk som stöds finns på sidan Språkstöd – fördefinierade modeller.
Fältextrahering
Information om vilka dokumentextraheringsfält som stöds finns på schemasidan för kontraktsmodell i vår GitHub-exempellagringsplats.
Kontraktnyckel/värde-par och radobjekt som extraheras finns i
documentResultsavsnittet i JSON-utdata.
Nästa steg
Prova att bearbeta dina egna formulär och dokument med Document Intelligence Studio.
Slutför en snabbstart för dokumentinformation och kom igång med att skapa en app för dokumentbearbetning på valfritt utvecklingsspråk.