Dela via


Modeller för dokumentbearbetning

Det här innehållet gäller för:bockmarkeringv4.0 (GA) | Tidigare versioner:blå bockmarkeringv3.1 (GA)blå bockmarkeringv3.0 (GA)blå bockmarkeringv2.1 (GA)

Det här innehållet gäller för:bockmarkeringv3.1 (GA) | Senaste version:lila bockmarkeringv4.0 (GA) | Tidigare versioner:blå bockmarkeringv3.0blå bockmarkeringv2.1

Det här innehållet gäller för:bockmarkeringv3.0 (GA) | Senaste versioner:lila bockmarkeringv4.0 (GA)lila bockmarkeringv3.1 | Föregående version:blå bockmarkeringv2.1

Det här innehållet gäller för:checkmarkBockmarkeringSenaste version: | blue-checkmarkv4.0 (GA)

Azure AI Document Intelligence stöder olika modeller som du kan använda för att lägga till intelligent dokumentbearbetning i dina appar och flöden. Du kan använda en fördefinierad domänspecifik modell eller träna en anpassad modell som är anpassad efter dina specifika affärsbehov och användningsfall. Du kan använda Dokumentinformation med REST-API:et eller Python-, C#-, Java- och JavaScript-klientbiblioteken.

Kommentar

Dokumentbearbetningsprojekt som omfattar finansiella data, skyddade hälsodata, personuppgifter eller mycket känsliga data kräver noggrann uppmärksamhet. Se till att uppfylla alla nationella/regionala och branschspecifika krav.

Översikt över modell

I följande tabell visas de allmänt tillgängliga modellerna (GA) för varje stabilt API.

Modelltyp Modell 2024-11-30 (GA) 2023-07-31 (GA) 2022-08-31 (GA) v2.1 (GA)
Modeller för dokumentanalys Läs ✔️ ✔️ ✔️ Inte tillgängliga
Modeller för dokumentanalys Layout ✔️ ✔️ ✔️ ✔️
Modeller för dokumentanalys Allmänt dokument** Stöds i
layoutmodell
✔️ ✔️ Inte tillgängliga
Inbyggda modeller Bankkontroll ✔️ Inte tillgängliga Inte tillgängliga Inte tillgängliga
Inbyggda modeller Kontoutdrag ✔️ Inte tillgängliga Inte tillgängliga Inte tillgängliga
Inbyggda modeller payStub ✔️ Inte tillgängliga Inte tillgängliga Inte tillgängliga
Inbyggda modeller Kontrakt ✔️ ✔️ Inte tillgängliga Inte tillgängliga
Inbyggda modeller Sjukförsäkringskort ✔️ ✔️ ✔️ Inte tillgängliga
Inbyggda modeller ID-dokument ✔️ ✔️ ✔️ ✔️
Inbyggda modeller Faktura ✔️ ✔️ ✔️ ✔️
Inbyggda modeller Kvitto ✔️ ✔️ ✔️ ✔️
Inbyggda modeller Enhetlig skatt i USA* ✔️ Inte tillgängliga Inte tillgängliga Inte tillgängliga
Inbyggda modeller US 1040 skatt* ✔️ ✔️ Inte tillgängliga Inte tillgängliga
Inbyggda modeller Us 1095 tax* ✔️ Inte tillgängliga Inte tillgängliga Inte tillgängliga
Inbyggda modeller Skatt för USA 1098* ✔️ Inte tillgängliga Inte tillgängliga Inte tillgängliga
Inbyggda modeller US 1099-skatt* ✔️ Inte tillgängliga Inte tillgängliga Inte tillgängliga
Inbyggda modeller US W2-skatt ✔️ ✔️ ✔️ Inte tillgängliga
Inbyggda modeller US W4-skatt ✔️ Inte tillgängliga Inte tillgängliga Inte tillgängliga
Inbyggda modeller AMERIKANSKA inteckning 1003 URLA ✔️ Inte tillgängliga Inte tillgängliga Inte tillgängliga
Inbyggda modeller Amerikanska inteckning 1004 URAR ✔️ Inte tillgängliga Inte tillgängliga Inte tillgängliga
Inbyggda modeller Amerikansk inteckning 1005 ✔️ Inte tillgängliga Inte tillgängliga Inte tillgängliga
Inbyggda modeller Amerikansk inteckning 1008 sammanfattning ✔️ Inte tillgängliga Inte tillgängliga Inte tillgängliga
Inbyggda modeller Information om stängning av amerikanska hypotekslån ✔️ Inte tillgängliga Inte tillgängliga Inte tillgängliga
Inbyggda modeller Vigselbevis ✔️ Inte tillgängliga Inte tillgängliga Inte tillgängliga
Inbyggda modeller Kreditkort ✔️ Inte tillgängliga Inte tillgängliga Inte tillgängliga
Inbyggda modeller Visitkort inaktuell ✔️ ✔️ ✔️
Anpassad klassificeringsmodell Anpassad klassificerare ✔️ ✔️ Inte tillgängliga Inte tillgängliga
Anpassad extraheringsmodell Anpassad neural ✔️ ✔️ ✔️ Inte tillgängliga
Anpassad extraheringsmodell Anpassad mall ✔️ ✔️ ✔️ ✔️
Anpassad extraheringsmodell Anpassad sammansatt ✔️ ✔️ ✔️ ✔️
Alla modeller Tilläggsfunktioner ✔️ ✔️ Inte tillgängliga Inte tillgängliga

* Innehåller undermodeller. Se modellspecifik information för varianter och undertyper som stöds.
** Alla funktioner för den allmänna dokumentmodellen är tillgängliga i layoutmodellen. Den allmänna modellen stöds inte längre.

Svarstid

Svarstiden är den tid det tar för en API-server att hantera och bearbeta en inkommande begäran och leverera det utgående svaret till klienten. Tiden för att analysera ett dokument beror på storleken (till exempel antalet sidor) och de associerade innehållet på varje sida. Dokumentinformation är en asynkron tjänst med flera klientorganisationer där svarstiden för liknande dokument är jämförbar men inte alltid identisk. Enstaka variationer i svarstid och prestanda är en naturlig del av alla mikrotjänstbaserade, tillståndslösa tjänster som bearbetar bilder och stora dokument i stor skala. Även om vi kontinuerligt skalar upp maskinvaru- och kapacitets- och skalningsfunktionerna kan du fortfarande ha problem med svarstiden vid körning.

Tilläggsfunktion

Följande tilläggsfunktioner är tillgängliga för Dokumentinformation. För alla modeller utom visitkortsmodellen har Document Intelligence nu stöd för tilläggsfunktioner för att möjliggöra mer avancerad analys. Du kan aktivera och inaktivera de här valfria funktionerna beroende på scenariot med dokumentextraheringen. Följande tilläggsfunktioner är tillgängliga för 2023-07-31 (GA) och senare API-version:

Tilläggsfunktion Tillägg/kostnadsfritt 2024-11-30 (GA) 2023-07-31 (GA) 2022-08-31 (GA) v2.1 (GA)
Extrahering av teckensnittsegenskap Tillägg ✔️ ✔️ Inte tillgängliga Inte tillgängliga
Formelextrahering Tillägg ✔️ ✔️ Inte tillgängliga Inte tillgängliga
Högupplösningsextrahering Tillägg ✔️ ✔️ Inte tillgängliga Inte tillgängliga
Extrahering av streckkod Kostnadsfri ✔️ ✔️ Inte tillgängliga Inte tillgängliga
Språkidentifiering Kostnadsfri ✔️ ✔️ Inte tillgängliga Inte tillgängliga
Nyckel/värde-par Kostnadsfri ✔️ Inte tillgängliga Inte tillgängliga Inte tillgängliga
Frågefält Tillägg* ✔️ Inte tillgängliga Inte tillgängliga Inte tillgängliga
Sökbar PDF Tillägg* ✔️ Inte tillgängliga Inte tillgängliga Inte tillgängliga

Modellanalysfunktioner

Modell-ID Extrahering av innehåll Frågefält Punkterna Styckeroller Markeringsmarkeringar Tabeller Nyckel/värde-par Språk Streckkoder Dokumentanalys Formler* Formatmallsteckensnitt* Högupplöst* Sökbar PDF
prebuilt-read O O O O O O
prebuilt-layout O O O O O O
prebuilt-contract O O O O
prebuilt-healthInsuranceCard.us O O O O O
prebuilt-idDocument O O O O O
prebuilt-invoice O O O O O O
prebuilt-receipt O O O O O
prebuilt-marriageCertificate.us O O O O O
prebuilt-creditCard O O O O O
prebuilt-check.us O O O O O
prebuilt-payStub.us O O O O O
prebuilt-bankStatement O O O O O
prebuilt-mortgage.us.1003 O O O O O
prebuilt-mortgage.us.1004 O O O O O
prebuilt-mortgage.us.1005 O O O O O
prebuilt-mortgage.us.1008 O O O O O
prebuilt-mortgage.us.closingDisclosure O O O O O
prebuilt-tax.us O O O O O
prebuilt-tax.us.w2 O O O O O
prebuilt-tax.us.w4 O O O O O
prebuilt-tax.us.1040 (olika) O O O O O
prebuilt-tax.us.1095A O O O O O
prebuilt-tax.us.1095C O O O O O
prebuilt-tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099 (olika) O O O O O
prebuilt-tax.us.1099SSA O O O O O
{ customModelName } O O O O O

√ - Aktiverad
O - Valfritt
* - Premium-funktioner medför extra kostnader

Frågefält prissätts på ett annat sätt än de andra tilläggsfunktionerna. Mer information finns i Priser.

Avgränsningslåda och polygonkoordinater

En avgränsningsruta (polygon i v3.0 och senare versioner) är en abstrakt rektangel som omger textelement i ett dokument. En avgränsningsruta används som referenspunkt för objektidentifiering:

  • Avgränsningsrutan anger position med hjälp av ett x- och y-koordinatplan som visas i en matris med fyra numeriska par. Varje par representerar ett hörn av rutan i följande ordning: övre vänstra, övre högra, nedre högra, nedre vänstra.
  • Bildkoordinater visas i bildpunkter. För en PDF visas koordinater i tum.

Språkstöd

De universella modellerna i Dokumentinformation som baseras på djupinlärning stöder många språk. Modellerna kan extrahera flerspråkig text från dina bilder och dokument, inklusive textrader med blandade språk. Språkstöd varierar beroende på funktionerna i Document Intelligence-tjänsten. En fullständig lista finns i följande artiklar:

Regional tillgänglighet

Dokumentinformation är allmänt tillgänglig i många av de 60+ globala infrastrukturregionerna i Azure.

Information om hur du väljer den region som passar bäst för dig och dina kunder finns i Azure-geografiska områden.

Modellinformation

I det här avsnittet beskrivs de utdata som du kan förvänta dig av varje modell. Du kan utöka utdata för de flesta modeller med tilläggsfunktioner.

Läsa OCR

Läs-API:et använder optisk teckenigenkänning (OCR) för att analysera och extrahera rader och ord, deras platser, identifierade språk och handskriftsstil om det identifieras.

Det här exempeldokumentet bearbetades med hjälp av Document Intelligence Studio.

Skärmbild som visar ett exempeldokument som bearbetas med hjälp av Document Intelligence Studio Read.

Layoutanalys

Layoutanalysmodellen analyserar och extraherar text, tabeller, markeringsmarkeringar och andra strukturelement som rubriker, avsnittsrubriker, sidhuvuden och sidfötter.

Det här exempeldokumentet bearbetades med hjälp av Document Intelligence Studio.

Skärmbild som visar en exempeltidningssida som bearbetas med hjälp av Document Intelligence Studio.

Sjukförsäkringskort

Sjukförsäkringskortmodellen kombinerar kraftfulla OCR-funktioner med djupinlärningsmodeller för att analysera och extrahera viktig information från amerikanska sjukförsäkringskort.

Det här amerikanska exempelkortet för sjukförsäkring bearbetades med hjälp av Document Intelligence Studio.

Skärmbild som visar ett exempel på analys av amerikanska sjukförsäkringskort i Document Intelligence Studio.

Amerikanska skattedokument

De amerikanska skattedokumentmodellerna analyserar och extraherar nyckelfält och radobjekt från en utvald grupp med skattedokument. API:et stöder analys av engelskspråkiga amerikanska skattedokument med olika format och kvalitet, inklusive telefoninsamlade bilder, skannade dokument och digitala PDF-filer. Följande modeller stöds för närvarande:

Modell beskrivning Modell-ID
Amerikansk skatt W-2 Extrahera information om beskattningsbar kompensation. prebuilt-tax.us.w2
Amerikansk skatt W-4 Extrahera information om beskattningsbar kompensation. prebuilt-tax.us.w4
Amerikansk skatt 1040 Extrahera information om bolåneräntor. prebuilt-tax.us.1040 (varianter)
Amerikansk skatt 1095 Hämta sjukförsäkringsinformation. prebuilt-tax.us.1095 (varianter)
Amerikansk skatt 1098 Extrahera information om bolåneräntor. prebuilt-tax.us.1098 (varianter)
Amerikansk skatt 1099 Utvinna inkomster från andra källor än arbetsgivaren. prebuilt-tax.us.1099 (varianter)

Det här W-2-exempeldokumentet bearbetades med hjälp av Document Intelligence Studio.

Skärmbild som visar ett exempel på ett W-2-dokument.

Amerikanska inteckningsdokument

De amerikanska inteckningsdokumentmodellerna analyserar och extraherar nyckelfält som inkluderar låntagare, lån och egendomsinformation från en utvald grupp av inteckningsdokument. API:et stöder analys av engelskspråkiga amerikanska inteckningsdokument av olika format och kvalitet, inklusive telefoninsamlade bilder, skannade dokument och digitala PDF-filer. Följande modeller stöds för närvarande.

Modell beskrivning Modell-ID
Licensavtal för 1003 End-User Extrahera lån, låntagare, fastighetsinformation. prebuilt-mortgage.us.1003
1004 Enhetlig bostadsbedömningsrapport (URAR) Extrahera lån, låntagare, fastighetsinformation. prebuilt-mortgage.us.1004
1005 Verifiering av anställning Extrahera lån, låntagare, fastighetsinformation. prebuilt-mortgage.us.1005
Sammanfattningsdokument för 1008 Extrahera låntagare, säljare, egendom, inteckning och försäkringsinformation. prebuilt-mortgage.us.1008
Avslutande avslöjande Extrahera stängning, transaktionskostnader och låneinformation. prebuilt-mortgage.us.closingDisclosure

Det här dokumentet om avslutande avslöjande bearbetades med hjälp av Document Intelligence Studio.

Skärmbild som visar ett exempel på avslutande avslöjande.

Contract

Kontraktsmodellen analyserar och extraherar nyckelfält och radobjekt från avtal, inklusive parter, jurisdiktioner, kontrakts-ID och titel. Modellen stöder för närvarande engelskspråkiga kontraktsdokument.

Det här exempelkontraktet bearbetades med hjälp av Document Intelligence Studio.

Skärmbild som visar extrahering av kontraktsmodell med hjälp av Document Intelligence Studio.

Amerikansk bankkontroll

Kontraktsmodellen analyserar och extraherar nyckelfält från amerikanska bankkontroller, inklusive kontrollinformation, kontoinformation, belopp och PM.

Det här bankkontrollexemplet bearbetades med hjälp av Document Intelligence Studio.

Skärmbild som visar extrahering av bankkontrollmodell med hjälp av Document Intelligence Studio.

Kontoutdrag i USA

Bankutdragsmodellen analyserar och extraherar nyckelfält och radobjekt från kontonummer för amerikanska bankkonton, bankuppgifter, utdragsinformation och transaktionsinformation.

Det här exempelbankutdraget bearbetades med hjälp av Document Intelligence Studio.

Skärmbild som visar extrahering av bankutdragsmodell med hjälp av Document Intelligence Studio.

payStub

PayStub-modellen analyserar och extraherar nyckelfält och radobjekt från dokument och filer med lönerelaterad information.

Den här exempelbetalningsstuben bearbetades med hjälp av Document Intelligence Studio.

Skärmbild som visar extrahering av payStub-modell med hjälp av Document Intelligence Studio.

Faktura

Fakturamodellen automatiserar bearbetningen av fakturor för att extrahera kundens namn, faktureringsadress, förfallodatum, förfallodatum, radobjekt och andra nyckeldata.

Den här exempelfakturan bearbetades med hjälp av Document Intelligence Studio.

Skärmbild som visar en exempelfaktura.

Kvitto

Använd kvittomodellen för att skanna försäljningskvitton efter försäljningsnamn, datum, radobjekt, kvantiteter och summor från tryckta och handskrivna kvitton. Version v3.0 stöder också ensidesbehandling av hotellkvitton.

Det här exempelkvittot bearbetades med hjälp av Document Intelligence Studio.

Skärmbild som visar ett exempelkvitto.

Identitetsdokument

Använd identitetsdokumentmodellen (ID) för att bearbeta amerikanska körkort (alla 50 delstater och District of Columbia) och biografiska sidor från internationella pass (exklusive visum och andra resedokument) för att extrahera nyckelfält.

Det här exemplet på amerikanska körkort bearbetades med hjälp av Document Intelligence Studio.

Skärmbild som visar ett exempelidentifieringskort.

Vigselbevis

Använd modellen för äktenskapscertifikat för att bearbeta amerikanska äktenskapscertifikat för att extrahera nyckelfält, inklusive individer, datum och plats.

Det här amerikanska exempelcertifikatet för äktenskap bearbetades med hjälp av Document Intelligence Studio.

Skärmbild som visar ett exempel på ett äktenskapscertifikat.

Kreditkort

Använd kreditkortsmodellen för att bearbeta kredit- och debetkort för att extrahera nyckelfält.

Det här exempelkreditkortet bearbetades med hjälp av Document Intelligence Studio.

Skärmbild som visar ett exempel på kreditkort.

Anpassade modeller

Anpassade modeller klassificeras i stort sett i två typer. Anpassade klassificeringsmodeller som stöder klassificering av en "dokumenttyp" och anpassade extraheringsmodeller som kan extrahera ett definierat schema från en viss dokumenttyp.

Diagram som visar typer av anpassade modeller och associerade modellversionslägen.

Anpassade dokumentmodeller analyserar och extraherar data från formulär och dokument som är specifika för din verksamhet. De känner igen formulärfält i ditt distinkta innehåll och extraherar nyckel/värde-par och tabelldata. Du behöver bara ett exempel på formulärtypen för att komma igång.

Version v3.0 och senare anpassade modeller stöder signaturidentifiering i anpassade mallar (formulär) och korssidetabeller i både mallar och neurala modeller. Signaturidentifiering söker efter förekomsten av en signatur, inte identiteten för den person som signerar dokumentet. Om modellen returnerar osignerad för signaturidentifiering hittade modellen ingen signatur i det definierade fältet.

Den här anpassade exempelmallen bearbetades med hjälp av Document Intelligence Studio.

Skärmbild som visar dokumentinformation som analyserar ett anpassat formulär.

Anpassad extrahering

Den anpassade extraheringsmodellen finns i två typer: anpassad mall och anpassad neural. Skapa en anpassad extraheringsmodell genom att märka en datamängd med dokument med de värden som du vill extrahera och träna modellen på den märkta datamängden. Du behöver bara fem exempel av samma formulär- eller dokumenttyp för att komma igång.

Det här exemplet på anpassad extrahering bearbetades med hjälp av Document Intelligence Studio.

Skärmbild som visar anpassad analys av extraheringsmodellen i Document Intelligence Studio.

Anpassad klassificerare

Med den anpassade klassificeringsmodellen kan du identifiera dokumenttypen innan du anropar extraheringsmodellen. Klassificeringsmodellen är tillgänglig från och med API:et 2023-07-31 (GA). Träning av en anpassad klassificeringsmodell kräver minst två distinkta klasser och minst fem exempel per klass.

Sammansatta modeller

En sammansatt modell skapas genom att ta en samling anpassade modeller och tilldela dem till en enda modell som skapats från dina formulärtyper. Du kan tilldela flera anpassade modeller till en sammansatt modell som anropas med ett enda modell-ID. Du kan tilldela upp till 200 tränade anpassade modeller till en enda sammansatt modell.

Den här exempelkomponerade modellen finns i Document Intelligence Studio.

Skärmbild som visar fönstret Skapa anpassad modell i Document Intelligence Studio.

Indatakrav

Följande filformat stöds.

Modell PDF Bild:
JPEG/JPG, PNG, BMP, TIFF, HEIF
Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Lästa
Layout
Allmänt dokument
Inbyggda
Anpassad extrahering
Anpassad klassificering
  • Foton och genomsökningar: För bästa resultat, ge ett tydligt foto eller högkvalitativ genomsökning per dokument.
  • PDF-filer och TIFF:er: För PDF-filer och TIFF:er kan upp till 2 000 sidor bearbetas. (Med en prenumeration på den kostnadsfria nivån bearbetas endast de två första sidorna.)
  • Filstorlek: Filstorleken för att analysera dokument är 500 MB för den betalda nivån (S0) och 4 MB för den kostnadsfria nivån (F0).
  • Bilddimensioner: Dimensionerna måste vara mellan 50 bildpunkter x 50 bildpunkter och 10 000 bildpunkter x 10 000 bildpunkter.
  • Lösenordslås: Om dina PDF-filer är lösenordslåsta måste du ta bort låset innan det skickas in.
  • Texthöjd: Den minsta höjden på texten som ska extraheras är 12 bildpunkter för en bild på 1 024 x 768 bildpunkter. Den här dimensionen motsvarar cirka 8-punktstext vid 150 punkter per tum.
  • Anpassad modellträning: Det maximala antalet sidor för träningsdata är 500 för den anpassade mallmodellen och 50 000 för den anpassade neurala modellen.
  • Anpassad extraheringsmodellträning: Den totala storleken på träningsdata är 50 MB för mallmodellen och 1 GB för den neurala modellen.
  • Anpassad klassificeringsmodellträning: Den totala storleken på träningsdata är 1 GB med högst 10 000 sidor. För 2024-11-30 (GA) är den totala storleken på träningsdata 2 GB med högst 10 000 sidor.
  • Office-filtyper (DOCX, XLSX, PPTX): Den maximala stränglängdsgränsen är 8 miljoner tecken.

Kommentar

Verktyget Exempeletiketter stöder inte BMP-filformatet. Begränsningen härleds från verktyget, inte från Document Intelligence Service.

Versionsmigrering

Lär dig hur du använder Document Intelligence v3.0 i dina program genom att följa stegen i migreringsguiden för Dokumentinformation v3.1.

Modell beskrivning
Dokumentanalys
Layout Extrahera text- och layoutinformation från dokument.
Inbyggda
Faktura Extrahera viktig information från fakturor på engelska och spanska.
Kvitto Extrahera viktig information från engelskspråkiga kvitton.
ID-dokument Extrahera viktig information från amerikanska körkort och internationella pass.
Visitkort Extrahera viktig information från engelskspråkiga visitkort.
Anpassat
Egen Extrahera data från formulär och dokument som är specifika för ditt företag. Anpassade modeller tränas för dina distinkta data och användningsfall.
Lugn Skapa en samling anpassade modeller och tilldela dem till en enda modell som skapats från dina formulärtyper.

Layout

Layout-API:et analyserar och extraherar text, tabeller och rubriker, markeringsmarkeringar och strukturinformation från dokument.

Det här exempeldokumentet bearbetades med hjälp av verktyget Exempeletiketter.

Skärmbild som visar layoutanalys med hjälp av verktyget Exempeletiketter.

Faktura

Fakturamodellen analyserar och extraherar viktig information från försäljningsfakturor. API:et analyserar fakturor i olika format och extraherar viktig information, till exempel kundnamn, faktureringsadress, förfallodatum och förfallobelopp.

Den här exempelfakturan bearbetades med hjälp av verktyget Exempeletikettering.

Skärmbild som visar en exempelfakturaanalys med hjälp av verktyget Exempeletiketter.

Kvitto

Kvittomodellen analyserar och extraherar viktig information från tryckta och handskrivna försäljningskvitton.

Det här exempelkvittot bearbetades med hjälp av verktyget Exempeletikettering.

Skärmbild som visar ett exempelkvitto.

ID-dokument

ID-dokumentmodellen analyserar och extraherar viktig information från följande dokument:

  • Amerikanska körkort (alla 50 delstater och District of Columbia)
  • Biografiska sidor från internationella pass (exklusive visum och andra resehandlingar). API:et analyserar och extraherar identitetsdokument.

Det här exemplet på amerikanska körkort bearbetades med hjälp av exempeletiketteringsverktyget.

Skärmbild som visar ett exempelidentifieringskort.

Visitkort

Visitkortsmodellen analyserar och extraherar viktig information från visitkortsbilder.

Det här exempelkortet bearbetades med hjälp av verktyget Exempeletikettering.

Skärmbild som visar ett exempel på visitkort.

Anpassat

Anpassade modeller analyserar och extraherar data från formulär och dokument som är specifika för din verksamhet. API:et är ett maskininlärningsprogram som tränats att identifiera formulärfält i ditt distinkta innehåll och extrahera nyckel/värde-par och tabelldata. Du behöver bara fem exempel av samma formulärtyp för att komma igång. Du kan träna din anpassade modell med eller utan etiketterade datauppsättningar.

Den här anpassade exempelmodellen bearbetades med hjälp av verktyget Exempeletikettering.

Skärmbild som visar verktyget Dokumentinformation som analyserar ett anpassat formulärfönster.

Skapad anpassad modell

En sammansatt modell skapas genom att ta en samling anpassade modeller och tilldela dem till en enda modell som skapats från dina formulärtyper. Du kan tilldela flera anpassade modeller till en sammansatt modell som anropas med ett enda modell-ID. Du kan tilldela upp till 100 tränade anpassade modeller till en enda sammansatt modell.

Det här sammansatta modellfönstret bearbetades med hjälp av verktyget Exempeletikettering.

Skärmbild som visar fönstret Skapa anpassad modell i Document Intelligence Studio.

Extrahering av modelldata

Modell Extrahering av text Språkidentifiering Markeringsmarkeringar Tabeller Punkterna Styckeroller Nyckel/värde-par Fields
Layout
Faktura
Kvitto
ID-dokument
Visitkort
Anpassat formulär

Indatakrav

Följande filformat stöds.

Modell PDF Bild:
JPEG/JPG, PNG, BMP, TIFF, HEIF
Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Lästa
Layout
Allmänt dokument
Inbyggda
Anpassad extrahering
Anpassad klassificering
  • Foton och genomsökningar: För bästa resultat, ge ett tydligt foto eller högkvalitativ genomsökning per dokument.
  • PDF-filer och TIFF:er: För PDF-filer och TIFF:er kan upp till 2 000 sidor bearbetas. (Med en prenumeration på den kostnadsfria nivån bearbetas endast de två första sidorna.)
  • Filstorlek: Filstorleken för att analysera dokument är 500 MB för den betalda nivån (S0) och 4 MB för den kostnadsfria nivån (F0).
  • Bilddimensioner: Dimensionerna måste vara mellan 50 bildpunkter x 50 bildpunkter och 10 000 bildpunkter x 10 000 bildpunkter.
  • Lösenordslås: Om dina PDF-filer är lösenordslåsta måste du ta bort låset innan det skickas in.
  • Texthöjd: Den minsta höjden på texten som ska extraheras är 12 bildpunkter för en bild på 1 024 x 768 bildpunkter. Den här dimensionen motsvarar cirka 8-punktstext vid 150 punkter per tum.
  • Anpassad modellträning: Det maximala antalet sidor för träningsdata är 500 för den anpassade mallmodellen och 50 000 för den anpassade neurala modellen.
  • Anpassad extraheringsmodellträning: Den totala storleken på träningsdata är 50 MB för mallmodellen och 1 GB för den neurala modellen.
  • Anpassad klassificeringsmodellträning: Den totala storleken på träningsdata är 1 GB med högst 10 000 sidor. För 2024-11-30 (GA) är den totala storleken på träningsdata 2 GB med högst 10 000 sidor.
  • Office-filtyper (DOCX, XLSX, PPTX): Den maximala stränglängdsgränsen är 8 miljoner tecken.

Kommentar

Verktyget Exempeletiketter stöder inte BMP-filformatet. Begränsningen härleds från verktyget, inte dokumentinformation.

Versionsmigrering

Du kan lära dig hur du använder Document Intelligence v3.0 i dina program genom att följa stegen i migreringsguiden för Dokumentinformation v3.1