Anteckning
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Det här innehållet gäller för:
BockmarkeringSenaste version: | blue-checkmarkv4.0 (GA)
Azure AI Document Intelligence stöder olika modeller som du kan använda för att lägga till intelligent dokumentbearbetning i dina appar och flöden. Du kan använda en fördefinierad domänspecifik modell eller träna en anpassad modell som är anpassad efter dina specifika affärsbehov och användningsfall. Du kan använda Dokumentinformation med REST-API:et eller Python-, C#-, Java- och JavaScript-klientbiblioteken.
Kommentar
Dokumentbearbetningsprojekt som omfattar finansiella data, skyddade hälsodata, personuppgifter eller mycket känsliga data kräver noggrann uppmärksamhet. Se till att uppfylla alla nationella/regionala och branschspecifika krav.
Översikt över modell
I följande tabell visas de allmänt tillgängliga modellerna (GA) för varje stabilt API.
| Modelltyp | Modell | 2024-11-30 (GA) | 2023-07-31 (GA) | 2022-08-31 (GA) | v2.1 (GA) |
|---|---|---|---|---|---|
| Modeller för dokumentanalys | Läs | ✔️ | ✔️ | ✔️ | Inte tillgängliga |
| Modeller för dokumentanalys | Layout | ✔️ | ✔️ | ✔️ | ✔️ |
| Modeller för dokumentanalys | Allmänt dokument** | Stöds i layoutmodell |
✔️ | ✔️ | Inte tillgängliga |
| Inbyggda modeller | Bankkontroll | ✔️ | Inte tillgängliga | Inte tillgängliga | Inte tillgängliga |
| Inbyggda modeller | Kontoutdrag | ✔️ | Inte tillgängliga | Inte tillgängliga | Inte tillgängliga |
| Inbyggda modeller | payStub | ✔️ | Inte tillgängliga | Inte tillgängliga | Inte tillgängliga |
| Inbyggda modeller | Kontrakt | ✔️ | ✔️ | Inte tillgängliga | Inte tillgängliga |
| Inbyggda modeller | Sjukförsäkringskort | ✔️ | ✔️ | ✔️ | Inte tillgängliga |
| Inbyggda modeller | ID-dokument | ✔️ | ✔️ | ✔️ | ✔️ |
| Inbyggda modeller | Faktura | ✔️ | ✔️ | ✔️ | ✔️ |
| Inbyggda modeller | Kvitto | ✔️ | ✔️ | ✔️ | ✔️ |
| Inbyggda modeller | Enhetlig skatt i USA* | ✔️ | Inte tillgängliga | Inte tillgängliga | Inte tillgängliga |
| Inbyggda modeller | US 1040 skatt* | ✔️ | ✔️ | Inte tillgängliga | Inte tillgängliga |
| Inbyggda modeller | Us 1095 tax* | ✔️ | Inte tillgängliga | Inte tillgängliga | Inte tillgängliga |
| Inbyggda modeller | Skatt för USA 1098* | ✔️ | Inte tillgängliga | Inte tillgängliga | Inte tillgängliga |
| Inbyggda modeller | US 1099-skatt* | ✔️ | Inte tillgängliga | Inte tillgängliga | Inte tillgängliga |
| Inbyggda modeller | US W2-skatt | ✔️ | ✔️ | ✔️ | Inte tillgängliga |
| Inbyggda modeller | US W4-skatt | ✔️ | Inte tillgängliga | Inte tillgängliga | Inte tillgängliga |
| Inbyggda modeller | AMERIKANSKA inteckning 1003 URLA | ✔️ | Inte tillgängliga | Inte tillgängliga | Inte tillgängliga |
| Inbyggda modeller | Amerikanska inteckning 1004 URAR | ✔️ | Inte tillgängliga | Inte tillgängliga | Inte tillgängliga |
| Inbyggda modeller | Amerikansk inteckning 1005 | ✔️ | Inte tillgängliga | Inte tillgängliga | Inte tillgängliga |
| Inbyggda modeller | Amerikansk inteckning 1008 sammanfattning | ✔️ | Inte tillgängliga | Inte tillgängliga | Inte tillgängliga |
| Inbyggda modeller | Information om stängning av amerikanska hypotekslån | ✔️ | Inte tillgängliga | Inte tillgängliga | Inte tillgängliga |
| Inbyggda modeller | Vigselbevis | ✔️ | Inte tillgängliga | Inte tillgängliga | Inte tillgängliga |
| Inbyggda modeller | Kreditkort | ✔️ | Inte tillgängliga | Inte tillgängliga | Inte tillgängliga |
| Inbyggda modeller | Visitkort | inaktuell | ✔️ | ✔️ | ✔️ |
| Anpassad klassificeringsmodell | Anpassad klassificerare | ✔️ | ✔️ | Inte tillgängliga | Inte tillgängliga |
| Anpassad extraheringsmodell | Anpassad neural | ✔️ | ✔️ | ✔️ | Inte tillgängliga |
| Anpassad extraheringsmodell | Anpassad mall | ✔️ | ✔️ | ✔️ | ✔️ |
| Anpassad extraheringsmodell | Anpassad sammansatt | ✔️ | ✔️ | ✔️ | ✔️ |
| Alla modeller | Tilläggsfunktioner | ✔️ | ✔️ | Inte tillgängliga | Inte tillgängliga |
* Innehåller undermodeller. Se modellspecifik information för varianter och undertyper som stöds.
** Alla funktioner för den allmänna dokumentmodellen är tillgängliga i layoutmodellen. Den allmänna modellen stöds inte längre.
Svarstid
Svarstiden är den tid det tar för en API-server att hantera och bearbeta en inkommande begäran och leverera det utgående svaret till klienten. Tiden för att analysera ett dokument beror på storleken (till exempel antalet sidor) och de associerade innehållet på varje sida. Dokumentinformation är en asynkron tjänst med flera klientorganisationer där svarstiden för liknande dokument är jämförbar men inte alltid identisk. Enstaka variationer i svarstid och prestanda är en naturlig del av alla mikrotjänstbaserade, tillståndslösa tjänster som bearbetar bilder och stora dokument i stor skala. Även om vi kontinuerligt skalar upp maskinvaru- och kapacitets- och skalningsfunktionerna kan du fortfarande ha problem med svarstiden vid körning.
Tilläggsfunktion
Följande tilläggsfunktioner är tillgängliga för Dokumentinformation. För alla modeller utom visitkortsmodellen har Document Intelligence nu stöd för tilläggsfunktioner för att möjliggöra mer avancerad analys. Du kan aktivera och inaktivera de här valfria funktionerna beroende på scenariot med dokumentextraheringen. Följande tilläggsfunktioner är tillgängliga för 2023-07-31 (GA) och senare API-version:
ocrHighResolutionformulasstyleFontbarcodeslanguageskeyValuePairs-
queryFields(inte tillgängligt med amerikanska skattemodeller) -
searchablePDF(endast tillgängligt för läsmodellen)
| Tilläggsfunktion | Tillägg/kostnadsfritt | 2024-11-30 (GA) | 2023-07-31 (GA) | 2022-08-31 (GA) | v2.1 (GA) |
|---|---|---|---|---|---|
| Extrahering av teckensnittsegenskap | Tillägg | ✔️ | ✔️ | Inte tillgängliga | Inte tillgängliga |
| Formelextrahering | Tillägg | ✔️ | ✔️ | Inte tillgängliga | Inte tillgängliga |
| Högupplösningsextrahering | Tillägg | ✔️ | ✔️ | Inte tillgängliga | Inte tillgängliga |
| Extrahering av streckkod | Kostnadsfri | ✔️ | ✔️ | Inte tillgängliga | Inte tillgängliga |
| Språkidentifiering | Kostnadsfri | ✔️ | ✔️ | Inte tillgängliga | Inte tillgängliga |
| Nyckel/värde-par | Kostnadsfri | ✔️ | Inte tillgängliga | Inte tillgängliga | Inte tillgängliga |
| Frågefält | Tillägg* | ✔️ | Inte tillgängliga | Inte tillgängliga | Inte tillgängliga |
| Sökbar PDF | Tillägg* | ✔️ | Inte tillgängliga | Inte tillgängliga | Inte tillgängliga |
Modellanalysfunktioner
| Modell-ID | Extrahering av innehåll | Frågefält | Punkterna | Styckeroller | Markeringsmarkeringar | Tabeller | Nyckel/värde-par | Språk | Streckkoder | Dokumentanalys | Formler* | Formatmallsteckensnitt* | Högupplöst* | Sökbar PDF |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
prebuilt-read |
✓ | ✓ | O | O | O | O | O | O | ||||||
prebuilt-layout |
✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | O | O | O | O | ||
prebuilt-contract |
✓ | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | ||||
prebuilt-healthInsuranceCard.us |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-idDocument |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-invoice |
✓ | ✓ | ✓ | ✓ | O | O | O | ✓ | O | O | O | |||
prebuilt-receipt |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-marriageCertificate.us |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-creditCard |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-check.us |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-payStub.us |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-bankStatement |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-mortgage.us.1003 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.1004 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.1005 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.1008 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.closingDisclosure |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.w2 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.w4 |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-tax.us.1040 (olika) |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1095A |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-tax.us.1095C |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-tax.us.1098 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1098E |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1098T |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1099 (olika) |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1099SSA |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
{ customModelName } |
✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O |
√ - Aktiverad
O - Valfritt
* - Premium-funktioner medför extra kostnader
Frågefält prissätts på ett annat sätt än de andra tilläggsfunktionerna. Mer information finns i Priser.
Avgränsningslåda och polygonkoordinater
En avgränsningsruta (polygon i v3.0 och senare versioner) är en abstrakt rektangel som omger textelement i ett dokument. En avgränsningsruta används som referenspunkt för objektidentifiering:
- Avgränsningsrutan anger position med hjälp av ett x- och y-koordinatplan som visas i en matris med fyra numeriska par. Varje par representerar ett hörn av rutan i följande ordning: övre vänstra, övre högra, nedre högra, nedre vänstra.
- Bildkoordinater visas i bildpunkter. För en PDF visas koordinater i tum.
Språkstöd
De universella modellerna i Dokumentinformation som baseras på djupinlärning stöder många språk. Modellerna kan extrahera flerspråkig text från dina bilder och dokument, inklusive textrader med blandade språk. Språkstöd varierar beroende på funktionerna i Document Intelligence-tjänsten. En fullständig lista finns i följande artiklar:
- Språkstöd: Modeller för dokumentanalys
- Språkstöd: Fördefinierade modeller
- Språkstöd: Anpassade modeller
Regional tillgänglighet
Dokumentinformation är allmänt tillgänglig i många av de 60+ globala infrastrukturregionerna i Azure.
Information om hur du väljer den region som passar bäst för dig och dina kunder finns i Azure-geografiska områden.
Modellinformation
I det här avsnittet beskrivs de utdata som du kan förvänta dig av varje modell. Du kan utöka utdata för de flesta modeller med tilläggsfunktioner.
Läsa OCR
Läs-API:et använder optisk teckenigenkänning (OCR) för att analysera och extrahera rader och ord, deras platser, identifierade språk och handskriftsstil om det identifieras.
Det här exempeldokumentet bearbetades med hjälp av Document Intelligence Studio.
Layoutanalys
Layoutanalysmodellen analyserar och extraherar text, tabeller, markeringsmarkeringar och andra strukturelement som rubriker, avsnittsrubriker, sidhuvuden och sidfötter.
Det här exempeldokumentet bearbetades med hjälp av Document Intelligence Studio.
Sjukförsäkringskort
Sjukförsäkringskortmodellen kombinerar kraftfulla OCR-funktioner med djupinlärningsmodeller för att analysera och extrahera viktig information från amerikanska sjukförsäkringskort.
Det här amerikanska exempelkortet för sjukförsäkring bearbetades med hjälp av Document Intelligence Studio.
Amerikanska skattedokument
De amerikanska skattedokumentmodellerna analyserar och extraherar nyckelfält och radobjekt från en utvald grupp med skattedokument. API:et stöder analys av engelskspråkiga amerikanska skattedokument med olika format och kvalitet, inklusive telefoninsamlade bilder, skannade dokument och digitala PDF-filer. Följande modeller stöds för närvarande:
| Modell | beskrivning | Modell-ID |
|---|---|---|
| Amerikansk skatt W-2 | Extrahera information om beskattningsbar kompensation. | prebuilt-tax.us.w2 |
| Amerikansk skatt W-4 | Extrahera information om beskattningsbar kompensation. | prebuilt-tax.us.w4 |
| Amerikansk skatt 1040 | Extrahera information om bolåneräntor. |
prebuilt-tax.us.1040 (varianter) |
| Amerikansk skatt 1095 | Hämta sjukförsäkringsinformation. |
prebuilt-tax.us.1095 (varianter) |
| Amerikansk skatt 1098 | Extrahera information om bolåneräntor. |
prebuilt-tax.us.1098 (varianter) |
| Amerikansk skatt 1099 | Utvinna inkomster från andra källor än arbetsgivaren. |
prebuilt-tax.us.1099 (varianter) |
Det här W-2-exempeldokumentet bearbetades med hjälp av Document Intelligence Studio.
Amerikanska inteckningsdokument
De amerikanska inteckningsdokumentmodellerna analyserar och extraherar nyckelfält som inkluderar låntagare, lån och egendomsinformation från en utvald grupp av inteckningsdokument. API:et stöder analys av engelskspråkiga amerikanska inteckningsdokument av olika format och kvalitet, inklusive telefoninsamlade bilder, skannade dokument och digitala PDF-filer. Följande modeller stöds för närvarande.
| Modell | beskrivning | Modell-ID |
|---|---|---|
| Licensavtal för 1003 End-User | Extrahera lån, låntagare, fastighetsinformation. | prebuilt-mortgage.us.1003 |
| 1004 Enhetlig bostadsbedömningsrapport (URAR) | Extrahera lån, låntagare, fastighetsinformation. | prebuilt-mortgage.us.1004 |
| 1005 Verifiering av anställning | Extrahera lån, låntagare, fastighetsinformation. | prebuilt-mortgage.us.1005 |
| Sammanfattningsdokument för 1008 | Extrahera låntagare, säljare, egendom, inteckning och försäkringsinformation. | prebuilt-mortgage.us.1008 |
| Avslutande avslöjande | Extrahera stängning, transaktionskostnader och låneinformation. | prebuilt-mortgage.us.closingDisclosure |
Det här dokumentet om avslutande avslöjande bearbetades med hjälp av Document Intelligence Studio.
Contract
Kontraktsmodellen analyserar och extraherar nyckelfält och radobjekt från avtal, inklusive parter, jurisdiktioner, kontrakts-ID och titel. Modellen stöder för närvarande engelskspråkiga kontraktsdokument.
Det här exempelkontraktet bearbetades med hjälp av Document Intelligence Studio.
Amerikansk bankkontroll
Kontraktsmodellen analyserar och extraherar nyckelfält från amerikanska bankkontroller, inklusive kontrollinformation, kontoinformation, belopp och PM.
Det här bankkontrollexemplet bearbetades med hjälp av Document Intelligence Studio.
Kontoutdrag i USA
Bankutdragsmodellen analyserar och extraherar nyckelfält och radobjekt från kontonummer för amerikanska bankkonton, bankuppgifter, utdragsinformation och transaktionsinformation.
Det här exempelbankutdraget bearbetades med hjälp av Document Intelligence Studio.
payStub
PayStub-modellen analyserar och extraherar nyckelfält och radobjekt från dokument och filer med lönerelaterad information.
Den här exempelbetalningsstuben bearbetades med hjälp av Document Intelligence Studio.
Faktura
Fakturamodellen automatiserar bearbetningen av fakturor för att extrahera kundens namn, faktureringsadress, förfallodatum, förfallodatum, radobjekt och andra nyckeldata.
Den här exempelfakturan bearbetades med hjälp av Document Intelligence Studio.
Kvitto
Använd kvittomodellen för att skanna försäljningskvitton efter försäljningsnamn, datum, radobjekt, kvantiteter och summor från tryckta och handskrivna kvitton. Version v3.0 stöder också ensidesbehandling av hotellkvitton.
Det här exempelkvittot bearbetades med hjälp av Document Intelligence Studio.
Identitetsdokument
Använd identitetsdokumentmodellen (ID) för att bearbeta amerikanska körkort (alla 50 delstater och District of Columbia) och biografiska sidor från internationella pass (exklusive visum och andra resedokument) för att extrahera nyckelfält.
Det här exemplet på amerikanska körkort bearbetades med hjälp av Document Intelligence Studio.
Vigselbevis
Använd modellen för äktenskapscertifikat för att bearbeta amerikanska äktenskapscertifikat för att extrahera nyckelfält, inklusive individer, datum och plats.
Det här amerikanska exempelcertifikatet för äktenskap bearbetades med hjälp av Document Intelligence Studio.
Kreditkort
Använd kreditkortsmodellen för att bearbeta kredit- och debetkort för att extrahera nyckelfält.
Det här exempelkreditkortet bearbetades med hjälp av Document Intelligence Studio.
Anpassade modeller
Anpassade modeller klassificeras i stort sett i två typer. Anpassade klassificeringsmodeller som stöder klassificering av en "dokumenttyp" och anpassade extraheringsmodeller som kan extrahera ett definierat schema från en viss dokumenttyp.
Anpassade dokumentmodeller analyserar och extraherar data från formulär och dokument som är specifika för din verksamhet. De känner igen formulärfält i ditt distinkta innehåll och extraherar nyckel/värde-par och tabelldata. Du behöver bara ett exempel på formulärtypen för att komma igång.
Version v3.0 och senare anpassade modeller stöder signaturidentifiering i anpassade mallar (formulär) och korssidetabeller i både mallar och neurala modeller. Signaturidentifiering söker efter förekomsten av en signatur, inte identiteten för den person som signerar dokumentet. Om modellen returnerar osignerad för signaturidentifiering hittade modellen ingen signatur i det definierade fältet.
Den här anpassade exempelmallen bearbetades med hjälp av Document Intelligence Studio.
Anpassad extrahering
Den anpassade extraheringsmodellen finns i två typer: anpassad mall och anpassad neural. Skapa en anpassad extraheringsmodell genom att märka en datamängd med dokument med de värden som du vill extrahera och träna modellen på den märkta datamängden. Du behöver bara fem exempel av samma formulär- eller dokumenttyp för att komma igång.
Det här exemplet på anpassad extrahering bearbetades med hjälp av Document Intelligence Studio.
Anpassad klassificerare
Med den anpassade klassificeringsmodellen kan du identifiera dokumenttypen innan du anropar extraheringsmodellen. Klassificeringsmodellen är tillgänglig från och med API:et 2023-07-31 (GA). Träning av en anpassad klassificeringsmodell kräver minst två distinkta klasser och minst fem exempel per klass.
Sammansatta modeller
En sammansatt modell skapas genom att ta en samling anpassade modeller och tilldela dem till en enda modell som skapats från dina formulärtyper. Du kan tilldela flera anpassade modeller till en sammansatt modell som anropas med ett enda modell-ID. Du kan tilldela upp till 200 tränade anpassade modeller till en enda sammansatt modell.
Den här exempelkomponerade modellen finns i Document Intelligence Studio.
Indatakrav
Följande filformat stöds.
| Modell | Bild: JPEG/JPG, PNG, BMP, TIFF, HEIF |
Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML |
|
|---|---|---|---|
| Lästa | ✔ | ✔ | ✔ |
| Layout | ✔ | ✔ | ✔ |
| Allmänt dokument | ✔ | ✔ | |
| Inbyggda | ✔ | ✔ | |
| Anpassad extrahering | ✔ | ✔ | |
| Anpassad klassificering | ✔ | ✔ | ✔ |
- Foton och genomsökningar: För bästa resultat, ge ett tydligt foto eller högkvalitativ genomsökning per dokument.
- PDF-filer och TIFF:er: För PDF-filer och TIFF:er kan upp till 2 000 sidor bearbetas. (Med en prenumeration på den kostnadsfria nivån bearbetas endast de två första sidorna.)
- Filstorlek: Filstorleken för att analysera dokument är 500 MB för den betalda nivån (S0) och 4 MB för den kostnadsfria nivån (F0).
- Bilddimensioner: Dimensionerna måste vara mellan 50 bildpunkter x 50 bildpunkter och 10 000 bildpunkter x 10 000 bildpunkter.
- Lösenordslås: Om dina PDF-filer är lösenordslåsta måste du ta bort låset innan det skickas in.
- Texthöjd: Den minsta höjden på texten som ska extraheras är 12 bildpunkter för en bild på 1 024 x 768 bildpunkter. Den här dimensionen motsvarar cirka 8-punktstext vid 150 punkter per tum.
- Anpassad modellträning: Det maximala antalet sidor för träningsdata är 500 för den anpassade mallmodellen och 50 000 för den anpassade neurala modellen.
- Anpassad extraheringsmodellträning: Den totala storleken på träningsdata är 50 MB för mallmodellen och 1 GB för den neurala modellen.
- Anpassad klassificeringsmodellträning: Den totala storleken på träningsdata är 1 GB med högst 10 000 sidor. För 2024-11-30 (GA) är den totala storleken på träningsdata 2 GB med högst 10 000 sidor.
- Office-filtyper (DOCX, XLSX, PPTX): Den maximala stränglängdsgränsen är 8 miljoner tecken.
Kommentar
Verktyget Exempeletiketter stöder inte BMP-filformatet. Begränsningen härleds från verktyget, inte från Document Intelligence Service.
Versionsmigrering
Lär dig hur du använder Document Intelligence v3.0 i dina program genom att följa stegen i migreringsguiden för Dokumentinformation v3.1.
| Modell | beskrivning |
|---|---|
| Dokumentanalys | |
| Layout | Extrahera text- och layoutinformation från dokument. |
| Inbyggda | |
| Faktura | Extrahera viktig information från fakturor på engelska och spanska. |
| Kvitto | Extrahera viktig information från engelskspråkiga kvitton. |
| ID-dokument | Extrahera viktig information från amerikanska körkort och internationella pass. |
| Visitkort | Extrahera viktig information från engelskspråkiga visitkort. |
| Anpassat | |
| Egen | Extrahera data från formulär och dokument som är specifika för ditt företag. Anpassade modeller tränas för dina distinkta data och användningsfall. |
| Lugn | Skapa en samling anpassade modeller och tilldela dem till en enda modell som skapats från dina formulärtyper. |
Layout
Layout-API:et analyserar och extraherar text, tabeller och rubriker, markeringsmarkeringar och strukturinformation från dokument.
Det här exempeldokumentet bearbetades med hjälp av verktyget Exempeletiketter.
Faktura
Fakturamodellen analyserar och extraherar viktig information från försäljningsfakturor. API:et analyserar fakturor i olika format och extraherar viktig information, till exempel kundnamn, faktureringsadress, förfallodatum och förfallobelopp.
Den här exempelfakturan bearbetades med hjälp av verktyget Exempeletikettering.
Kvitto
Kvittomodellen analyserar och extraherar viktig information från tryckta och handskrivna försäljningskvitton.
Det här exempelkvittot bearbetades med hjälp av verktyget Exempeletikettering.
ID-dokument
ID-dokumentmodellen analyserar och extraherar viktig information från följande dokument:
- Amerikanska körkort (alla 50 delstater och District of Columbia)
- Biografiska sidor från internationella pass (exklusive visum och andra resehandlingar). API:et analyserar och extraherar identitetsdokument.
Det här exemplet på amerikanska körkort bearbetades med hjälp av exempeletiketteringsverktyget.
Visitkort
Visitkortsmodellen analyserar och extraherar viktig information från visitkortsbilder.
Det här exempelkortet bearbetades med hjälp av verktyget Exempeletikettering.
Anpassat
Anpassade modeller analyserar och extraherar data från formulär och dokument som är specifika för din verksamhet. API:et är ett maskininlärningsprogram som tränats att identifiera formulärfält i ditt distinkta innehåll och extrahera nyckel/värde-par och tabelldata. Du behöver bara fem exempel av samma formulärtyp för att komma igång. Du kan träna din anpassade modell med eller utan etiketterade datauppsättningar.
Den här anpassade exempelmodellen bearbetades med hjälp av verktyget Exempeletikettering.
Skapad anpassad modell
En sammansatt modell skapas genom att ta en samling anpassade modeller och tilldela dem till en enda modell som skapats från dina formulärtyper. Du kan tilldela flera anpassade modeller till en sammansatt modell som anropas med ett enda modell-ID. Du kan tilldela upp till 100 tränade anpassade modeller till en enda sammansatt modell.
Det här sammansatta modellfönstret bearbetades med hjälp av verktyget Exempeletikettering.
Extrahering av modelldata
| Modell | Extrahering av text | Språkidentifiering | Markeringsmarkeringar | Tabeller | Punkterna | Styckeroller | Nyckel/värde-par | Fields |
|---|---|---|---|---|---|---|---|---|
| Layout | ✓ | ✓ | ✓ | ✓ | ✓ | |||
| Faktura | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ||
| Kvitto | ✓ | ✓ | ✓ | |||||
| ID-dokument | ✓ | ✓ | ✓ | |||||
| Visitkort | ✓ | ✓ | ✓ | |||||
| Anpassat formulär | ✓ | ✓ | ✓ | ✓ | ✓ |
Indatakrav
Följande filformat stöds.
| Modell | Bild: JPEG/JPG, PNG, BMP, TIFF, HEIF |
Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML |
|
|---|---|---|---|
| Lästa | ✔ | ✔ | ✔ |
| Layout | ✔ | ✔ | ✔ |
| Allmänt dokument | ✔ | ✔ | |
| Inbyggda | ✔ | ✔ | |
| Anpassad extrahering | ✔ | ✔ | |
| Anpassad klassificering | ✔ | ✔ | ✔ |
- Foton och genomsökningar: För bästa resultat, ge ett tydligt foto eller högkvalitativ genomsökning per dokument.
- PDF-filer och TIFF:er: För PDF-filer och TIFF:er kan upp till 2 000 sidor bearbetas. (Med en prenumeration på den kostnadsfria nivån bearbetas endast de två första sidorna.)
- Filstorlek: Filstorleken för att analysera dokument är 500 MB för den betalda nivån (S0) och 4 MB för den kostnadsfria nivån (F0).
- Bilddimensioner: Dimensionerna måste vara mellan 50 bildpunkter x 50 bildpunkter och 10 000 bildpunkter x 10 000 bildpunkter.
- Lösenordslås: Om dina PDF-filer är lösenordslåsta måste du ta bort låset innan det skickas in.
- Texthöjd: Den minsta höjden på texten som ska extraheras är 12 bildpunkter för en bild på 1 024 x 768 bildpunkter. Den här dimensionen motsvarar cirka 8-punktstext vid 150 punkter per tum.
- Anpassad modellträning: Det maximala antalet sidor för träningsdata är 500 för den anpassade mallmodellen och 50 000 för den anpassade neurala modellen.
- Anpassad extraheringsmodellträning: Den totala storleken på träningsdata är 50 MB för mallmodellen och 1 GB för den neurala modellen.
- Anpassad klassificeringsmodellträning: Den totala storleken på träningsdata är 1 GB med högst 10 000 sidor. För 2024-11-30 (GA) är den totala storleken på träningsdata 2 GB med högst 10 000 sidor.
- Office-filtyper (DOCX, XLSX, PPTX): Den maximala stränglängdsgränsen är 8 miljoner tecken.
Kommentar
Verktyget Exempeletiketter stöder inte BMP-filformatet. Begränsningen härleds från verktyget, inte dokumentinformation.
Versionsmigrering
Du kan lära dig hur du använder Document Intelligence v3.0 i dina program genom att följa stegen i migreringsguiden för Dokumentinformation v3.1
Relaterat innehåll
- Bearbeta dina egna formulär och dokument med Document Intelligence Studio.
- Slutför en snabbstart för dokumentinformation och skapa sedan en app för dokumentbearbetning på valfritt utvecklingsspråk.
- Bearbeta dina egna formulär och dokument med exempeletiketteringsverktyget för dokumentinformation.
- Slutför en snabbstart för dokumentinformation och skapa sedan en app för dokumentbearbetning på valfritt utvecklingsspråk.