Förstå funktioner för bildanalys i Azure AI Vision
Azure AI Visions bildanalysfunktioner kan användas med eller utan anpassning. Några av de funktioner som inte kräver anpassning är:
- Beskriva en bild med bildtexter
 - Identifiera vanliga objekt i en bild
 - Tagga visuella egenskaper
 - Optisk teckenigenkänning
 
Beskriva en bild med bildtexter
Azure AI Vision har möjlighet att analysera en bild, utvärdera objekten i den och generera en människoläsbar beskrivning av bilden. Tänk till exempel på följande bild:
              
              
            
Azure AI Vision returnerar följande bildtext för den här bilden:
En person hoppar på en skateboard
Identifiera vanliga objekt i en bild
Azure AI Vision kan identifiera tusentals vanliga objekt i bilder. När det till exempel används för att identifiera objekt i skateboarder-avbildningen som beskrevs tidigare returnerar Azure AI Vision följande förutsägelser:
- Skateboard (90,40%)
 - Person (95,5%)
 
Förutsägelserna innehåller en konfidenspoäng som anger hur säker modellen är på att det den beskriver är vad som faktiskt finns i bilden.
Utöver de identifierade objektetiketterna och deras sannolikheter returnerar Azure AI Vision koordinater för avgränsningsrutor som anger det identifierade objektets övre, vänstra, bredd och höjd. Du kan använda dessa koordinater för att avgöra var i bilden varje objekt identifierades, så här:
              
              
            
Tagga visuella egenskaper
Azure AI Vision kan föreslå taggar för en bild baserat på dess innehåll. Taggar är associerade med bilder som metadata. Taggarna sammanfattar bildens attribut. Du kan använda taggar för att indexering av en bild tillsammans med en uppsättning nyckeltermer för en söklösning.
Taggarna som returneras för skateboarder-avbildningen (med associerade konfidenspoäng) inkluderar till exempel:
- sport (99,60%)
 - person (99,56%)
 - skodon (98,05%)
 - skridskoåkning (96,27%)
 - boardsport (95,58%)
 - skateboardutrustning (94,43%)
 - kläder (94,02%)
 - vägg (93,81%)
 - skateboarding (93,78%)
 - skateboardåkare (93,25%)
 - individuella sporter (92.80%)
 - street stunts (90,81%)
 - saldo (90,81%)
 - hoppar (89,87%)
 - sportutrustning (88,61%)
 - extremsport (88,35%)
 - kickflip (88,18%)
 - stunt (87,27%)
 - skateboard (86,87%)
 - stuntman (85,83%)
 - knä (85,30%)
 - sport (85,24%)
 - longboard (84,61%)
 - longboarding (84,45%)
 - ridning (73,37%)
 - skate (67,27%)
 - luft (64,83%)
 - ung (63,29%)
 - utomhus (61,39%)
 
Optisk teckenigenkänning
Tjänsten Azure AI Vision kan använda funktioner för optisk teckenigenkänning (OCR) för att identifiera text i bilder. Tänk till exempel på följande bild av en näringsetikett på en produkt i en livsmedelsbutik:
              
              
            
Tjänsten Azure AI Vision kan analysera den här bilden och extrahera följande text:
Nutrition Facts Amount Per Serving
Serving size:1 bar (40g)
Serving Per Package: 4
Total Fat 13g
Saturated Fat 1.5g
Amount Per Serving
Trans Fat 0g
calories 190
Cholesterol 0mg
ories from Fat 110
Sodium 20mg
ntDaily Values are based on
Vitamin A 50
calorie diet
Träna anpassade modeller
Om de inbyggda modellerna som tillhandahålls av Azure AI Vision inte uppfyller dina behov kan du använda tjänsten för att träna en anpassad modell för bildklassificering eller objektidentifiering. Azure AI Vision bygger anpassade modeller på den förtränade grundmodellen, vilket innebär att du kan träna avancerade modeller med hjälp av relativt få träningsbilder.
Bildklassificering
En bildklassificeringsmodell används för att förutsäga kategorin eller klassen för en bild. Du kan till exempel träna en modell för att avgöra vilken typ av frukt som visas i en bild, så här:
| Äpple | Banan | Apelsin | 
|---|---|---|
               
              
             | 
               
              
             | 
               
              
             | 
Objektdetektering
Objektidentifieringsmodeller identifierar och klassificerar objekt i en bild och returnerar koordinater för avgränsningsrutor för att hitta varje objekt. Förutom de inbyggda objektidentifieringsfunktionerna i Azure AI Vision kan du träna en anpassad objektidentifieringsmodell med dina egna bilder. Du kan till exempel använda fotografier av frukt för att träna en modell som identifierar flera frukter i en bild, så här:
              
              
            
Anmärkning
Information om hur du använder Azure AI Vision för att träna en anpassad modell ligger utanför omfånget för den här modulen. Du hittar information om anpassad modellträning i Dokumentationen om Azure AI Vision.
Nu ska vi titta på funktioner som är specifika för Ansiktstjänsten för Azure AI Vision.