Förstå funktioner för bildanalys i Azure AI Vision

4 minuter

Azure AI Visions bildanalysfunktioner kan användas med eller utan anpassning. Några av de funktioner som inte kräver anpassning är:

Beskriva en bild med bildtexter
Identifiera vanliga objekt i en bild
Tagga visuella egenskaper
Optisk teckenigenkänning

Beskriva en bild med bildtexter

Azure AI Vision har möjlighet att analysera en bild, utvärdera objekten i den och generera en människoläsbar beskrivning av bilden. Tänk till exempel på följande bild:

Diagram över en person på en skateboard.

Azure AI Vision returnerar följande bildtext för den här bilden:

En person hoppar på en skateboard

Identifiera vanliga objekt i en bild

Azure AI Vision kan identifiera tusentals vanliga objekt i bilder. När det till exempel används för att identifiera objekt i skateboarder-avbildningen som beskrevs tidigare returnerar Azure AI Vision följande förutsägelser:

Skateboard (90,40%)
Person (95,5%)

Förutsägelserna innehåller en konfidenspoäng som anger hur säker modellen är på att det den beskriver är vad som faktiskt finns i bilden.

Utöver de identifierade objektetiketterna och deras sannolikheter returnerar Azure AI Vision koordinater för avgränsningsrutor som anger det identifierade objektets övre, vänstra, bredd och höjd. Du kan använda dessa koordinater för att avgöra var i bilden varje objekt identifierades, så här:

Diagram över en skateboardåkare med markeringsramar kring identifierade objekt.

Tagga visuella egenskaper

Azure AI Vision kan föreslå taggar för en bild baserat på dess innehåll. Taggar är associerade med bilder som metadata. Taggarna sammanfattar bildens attribut. Du kan använda taggar för att indexering av en bild tillsammans med en uppsättning nyckeltermer för en söklösning.

Taggarna som returneras för skateboarder-avbildningen (med associerade konfidenspoäng) inkluderar till exempel:

sport (99,60%)
person (99,56%)
skodon (98,05%)
skridskoåkning (96,27%)
boardsport (95,58%)
skateboardutrustning (94,43%)
kläder (94,02%)
vägg (93,81%)
skateboarding (93,78%)
skateboardåkare (93,25%)
individuella sporter (92.80%)
street stunts (90,81%)
saldo (90,81%)
hoppar (89,87%)
sportutrustning (88,61%)
extremsport (88,35%)
kickflip (88,18%)
stunt (87,27%)
skateboard (86,87%)
stuntman (85,83%)
knä (85,30%)
sport (85,24%)
longboard (84,61%)
longboarding (84,45%)
ridning (73,37%)
skate (67,27%)
luft (64,83%)
ung (63,29%)
utomhus (61,39%)

Optisk teckenigenkänning

Tjänsten Azure AI Vision kan använda funktioner för optisk teckenigenkänning (OCR) för att identifiera text i bilder. Tänk till exempel på följande bild av en näringsetikett på en produkt i en livsmedelsbutik:

Diagram över en näringsetikett.

Tjänsten Azure AI Vision kan analysera den här bilden och extrahera följande text:

Nutrition Facts Amount Per Serving
Serving size:1 bar (40g)
Serving Per Package: 4
Total Fat 13g
Saturated Fat 1.5g
Amount Per Serving
Trans Fat 0g
calories 190
Cholesterol 0mg
ories from Fat 110
Sodium 20mg
ntDaily Values are based on
Vitamin A 50
calorie diet

Träna anpassade modeller

Om de inbyggda modellerna som tillhandahålls av Azure AI Vision inte uppfyller dina behov kan du använda tjänsten för att träna en anpassad modell för bildklassificering eller objektidentifiering. Azure AI Vision bygger anpassade modeller på den förtränade grundmodellen, vilket innebär att du kan träna avancerade modeller med hjälp av relativt få träningsbilder.

Bildklassificering

En bildklassificeringsmodell används för att förutsäga kategorin eller klassen för en bild. Du kan till exempel träna en modell för att avgöra vilken typ av frukt som visas i en bild, så här:

Äpple	Banan	Apelsin

Objektdetektering

Objektidentifieringsmodeller identifierar och klassificerar objekt i en bild och returnerar koordinater för avgränsningsrutor för att hitta varje objekt. Förutom de inbyggda objektidentifieringsfunktionerna i Azure AI Vision kan du träna en anpassad objektidentifieringsmodell med dina egna bilder. Du kan till exempel använda fotografier av frukt för att träna en modell som identifierar flera frukter i en bild, så här:

Diagram över flera identifierade frukter i en bild.

Anmärkning

Information om hur du använder Azure AI Vision för att träna en anpassad modell ligger utanför omfånget för den här modulen. Du hittar information om anpassad modellträning i Dokumentationen om Azure AI Vision.

Nu ska vi titta på funktioner som är specifika för Ansiktstjänsten för Azure AI Vision.

Feedback

Var den här sidan till hjälp?