Inzicht in de mogelijkheden van Azure AI Vision-afbeeldingsanalyse
De mogelijkheden voor afbeeldingsanalyse van Azure AI Vision kunnen worden gebruikt met of zonder aanpassingen. Enkele van de mogelijkheden waarvoor geen aanpassing is vereist, zijn:
- Een afbeelding beschrijven met bijschriften
- Algemene objecten in een afbeelding detecteren
- Visuele kenmerken labelen
- Optische tekenherkenning
Een afbeelding beschrijven met bijschriften
Azure AI Vision biedt de mogelijkheid om een afbeelding te analyseren, de objecten erin te evalueren en een door mensen leesbare beschrijving van de afbeelding te genereren. Bekijk bijvoorbeeld de volgende afbeelding:
Azure AI Vision retourneert het volgende bijschrift voor deze afbeelding:
Een persoon die op een skateboard springt
Algemene objecten in een afbeelding detecteren
Azure AI Vision kan duizenden algemene objecten in afbeeldingen identificeren. Wanneer azure AI Vision bijvoorbeeld wordt gebruikt om objecten in de skateboarder-afbeelding te detecteren die eerder zijn besproken, retourneert Azure AI Vision de volgende voorspellingen:
- Skateboard (90.40%)
- Persoon (95,5%)
De voorspellingen bevatten een betrouwbaarheidsscore die aangeeft hoe zeker het model is dat wat het model beschrijft wat er daadwerkelijk in de afbeelding staat.
Naast de gedetecteerde objectlabels en hun waarschijnlijkheden retourneert Azure AI Vision begrenzingsvakcoördinaten die de boven-, linker-, breedte- en hoogte van het gedetecteerde object aangeven. U kunt deze coördinaten gebruiken om te bepalen waar in de afbeelding elk object is gedetecteerd, zoals deze:
Visuele kenmerken labelen
Azure AI Vision kan tags voor een afbeelding voorstellen op basis van de inhoud. Tags zijn gekoppeld aan afbeeldingen als metagegevens. De tags bevatten een overzicht van kenmerken van de afbeelding. U kunt tags gebruiken om een afbeelding te indexeren, samen met een set sleuteltermen voor een zoekoplossing.
De tags die worden geretourneerd voor de skateboarder-afbeelding (met bijbehorende betrouwbaarheidsscores) zijn bijvoorbeeld:
- sport (99.60%)
- persoon (99,56%)
- schoenen (98.05%)
- schaatsen (96.27%)
- boardsport (95.58%)
- skateboarding apparatuur (94.43%)
- kleding (94.02%)
- wand (93.81%)
- skateboarden (93.78%)
- skateboarder (93.25%)
- individuele sporten (92.80%)
- straat stunts (90.81%)
- saldo (90,81%)
- springen (89,87%)
- sportuitrusting (88,61%)
- extreme sport (88.35%)
- kickflip (88.18%)
- stunt (87.27%)
- skateboard (86.87%)
- stuntuitvoerder (85.83%)
- knie (85.30%)
- sport (85,24%)
- longboard (84,61%)
- longboarding (84,45%)
- rijden (73.37%)
- skate (67.27%)
- lucht (64,83%)
- jong (63.29%)
- buiten (61.39%)
Optische tekenherkenning
De Azure AI Vision-service kan ocr-mogelijkheden (optical character recognition) gebruiken om tekst in afbeeldingen te detecteren. Denk bijvoorbeeld aan de volgende afbeelding van een voedingslabel op een product in een supermarkt:
De Azure AI Vision-service kan deze afbeelding analyseren en de volgende tekst extraheren:
Nutrition Facts Amount Per Serving
Serving size:1 bar (40g)
Serving Per Package: 4
Total Fat 13g
Saturated Fat 1.5g
Amount Per Serving
Trans Fat 0g
calories 190
Cholesterol 0mg
ories from Fat 110
Sodium 20mg
ntDaily Values are based on
Vitamin A 50
calorie diet
Trainen van aangepaste modellen
Als de ingebouwde modellen van Azure AI Vision niet aan uw behoeften voldoen, kunt u de service gebruiken om een aangepast model te trainen voor afbeeldingsclassificatie of objectdetectie. Azure AI Vision bouwt aangepaste modellen op het vooraf getrainde basismodel, wat betekent dat u geavanceerde modellen kunt trainen met behulp van relatief weinig trainingsafbeeldingen.
Afbeeldingsclassificatie
Een afbeeldingsclassificatiemodel wordt gebruikt om de categorie of klasse van een afbeelding te voorspellen. U kunt bijvoorbeeld een model trainen om te bepalen welk type fruit wordt weergegeven in een afbeelding, zoals:
| Appel | Banaan | Oranje |
|---|---|---|
|
|
|
Objectdetectie
Objectdetectiemodellen detecteren en classificeren objecten in een afbeelding, waarbij begrenzingsvakcoördinaten worden geretourneerd om elk object te vinden. Naast de ingebouwde mogelijkheden voor objectdetectie in Azure AI Vision kunt u een aangepast objectdetectiemodel trainen met uw eigen afbeeldingen. U kunt bijvoorbeeld foto's van fruit gebruiken om een model te trainen dat meerdere vruchten in een afbeelding detecteert, zoals:
Opmerking
Details over het gebruik van Azure AI Vision voor het trainen van een aangepast model vallen buiten het bereik van deze module. U vindt informatie over aangepaste modeltrainingen in de Documentatie van Azure AI Vision.
Laten we nu kijken naar mogelijkheden die specifiek zijn voor de Face-service van Azure AI Vision.