Inzicht in de mogelijkheden van Azure AI Vision-afbeeldingsanalyse

Voltooid

De mogelijkheden voor afbeeldingsanalyse van Azure AI Vision kunnen worden gebruikt met of zonder aanpassingen. Enkele van de mogelijkheden waarvoor geen aanpassing is vereist, zijn:

  • Een afbeelding beschrijven met bijschriften
  • Algemene objecten in een afbeelding detecteren
  • Visuele kenmerken labelen
  • Optische tekenherkenning

Een afbeelding beschrijven met bijschriften

Azure AI Vision biedt de mogelijkheid om een afbeelding te analyseren, de objecten erin te evalueren en een door mensen leesbare beschrijving van de afbeelding te genereren. Bekijk bijvoorbeeld de volgende afbeelding:

Diagram van een persoon op een skateboard.

Azure AI Vision retourneert het volgende bijschrift voor deze afbeelding:

Een persoon die op een skateboard springt

Algemene objecten in een afbeelding detecteren

Azure AI Vision kan duizenden algemene objecten in afbeeldingen identificeren. Wanneer azure AI Vision bijvoorbeeld wordt gebruikt om objecten in de skateboarder-afbeelding te detecteren die eerder zijn besproken, retourneert Azure AI Vision de volgende voorspellingen:

  • Skateboard (90.40%)
  • Persoon (95,5%)

De voorspellingen bevatten een betrouwbaarheidsscore die aangeeft hoe zeker het model is dat wat het model beschrijft wat er daadwerkelijk in de afbeelding staat.

Naast de gedetecteerde objectlabels en hun waarschijnlijkheden retourneert Azure AI Vision begrenzingsvakcoördinaten die de boven-, linker-, breedte- en hoogte van het gedetecteerde object aangeven. U kunt deze coördinaten gebruiken om te bepalen waar in de afbeelding elk object is gedetecteerd, zoals deze:

Diagram van een skateboarder met begrenzingsvakken rond gedetecteerde objecten.

Visuele kenmerken labelen

Azure AI Vision kan tags voor een afbeelding voorstellen op basis van de inhoud. Tags zijn gekoppeld aan afbeeldingen als metagegevens. De tags bevatten een overzicht van kenmerken van de afbeelding. U kunt tags gebruiken om een afbeelding te indexeren, samen met een set sleuteltermen voor een zoekoplossing.

De tags die worden geretourneerd voor de skateboarder-afbeelding (met bijbehorende betrouwbaarheidsscores) zijn bijvoorbeeld:

  • sport (99.60%)
  • persoon (99,56%)
  • schoenen (98.05%)
  • schaatsen (96.27%)
  • boardsport (95.58%)
  • skateboarding apparatuur (94.43%)
  • kleding (94.02%)
  • wand (93.81%)
  • skateboarden (93.78%)
  • skateboarder (93.25%)
  • individuele sporten (92.80%)
  • straat stunts (90.81%)
  • saldo (90,81%)
  • springen (89,87%)
  • sportuitrusting (88,61%)
  • extreme sport (88.35%)
  • kickflip (88.18%)
  • stunt (87.27%)
  • skateboard (86.87%)
  • stuntuitvoerder (85.83%)
  • knie (85.30%)
  • sport (85,24%)
  • longboard (84,61%)
  • longboarding (84,45%)
  • rijden (73.37%)
  • skate (67.27%)
  • lucht (64,83%)
  • jong (63.29%)
  • buiten (61.39%)

Optische tekenherkenning

De Azure AI Vision-service kan ocr-mogelijkheden (optical character recognition) gebruiken om tekst in afbeeldingen te detecteren. Denk bijvoorbeeld aan de volgende afbeelding van een voedingslabel op een product in een supermarkt:

diagram van een voedingslabel.

De Azure AI Vision-service kan deze afbeelding analyseren en de volgende tekst extraheren:

Nutrition Facts Amount Per Serving
Serving size:1 bar (40g)
Serving Per Package: 4
Total Fat 13g
Saturated Fat 1.5g
Amount Per Serving
Trans Fat 0g
calories 190
Cholesterol 0mg
ories from Fat 110
Sodium 20mg
ntDaily Values are based on
Vitamin A 50
calorie diet

Trainen van aangepaste modellen

Als de ingebouwde modellen van Azure AI Vision niet aan uw behoeften voldoen, kunt u de service gebruiken om een aangepast model te trainen voor afbeeldingsclassificatie of objectdetectie. Azure AI Vision bouwt aangepaste modellen op het vooraf getrainde basismodel, wat betekent dat u geavanceerde modellen kunt trainen met behulp van relatief weinig trainingsafbeeldingen.

Afbeeldingsclassificatie

Een afbeeldingsclassificatiemodel wordt gebruikt om de categorie of klasse van een afbeelding te voorspellen. U kunt bijvoorbeeld een model trainen om te bepalen welk type fruit wordt weergegeven in een afbeelding, zoals:

Appel Banaan Oranje
Diagram van een appel. Diagram van een banaan. diagram van een oranje.

Objectdetectie

Objectdetectiemodellen detecteren en classificeren objecten in een afbeelding, waarbij begrenzingsvakcoördinaten worden geretourneerd om elk object te vinden. Naast de ingebouwde mogelijkheden voor objectdetectie in Azure AI Vision kunt u een aangepast objectdetectiemodel trainen met uw eigen afbeeldingen. U kunt bijvoorbeeld foto's van fruit gebruiken om een model te trainen dat meerdere vruchten in een afbeelding detecteert, zoals:

diagram van meerdere gedetecteerde vruchten in een afbeelding.

Opmerking

Details over het gebruik van Azure AI Vision voor het trainen van een aangepast model vallen buiten het bereik van deze module. U vindt informatie over aangepaste modeltrainingen in de Documentatie van Azure AI Vision.

Laten we nu kijken naar mogelijkheden die specifiek zijn voor de Face-service van Azure AI Vision.