Dela via


Användningsfall för Custom Vision

Viktigt!

Översättningar som inte är engelska tillhandahålls endast för enkelhetens skull. Se versionen EN-US av det här dokumentet för den slutgiltiga versionen.

Vad är en transparensanteckning?

Ett AI-system omfattar inte bara tekniken, utan även de personer som ska använda den, de personer som påverkas av den och miljön där den distribueras. Att skapa ett system som är lämpligt för sitt avsedda syfte kräver en förståelse för hur tekniken fungerar, dess funktioner och begränsningar och hur du uppnår bästa prestanda. Microsofts transparensanteckningar är avsedda att hjälpa dig att förstå hur vår AI-teknik fungerar, vilka val systemägare kan göra som påverkar systemets prestanda och beteende samt vikten av att tänka på hela systemet, inklusive teknik, människor och miljö. Du kan använda Transparensanteckningar när du utvecklar eller distribuerar ditt eget system eller delar dem med de personer som kommer att använda eller påverkas av systemet.

Microsofts Transparensanteckningar är en del av ett bredare arbete hos Microsoft för att omsätta våra AI-principer i praktiken. Mer information finns i Microsoft AI-principerna.

Introduktion till Custom Vision

Custom Vision är en tjänst för bildigenkänning som gör att du kan skapa, distribuera och förbättra ditt eget system för bildidentifiering. Tjänsten klassificerar bilder eller identifierar objekt i bilder baserat på deras visuella egenskaper, så att du kan ange de kategorier som ska förutsägas och exempelbilder som systemet kan lära sig av.

Vad Custom Vision gör

Custom Vision-tjänsten använder maskininlärning för att analysera bilder. Du skickar bilder som både inkluderar och saknar de aktuella egenskaperna. Du märker bilderna själv. Sedan tränar algoritmen sig själv med dessa data och beräknar sin egen noggrannhet genom att testa sig själv på samma bilder. När du har tränat algoritmen kan du testa, träna om och så småningom använda den i bildigenkänningsprogrammet eller lösningen för att härleda förutsägelser på nya bilder. Du kan också exportera själva modellen för offlineanvändning.

Mer information finns i Vad är Custom Vision?.

Termer och definitioner

Term Definition
Basmodell Basmodeller är en kombination av modellarkitektur och träningsdata som används för att justera arkitekturen för en viss typ av uppgift (till exempel bildklassificering eller objektidentifiering). Basmodeller är byggda av Microsoft och används som utgångspunkt för överföringsinlärningsprocessen för olika domäner som General, Food, Landmarks, Retail, Logos och Products on Shelves.
Modellträning Detta avser processen för att träna en modell baserat på kundtilldelade märkta bilder.
Transferinlärning Användning av kundspecifika träningsdata för att träna om en basmodell för att åtgärda det specifika problem som kunden försöker lösa. Träningsdata kan vara en kombination av de klasser som de vill känna igen och typen av bilder.
Klass En tränad modell har en uppsättning klasser som tilldelas när en indatabild analyseras. När du skapar en modell med Custom Vision definierar du den uppsättning klasser som du vill att modellen ska mata ut och tillhandahåller märkta träningsdata för var och en av klasserna.
Klass och noggrannhetspar Paret med klassnoggrannhet är en uppsättning med två värden som består av klassens namn och ett flyttalvärde för den konfidenspoäng som är associerad med klassidentifieringen. En klass kan till exempel vara en typ av frukt som en ananas eller päron som representeras i bilduppsättningen. Klass-noggrannhetspar är den specifika klassen och konfidensvärdet för att klassen finns i bilden (t.ex. Ananas: 93,53%).
Bildklassificeringsfunktion Den här funktionen tar en bild som indata och matar ut en uppsättning klassnoggrannhetspar som är egenskaper på bildnivå (de anger inte någon plats i bilden). Ett exempel på ett par kan vara frukt mot icke-frukt, där majoriteten av bilden upptas av respektive kategori.
Objektidentifieringsfunktion Den här funktionen tar en bild som indata och matar ut en uppsättning klassnoggrannhetspar som även innehåller koordinaterna för avgränsningsrutan där i bilden dessa klasser upptäcktes. Modellen kan till exempel identifiera koordinaterna för avgränsningsrutan för var ett fordon finns i bilden.
Begränsningsbox En uppsättning med fyra numeriska värden som representerar x,y-pixelkoordinaterna i det övre vänstra hörnet av det identifierade objektet i förhållande till bildens övre vänstra hörn, bredden på det identifierade objektet, bredden på det identifierade objektet.
Projekt En logisk gruppering som omfattar träningsdata, modeller som tränats från dessa data och de förutsägelseslutpunkter som skapats för dessa modeller.

Funktioner i Custom Vision

Custom Visions funktioner kan delas in i två funktioner. Bildklassificering tillämpar en eller flera etiketter på en bild. Objektidentifiering returnerar koordinaterna i bilden där de tillämpade etiketterna kan hittas för identifierade objekt. Båda funktionerna levereras via API:er, SDK:er och en webbplats: https://customvision.ai.

Custom Vision stöder skapande och användning av anpassade Azure AI Vision-modeller via följande funktioner på hög nivå. De representerar de två kärnaktiviteter som du kommer att slutföra för att förbereda din modell för användning:

  • Dataetiketter är processen att kommentera träningsbilderna med de klasser av bilder som modellen behöver klassificera. När det gäller objektidentifiering kommenterar du träningsbilderna med avgränsningsrutor som omger objektet som ska identifieras i bilden. Custom Vision ger dig en webbportal där du kan märka träningsbilder med klasser som du väljer. När träningsdata har märkts kan du använda dem för att träna modellen.

  • Modellträning använder basmodellen och överföringsinlärning för att träna en modell som är optimerad för kundanpassade bilder och motsvarande klasser. Modellens kvalitet är starkt beroende av volymen och kvaliteten på träningsdata som du tillhandahåller. Custom Vision tillhandahåller noggrannhetsmått för att approximera modellprestanda baserat på en uppdelning av de träningsdata som tillhandahålls.

När du är redo att använda din modell kan du göra en modellförutsägelse genom att skicka en bild för bearbetning. Du kan antingen vara värd för modellen i Custom Service-molnet eller så kan du exportera modellen i olika format som du vill.

För att förbättra kvaliteten på din modell över tid kan du samla in urvalsdata från din produktionsmiljö, eller samla in mer data och träna om modellen när dessa data har etiketterats. För att hjälpa till med den här processen kan du använda smart etikettering, vilket föreslår etiketter för en uppsättning bilder som du laddar upp.

Exempel på användningsfall

Du kan använda Azure AI Custom Vision för följande scenarier:

  • Automatiska visuella aviseringar: Möjligheten att övervaka en videoström och få aviseringar utlösta när vissa omständigheter identifieras. Du kanske till exempel vill ha en avisering när ånga upptäcks, skum på en flod eller om ett djur finns.
  • Förbättrad effektivitet vid manuell inspektion: I detaljhandeln kan du med produktigenkänning minska den tid som du eller medarbetare lägger på att räkna unika SKU:er, eller identifiera om alla SKU:er som ska finnas på en hylla finns.
  • Utökad inspektionstäckning: Vid identifiering av defekter är det inte alltid möjligt för en människa att granska alla artiklar som kommer från en tillverkningslinje. I stället kan du använda Custom Vision för att täcka den uppsättning objekt som du inte kan inspektera manuellt, samt informera vilka objekt du inspekterar manuellt.
  • Förbättra objektidentifiering: Att märka dina bilder med metadata kan göra dem enklare att hitta senare. Du kan till exempel tagga bilderna baserat på produktkatalogen eller andra visuella funktioner som du är intresserad av att filtrera på. Med Custom Vision kan du märka bilder med metadata vid tidpunkten för inmatningen.

Att tänka på när du väljer ett användningsfall

Vi uppmuntrar kunderna att använda Custom Vision i sina innovativa lösningar eller program. Här är dock några saker att tänka på när du väljer ett användningsfall:

  • Inte lämplig för ansiktsdetektering eller ansiktsigenkänning. Custom Vision har inte utformats eller testats för att identifiera eller identifiera individer i bilder. Överväg i stället att använda Azure AI-tjänster Face som har flera ansiktsdetektorer tillgängliga för användning.

  • Inte lämplig för biometrisk identifiering. Custom Vision har inte utformats eller testats för att verifiera enskilda personers identitet baserat på biometriska markörer som irisigenkänning, fingeravtrycksidentifiering eller pass eller andra former av ID för identifiering och verifiering av en person.

  • Inte lämplig för träning av anpassade modeller för storskaliga uppsättningar av bilder som innehåller hundratals klasser och taggar. Azure AI Vision har dessa funktioner som färdiga modeller för storskalig bildbearbetning med tusentals taggar.

  • Inte lämplig för att identifiera eller extrahera text. Custom Vision har inte utformats eller testats för bearbetning av text i bilder. Använd optisk teckenigenkänning (OCR) för det här ändamålet i stället.

  • Inte lämplig för att generera en läsbar beskrivning av bilder som kan användas som alternativtext i hjälpmedelssyfte. Custom Vision har inte utformats eller testats för att generera beskrivningar för detta ändamål. Azure AI Vision har dessa funktioner för att generera bildbeskrivningar och är lämpligast för detta ändamål.

  • Använd inte Custom Vision för medicinsk diagnos , inklusive för användning som medicinteknisk enhet, kliniskt stöd, diagnostikverktyg eller annan teknik som är avsedd att användas för diagnos, botemedel, lindring, behandling eller förebyggande av sjukdomar eller andra tillstånd, och ingen licens eller rätt beviljas av Microsoft att använda denna funktion för sådana ändamål. Denna funktion är inte utformad eller avsedd att genomföras eller användas som ersättning för professionell medicinsk rådgivning eller hälso- och sjukvårdsutlåtande, diagnos, behandling eller klinisk bedömning av en sjukvårdspersonal, och bör inte användas som sådan. Kunden är ensam ansvarig för all användning av Custom Vision för medicinsk diagnos.

  • Juridiska och regelmässiga överväganden: Organisationer måste utvärdera potentiella specifika juridiska och regelmässiga skyldigheter när de använder AI-tjänster och lösningar, vilket kanske inte är lämpligt för användning i alla branscher eller scenarion. Dessutom är AI-tjänster eller lösningar inte utformade för och får inte användas på sätt som är förbjudna i tillämpliga användningsvillkor och relevanta uppförandekoder.

Nästa steg