Inledning

Slutförd

Datorseende är ett av huvudområdena inom artificiell intelligens (AI) och fokuserar på att skapa lösningar som gör det möjligt för AI-applikationer att bearbeta visuell information.

Tänk på följande scenarier:

  • Ett autonomt fordon måste upptäcka och reagera på trafik och fotgängare.
  • En butik använder smarta kassar med kameror för att fastställa produkterna i en kunds korg.
  • En dörrklocka kamera används för att identifiera människor vid din ytterdörr.

Dessa användningsfall, och många andra, förlitar sig på datorsyn.

Naturligtvis har datorer inte biologiska ögon som fungerar som våra, men de kan bearbeta bilder; antingen från ett livekameraflöde eller från digitala fotografier eller videor. Den här möjligheten att bearbeta bilder är nyckeln till att skapa programvara som kan emulera mänsklig visuell uppfattning. I den här modulen undersöker vi de byggstenar som ligger till grund för moderna datorseendelösningar.

Anmärkning

Vi inser att olika personer gillar att lära sig på olika sätt. Du kan välja att slutföra den här modulen i videobaserat format eller läsa innehållet som text och bilder. Texten innehåller mer detaljer än videorna, så i vissa fall kanske du vill referera till den som kompletterande material till videopresentationen.