Dela via


Kom igång med Azure Data Factory

GÄLLER FÖR: Azure Data Factory Azure Synapse Analytics

Tips

Prova Data Factory i Microsoft Fabric, en allt-i-ett-analyslösning för företag. Microsoft Fabric omfattar allt från dataflytt till datavetenskap, realtidsanalys, business intelligence och rapportering. Lär dig hur du startar en ny utvärderingsversion kostnadsfritt!

Välkommen till Azure Data Factory! Den här artikeln hjälper dig att skapa din första datafabrik och pipeline på fem minuter.

Azure Resource Manager-mallen (ARM-mallen) i denna artikel skapar och konfigurerar allt du behöver. Gå sedan till din demo-datatillverkningsanläggning och utlös pipeline, som flyttar några provdata från en mapp i Azure Blob Storage till en annan.

Förutsättningar

Om du inte har någon Azure-prenumeration skapar du ett kostnadsfritt konto innan du börjar.

Videosammanfattning

Följande video innehåller en genomgång av exemplet i den här artikeln:

Steg 1: Använd demonstrationen för att skapa resurser

I det här demoscenariot använder du kopieringsaktiviteten i en datafabrik för att kopiera en blob med namnet moviesDB2.csv från en indatamapp i Azure Blob Storage till en utdatamapp. I ett verkligt användningsscenario kan kopieringen vara mellan de många stödda datakällor och mottagare som finns i tjänsten. Det kan också omfatta transformeringar i data.

  1. Välj följande knapp.

    Prova din första demonstration av datafabriken

    När du väljer knappen skapas följande Azure-resurser:

    • Ett Azure Data Factory-konto
    • En datafabrik som innehåller en pipeline med en kopieringsaktivitet
    • Ett Azure Blob Storage-konto med moviesDB2.csv uppladdat till en indatamapp som källa
    • En länkad tjänst för att ansluta datafabriken till Blob Storage
  2. Du dirigeras till konfigurationssidan för att distribuera mallen. På den här sidan:

    1. För Resursgrupp väljer du Skapa ny för att skapa en resursgrupp. Du kan lämna alla andra värden med deras standardvärden.

    2. Välj Granska + skapa och välj sedan Skapa för att distribuera resurserna.

    Skärmbild av sidan för att distribuera en mall för att skapa resurser.

Note

Användaren som distribuerar mallen måste tilldela en roll till en hanterad identitet. Det här steget kräver behörigheter som kan beviljas via rollen Ägare, Administratör för användaråtkomst eller Hanterad identitetsoperator.

Alla resurser i denna demo skapas i den nya resursgruppen, så att du enkelt kan rensa dem senare.

Steg 2: Granska distribuerade resurser

  1. I meddelandet som visar att distributionen har slutförts väljer du Gå till resursgrupp.

    Skärmdump av Azure-portalsidan som visar framgångsrik implementering av demomallen.

  2. Resursgruppen inkluderar den nya datafabriken, Blob-lagringskontot och den hanterade identitet som distributionen skapade. Välj datafabriken i resursgruppen för att visa den.

    Skärmbild av innehållet i resursgruppen som skapades för demonstrationen, med datafabriken markerad.

  3. Välj knappen Launch studio.

    Skärmbild av Azure-portalen som visar information om den nyligen skapade datafabriken med knappen för att öppna Azure Data Factory Studio markerad.

  4. Inom Azure Data Factory Studio:

    1. Välj fliken Författare.Author tab
    2. Välj den pipeline som mallen skapade.
    3. Kontrollera källdata genom att välja Open.

    Skärmbild av Azure Data Factory Studio som visar pipelinen skapad av mallen.

  5. I källdatasettet, välj Bläddra för att visa den indatafil som skapats för demonstrationen.

    Skärmdump av datamängdskällan, med knappen

    Observera filen moviesDB2.csv, som redan har laddats upp i inmatningsmappen.

    Skärmbild av innehållet i indatamappen som visar indatafilen som användes i demonstrationen.

Steg 3: Utlös demopipelinen för körning

  1. Välj Lägg till trigger, och välj sedan Trigga nu.

    Skärmdump av knappen för att starta demo-pipelinen.

  2. På den högra panelen, under Pipeline körning, välj OK.

Övervaka arbetsflödet

  1. Välj fliken ÖvervakaMonitor tab. Den här fliken ger en översikt över dina pipeline-körningar, inklusive starttid och status.

    Skärmdump av fliken för övervakning av pipelines körningar i en datafabrik.

  2. I den här snabbstarten har pipelinen bara en aktivitetstyp: Kopiera data. Välj pipelinens namn för att visa detaljerna för kopieringsaktivitetens körresultat.

    Skärmdump av körresultaten för en kopieringsaktivitet på fliken för övervakning av en datafabrik.

  3. Välj ikonen Detaljer för att visa den detaljerade kopieringsprocessen. I resultaten är Data läst och Data skrivet storlekar lika, och en fil lästes och skrevs. Denna information bevisar att all data kopierades framgångsrikt till destinationen.

    Skärmbild av detaljerade körningsresultat för en kopieringsaktivitet.

Rensa resurser

Du kan städa upp alla resurser som du skapade i den här artikeln på två olika sätt:

  • Du kan ta bort hela Azure-resursgruppen, som innehåller alla resurser som skapats i den.

  • Om du vill behålla vissa resurser intakta går du till resursgruppen och tar bara bort de specifika resurser som du vill ta bort.

    Om du till exempel använder den här mallen för att skapa en datafabrik för användning i en annan självstudie kan du ta bort de andra resurserna men bara behålla datafabriken.

I denna artikel skapade du en datafabrik som innehåller en datarörledning med en kopieringsaktivitet. För att lära dig mer om Azure Data Factory, fortsätt till följande artikel och träningsmodul: