Dela via


Snabbstart: Skapa ditt första dataflöde för att hämta och transformera data

Dataflöden är en molnbaserad dataförberedelseteknik med självbetjäning. I den här artikeln skapar du ditt första dataflöde, hämtar data för ditt dataflöde och transformerar sedan data och publicerar dataflödet.

Förutsättningar

Följande krav krävs innan du börjar:

Skapa ett dataflöde

I det här avsnittet skapar du ditt första dataflöde.

  1. Gå till din Microsoft Fabric-arbetsyta.

    Skärmbild av fönstret arbetsytor där du navigerar till din arbetsyta.

  2. Välj +Nytt objekt och välj sedan Dataflöde Gen2.

    Skärmbild med markeringen Dataflöde Gen2 framhävd.

Hämta data

Nu ska vi hämta lite data! I det här exemplet får du data från en OData-tjänst. Använd följande steg för att hämta data i ditt dataflöde.

  1. I dataflödesredigeraren väljer du Hämta data och sedan Mer.

    Skärmbild med alternativet Hämta data markerat och Mer framhävt i listrutan.

  2. I Välj datakälla väljer du Visa mer.

    Skärmbild av Hämta datakälla med Visa mer framhävd.

  3. I Ny källa väljer du Andra>OData som datakälla.

    Skärmbild av Hämta datakälla med kategorin Övrigt och OData-anslutningsappen framhävd.

  4. Ange URL:en https://services.odata.org/v4/northwind/northwind.svc/och välj sedan Nästa.

    Skärmbild av OData-datakällan där du anger data-URL:en.

  5. Välj tabellerna Beställningar och Kunder och välj sedan Skapa.

    Skärmbild av Power Query-navigatören med tabellerna Kunder och Beställningar framhävd.

Du kan lära dig mer om erfarenhet av datahämtning och funktioner i översikten för datahämtning.

Tillämpa transformeringar och publicera

Du läste in dina data i ditt första dataflöde. Grattis! Nu är det dags att tillämpa ett par transformeringar för att föra dessa data till den form vi behöver.

Du transformerar data i Power Query-redigeraren. Du hittar en detaljerad översikt över Power Query-redigeraren i Power Query-användargränssnittet, men det här avsnittet tar dig igenom de grundläggande stegen:

  1. Kontrollera att verktygen för dataprofilering är aktiverade. Gå tillGlobala alternativ för>> och välj sedan alla alternativ under Kolumnprofil.

    Skärmbild av globala alternativ med kolumnprofilvalen framhävde.

    Se också till att du aktiverar diagramvyn med hjälp av layoutkonfigurationerna under fliken Visa i menyfliksområdet i Power Query-redigeraren, eller genom att välja diagramvyikonen längst ned till höger i Power Query-fönstret.

    Skärmbild av det övergripande utseendet i Power Query-diagramvyn.

  2. I tabellen Beställningar beräknar du det totala antalet beställningar per kund: Välj kolumnen CustomerID i dataförhandsgranskningen och välj sedan Gruppera efter under fliken Transformera i menyfliksområdet.

    Skärmbild som visar tabellen Beställningar markerad och Gruppera efter framhävd på fliken Transformera.

  3. Du utför antalet rader som aggregering i Gruppera efter. Du kan lära dig mer om Group By-funktioner i Gruppera eller sammanfatta rader.

    Skärmbild av Gruppera efter med åtgärden Antal rader markerad.

  4. När vi har grupperat data i tabellen Beställningar hämtar vi en tabell med två kolumner med CustomerID och Count som kolumner.

    Skärmbild av tabellen med två kolumner.

  5. Sedan vill du kombinera data från tabellen Kunder med antalet beställningar per kund: Välj frågan Kunder i diagramvyn och använd menyn "⋮" för att komma åt sammanfoga frågor som ny transformering.

    Skärmbild av dataflödesredigeraren med den lodräta ellipsen i tabellen Kunder och Sammanfoga frågor som ny framhävd.

  6. Konfigurera sammanslagningsåtgärden genom att välja CustomerID som matchande kolumn i båda tabellerna. Välj sedan Ok.

    Skärmbild av sammanslagningsfönstret.

    Skärmbild av fönstret Slå samman med tabellen Vänster för sammanslagning inställd på tabellen Kunder och tabellen Höger för sammanslagning inställd på tabellen Beställningar. Kolumnen CustomerID har valts för tabellerna Kunder och Beställningar. Kopplingstyp är också inställd på Vänster yttre. Alla andra val är inställda på deras standardvärde.

  7. Nu finns det en ny fråga med alla kolumner från tabellen Kunder och en kolumn med kapslade data från tabellen Beställningar.

    Skärmbild av dataflödesredigeraren med den nya sammanslagningsfrågan till höger om tabellerna Kunder och Beställningar.

  8. Nu ska vi fokusera på några få kolumner från tabellen Kunder. Det gör du genom att aktivera schemavyn genom att välja knappen schemavy i det nedre högra hörnet i dataflödesredigeraren.

    Skärmbild av dataflödesredigeraren med knappen schemavy framhävd i det nedre högra hörnet.

  9. I schemavyn ser du alla kolumner i tabellen. Välj CustomerID, CompanyName och Orders (2). Gå sedan till fliken Schemaverktyg , välj Ta bort kolumner och välj Ta bort andra kolumner. Detta behåller bara de kolumner du vill ha.

    Skärmbild av schemavyn som visar alla tillgängliga kolumnnamn, med kolumnerna CustomerID, CompanyName och Orders (2) framhävd.

    Skärmbild av menyn schemaverktyg med Ta bort andra kolumner framhävt.

  10. Kolumnen Beställningar (2) innehåller extra information från kopplingssteget. Om du vill se och använda dessa data väljer du knappen Visa datavy i det nedre högra hörnet bredvid Visa schemavy. I kolumnrubriken Beställningar (2) väljer du sedan ikonen Expandera kolumn och väljer kolumnen Antal . Detta lägger till orderantalet för varje kund i tabellen.

    Skärmbild för att använda datavyn.

  11. Nu ska vi rangordna dina kunder efter hur många beställningar de har gjort. Välj kolumnen Antal och gå sedan till fliken Lägg till kolumn och välj Rankningskolumn. Detta lägger till en ny kolumn som visar varje kunds rangordning baserat på deras orderantal.

    Skärmbild av dataflödesredigeraren med kolumnen Antal markerad.

  12. Behåll standardinställningarna i Rangordningskolumn. Välj sedan OK för att tillämpa den här omvandlingen.

    Skärmbild av rankningsfönstret där alla standardinställningar visas.

  13. Byt nu namn på den resulterande frågan till Rankade kunder med hjälp av fönstret Frågeinställningar till höger på skärmen.

    Skärmbild av dataflödesredigeraren med namnet Rangordnade kunder under egenskaperna för frågeinställningar.

  14. Du är redo att ange vart dina data ska gå. I fönstret Frågeinställningar bläddrar du längst ned och väljer Välj datamål.

    Skärmbild av dataflödesredigeraren med platsen för markeringen Datamål framhävd.

  15. Du kan skicka dina resultat till ett sjöhus om du har ett eller hoppa över det här steget om du inte gör det. Här kan du välja vilken lakehouse och tabell som ska användas för dina data och välja om du vill lägga till nya data (Lägg till) eller ersätta det som finns där (Ersätt).

    Skärmbild av fönstret Anslut till datamål med lakehouse valt.

    Skärmbild av fönstret Välj målinställningar.

  16. Ditt dataflöde är nu redo att publiceras. Granska frågorna i diagramvyn och välj sedan Publicera.

    Skärmbild av dataflödesredigeraren med knappen Publicera längst ned till höger framhävd.

    Välj Publicera i det nedre högra hörnet för att spara ditt dataflöde. Du går tillbaka till din arbetsyta, där en spinnikon bredvid ditt dataflödesnamn visar publiceringen. När spinnaren försvinner är ditt dataflöde redo att uppdateras!

    Viktigt!

    Första gången du skapar ett Dataflöde Gen2 på en arbetsyta konfigurerar Fabric några bakgrundsobjekt (Lakehouse och Warehouse) som hjälper ditt dataflöde att köras. Dessa objekt delas av alla dataflöden på arbetsytan och du bör inte ta bort dem. De är inte avsedda att användas direkt och är vanligtvis inte synliga på din arbetsyta, men du kan se dem på andra platser som Notebooks eller SQL-analys. Leta efter namn som börjar med DataflowStaging för att upptäcka dem.

  17. På arbetsytan väljer du ikonen Schemalägg uppdatering .

    Skärmbild av arbetsytan med schemauppdateringsikonen framhävd.

  18. Aktivera den schemalagda uppdateringen, välj Lägg till en annan tid och konfigurera uppdateringen enligt följande skärmbild.

    Skärmbild som visar hur du väljer en annan tid.

    Skärmbild av alternativen för schemalagd uppdatering, med schemalagd uppdatering aktiverad, uppdateringsfrekvensen inställd på Daglig, Tidszon inställd på samordnad universell tid och Tid inställd på 04:00. På-knappen, lägg till ytterligare ett tidsval, dataflödesägaren och använd-knappen framhävs.

Rensa resurser

Om du inte kommer att fortsätta att använda det här dataflödet tar du bort dataflödet med hjälp av följande steg:

  1. Gå till din Microsoft Fabric-arbetsyta.

    Skärmbild av fönstret arbetsytor där du navigerar till din arbetsyta.

  2. Välj den lodräta ellipsen bredvid namnet på dataflödet och välj sedan Ta bort.

    Skärmbild med de tre lodräta punkterna och borttagningsalternativet i den nedrullningsbara menyn framhävd.

  3. Välj Ta bort för att bekräfta borttagningen av dataflödet.

    Skärmbild av fönstret Ta bort dataflöde med knappen Ta bort framhävd.

Dataflödet i det här exemplet visar hur du läser in och transformerar data i Dataflöde Gen2. Du har lärt dig att:

  • Skapa ett Dataflöde Gen2.
  • Transformera data.
  • Konfigurera målinställningar för transformerade data.
  • Kör igång och schemalägg din pipeline.

Gå vidare till nästa artikel för att lära dig hur du skapar din första pipeline.