Delen via


Quickstart: Uw eerste gegevensstroom maken om gegevens op te halen en te transformeren

Gegevensstromen zijn een selfservicetechnologie voor gegevensvoorbereiding in de cloud. In dit artikel maakt u uw eerste gegevensstroom, haalt u gegevens op voor uw gegevensstroom, transformeert u de gegevens en publiceert u de gegevensstroom.

Vereisten

De volgende vereisten zijn vereist voordat u begint:

Een gegevensstroom maken

In deze sectie maakt u uw eerste gegevensstroom.

  1. Navigeer naar uw Microsoft Fabric-werkruimte.

    Schermopname van het werkruimtevenster waar u naar uw werkruimte navigeert.

  2. Selecteer +Nieuw item en selecteer vervolgens Dataflow Gen2.

    Schermopname met de selectie Dataflow Gen2 benadrukt.

Gegevens ophalen

Laten we wat gegevens ophalen. In dit voorbeeld krijgt u gegevens van een OData-service. Gebruik de volgende stappen om gegevens in uw gegevensstroom op te halen.

  1. Selecteer Gegevens ophalen in de gegevensstroomeditor en selecteer vervolgens Meer.

    Schermopname met de optie Gegevens ophalen geselecteerd en Meer benadrukt in de vervolgkeuzelijst.

  2. Selecteer meer weergeven in Gegevensbron kiezen.

    Schermopname van Gegevensbron ophalen met Meer nadruk op weergeven.

  3. Selecteer in Nieuwe bron Andere>OData als gegevensbron.

    Schermopname van Gegevensbron ophalen met de categorie Overige en de OData-connector benadrukt.

  4. Voer de URL https://services.odata.org/v4/northwind/northwind.svc/in en selecteer vervolgens Volgende.

    Schermopname van de OData-gegevensbron waarin u de gegevens-URL invoert.

  5. Selecteer de tabellen Orders en Klanten en selecteer vervolgens Maken.

    Schermopname van de Power Query-navigator met de tabellen Klanten en Orders benadrukt.

Meer informatie over de ervaring en functionaliteit voor het ophalen van gegevens vindt u in het overzicht van gegevens ophalen.

Transformaties toepassen en publiceren

U hebt uw gegevens in uw eerste gegevensstroom geladen. Gefeliciteerd! Nu is het tijd om een aantal transformaties toe te passen om deze gegevens in de vorm te brengen die we nodig hebben.

U transformeert de gegevens in de Power Query-editor. U vindt een gedetailleerd overzicht van de Power Query-editor in de gebruikersinterface van Power Query, maar in deze sectie worden de basisstappen beschreven:

  1. Zorg ervoor dat de hulpprogramma's voor gegevensprofilering zijn ingeschakeld. Ga naar Home>Opties>Algemene Opties en selecteer vervolgens alle opties onder Kolomprofiel.

    Schermopname van algemene opties met de nadruk op de selecties van het kolomprofiel.

    Zorg er ook voor dat u de diagramweergave inschakelt met behulp van de indelingsconfiguraties onder het tabblad Weergave op het lint van de Power Query-editor of door het pictogram diagramweergave rechtsonder in het Power Query-venster te selecteren.

    Schermopname van het algemene uiterlijk van de Power Query-diagramweergave.

  2. Bereken in de tabel Orders het totale aantal orders per klant: Selecteer de kolom CustomerID in de gegevensvoorbeeldweergave en selecteer vervolgens Groeperen onder het tabblad Transformeren in de menubalk.

    Schermopname van de geselecteerde tabel Orders en Groeperen op het tabblad Transformeren.

  3. U voert het aantal rijen uit als de aggregatie binnen Group By. Meer informatie over de mogelijkheden van Group By vindt u in Groeperen of samenvatten van rijen.

    Schermopname van Group by, met de bewerking Aantal rijen geselecteerd.

  4. Nadat we gegevens in de tabel Orders hebben gegroepeerd, krijgen we een tabel met twee kolommen met CustomerID en Count als de kolommen.

    Schermopname van de twee kolomtabellen.

  5. Vervolgens wilt u gegevens uit de tabel Klanten combineren met het aantal orders per klant: selecteer de query Klanten in de diagramweergave en gebruik het menu '⋮' om toegang te krijgen tot de samenvoegquery's als nieuwe transformatie.

    Schermopname van de gegevensstroomeditor, met het verticale beletselteken van de tabel Klanten en Query's samenvoegen als nieuw benadrukt.

  6. Configureer de samenvoegbewerking door CustomerID te selecteren als de overeenkomende kolom in beide tabellen. Selecteer vervolgens OK.

    Schermopname van het venster Samenvoegen.

    Schermopname van het venster Samenvoegen, met de linkertabel voor samenvoegen ingesteld op de tabel Klanten en de rechtertabel voor samenvoegen ingesteld op de tabel Orders. De kolom CustomerID is geselecteerd voor de tabellen Klanten en Orders. Het Join Kind is ook ingesteld op Left outer. Alle andere selecties worden ingesteld op de standaardwaarde.

  7. Er is nu een nieuwe query met alle kolommen uit de tabel Klanten en één kolom met geneste gegevens uit de tabel Orders.

    Schermopname van de gegevensstroomeditor met de nieuwe samenvoegquery toegevoegd aan de rechterkant van de tabellen Klanten en Orders.

  8. Laten we ons richten op slechts een paar kolommen uit de tabel Klanten. Hiervoor schakelt u de schemaweergave in door de knop Schemaweergave in de rechterbenedenhoek van de gegevensstroomeditor te selecteren.

    Schermopname van de gegevensstroomeditor met de knop Schemaweergave gemarkeerd in de rechterbenedenhoek.

  9. In de schemaweergave ziet u alle kolommen in de tabel. Selecteer CustomerID, CompanyName en Orders (2). Ga vervolgens naar het tabblad Hulpmiddelen voor schema , selecteer Kolommen verwijderen en kies Andere kolommen verwijderen. Hiermee blijven alleen de gewenste kolommen behouden.

    Schermopname van de schemaweergave met alle beschikbare kolomnamen, met de kolommen CustomerID, CompanyName en Orders (2) benadrukt.

    Schermopname van het menu Hulpprogramma's voor schema's met de nadruk op Andere kolommen verwijderen.

  10. De kolom Orders (2) bevat extra details uit de samenvoegstap. Als u deze gegevens wilt bekijken en gebruiken, selecteert u de knop Gegevensweergave weergeven in de rechterbenedenhoek naast de schemaweergave weergeven. Selecteer vervolgens in de kolomkop Orders (2) het pictogram Kolom uitvouwen en kies de kolom Aantal . Hiermee wordt het aantal bestellingen voor elke klant aan uw tabel toegevoegd.

    Schermopname voor het gebruik van de gegevensweergave.

  11. Laten we nu uw klanten rangschikken op het aantal orders dat ze hebben gedaan. Selecteer de kolom Aantal en ga vervolgens naar het tabblad Kolom toevoegen en selecteer Kolom rangschikken. Hiermee wordt een nieuwe kolom toegevoegd waarin de rang van elke klant wordt weergegeven op basis van het aantal orders.

    Schermopname van de gegevensstroomeditor met de kolom Aantal geselecteerd.

  12. Behoud de standaardinstellingen in rangschikkingskolom. Selecteer vervolgens OK om deze transformatie toe te passen.

    Schermopname van het venster Rangschikken met alle standaardinstellingen weergegeven.

  13. Wijzig nu de naam van de resulterende query als Gerangschikte klanten met behulp van het deelvenster Query-instellingen aan de rechterkant van het scherm.

    Schermopname van de gegevensstroomeditor met de naam Ranked Customers benadrukt onder de eigenschappen van de query-instellingen.

  14. U kunt instellen waar uw gegevens naartoe gaan. Schuif in het deelvenster Query-instellingen naar beneden en selecteer Gegevensbestemming kiezen.

    Schermopname van de gegevensstroomeditor met de locatie van de selectie Gegevensbestemming benadrukt.

  15. U kunt uw resultaten naar een lakehouse verzenden als u er een hebt of deze stap overslaan als u dat niet doet. Hier kunt u kiezen welke lakehouse en tabel u wilt gebruiken voor uw gegevens en kiezen of u nieuwe gegevens wilt toevoegen (toevoegen) of vervangen wat er is (Vervangen).

    Schermopname van het venster Verbinding maken met gegevensbestemming met Lakehouse geselecteerd.

    Schermopname van het venster Doelinstellingen kiezen.

  16. Uw gegevensstroom is nu gereed om te worden gepubliceerd. Controleer de query's in de diagramweergave en selecteer Publiceren.

    Schermopname van de gegevensstroomeditor met de knop Publiceren aan de rechterbenedenhoek benadrukt.

    Selecteer Publiceren in de rechterbenedenhoek om uw gegevensstroom op te slaan. U gaat terug naar uw werkruimte, waar een spinnerpictogram naast de naam van uw gegevensstroom laat zien dat deze wordt gepubliceerd. Wanneer de spinner verdwijnt, is uw gegevensstroom klaar om te vernieuwen.

    Belangrijk

    De eerste keer dat u een Dataflow Gen2 in een werkruimte maakt, stelt Fabric een aantal achtergronditems (Lakehouse en Warehouse) in waarmee uw gegevensstroom kan worden uitgevoerd. Deze items worden gedeeld door alle gegevensstromen in de werkruimte en u moet ze niet verwijderen. Ze zijn niet bedoeld om rechtstreeks te worden gebruikt en zijn meestal niet zichtbaar in uw werkruimte, maar u ziet ze mogelijk op andere plaatsen, zoals Notebooks of SQL-analyses. Zoek naar namen die beginnen met DataflowStaging om ze te herkennen.

  17. Selecteer in uw werkruimte het pictogram Vernieuwen plannen .

    Schermopname van de werkruimte met het pictogram Vernieuwen plannen benadrukt.

  18. Schakel de geplande vernieuwing in, selecteer Nog een keer toevoegen en configureer de vernieuwing, zoals wordt weergegeven in de volgende schermopname.

    Schermopname die laat zien hoe u een andere tijd selecteert.

    Schermopname van de geplande vernieuwingsopties, waarbij geplande vernieuwing is ingeschakeld, de vernieuwingsfrequentie is ingesteld op Dagelijks, de tijdzone ingesteld op gecoördineerde universele tijd en de tijd ingesteld op 4:00 uur. De aan-knop, de nieuwe tijdselectie toevoegen, de eigenaar van de gegevensstroom en de knop Toepassen worden allemaal benadrukt.

Resources opschonen

Als u deze gegevensstroom niet wilt blijven gebruiken, verwijdert u de gegevensstroom met behulp van de volgende stappen:

  1. Navigeer naar uw Microsoft Fabric-werkruimte.

    Schermopname van het werkruimtevenster waar u naar uw werkruimte navigeert.

  2. Selecteer het verticale beletselteken naast de naam van de gegevensstroom en selecteer vervolgens Verwijderen.

    Schermopname met de drie verticale puntjes en de optie Verwijderen in de vervolgkeuzelijst benadrukt.

  3. Selecteer Verwijderen om het verwijderen van uw gegevensstroom te bevestigen.

    Schermopname van het venster Gegevensstroom verwijderen, met de knop Verwijderen benadrukt.

De gegevensstroom in dit voorbeeld laat zien hoe u gegevens laadt en transformeert in Dataflow Gen2. U hebt geleerd hoe u:

  • Maak een Gegevensstroom Gen2.
  • Gegevens transformeren.
  • Configureer doelinstellingen voor getransformeerde gegevens.
  • Voer uw pijplijn uit en plan deze in.

Ga naar het volgende artikel voor meer informatie over het maken van uw eerste pijplijn.