Delen via


Quickstart: Gegevens laden in een toegewezen SQL-pool met behulp van de kopieeractiviteit

Azure Synapse Analytics biedt verschillende analyse-engines om u te helpen bij het opnemen, transformeren, modelleren en analyseren van uw gegevens. Een toegewezen SQL-pool biedt reken- en opslagmogelijkheden op basis van T-SQL. Nadat u een toegewezen SQL-pool hebt gemaakt in uw Synapse-werkruimte, kunnen gegevens worden geladen, gemodelleerd, verwerkt en geleverd voor sneller analyse-inzicht.

In deze quickstart leert u hoe u gegevens uit Azure SQL Database laadt in Azure Synapse Analytics. U kunt vergelijkbare stappen volgen om gegevens te kopiëren vanuit andere typen gegevensarchieven. Deze vergelijkbare stroom is ook van toepassing op het kopiëren van gegevens voor andere bronnen en sinks.

Vereiste voorwaarden

  • Azure-abonnement: Als u geen Azure-abonnement hebt, maakt u een gratis Azure-account voordat u begint.
  • Azure Synapse-werkruimte: Maak een Synapse-werkruimte met behulp van Azure Portal aan de hand van de instructies in quickstart: Een Synapse-werkruimte maken.
  • Azure SQL Database: in deze zelfstudie worden gegevens gekopieerd uit de Adventure Works LT-voorbeeldgegevensset in Azure SQL Database. U kunt deze voorbeelddatabase maken in SQL Database door de instructies in Een voorbeelddatabase maken in Azure SQL Database te volgen. U kunt ook andere gegevensarchieven gebruiken door vergelijkbare stappen te volgen.
  • Azure Storage-account: Azure Storage wordt gebruikt als het tijdelijke opslaggebied in de kopieerbewerking. Als u geen Azure-opslagaccount hebt, raadpleegt u de instructies in Een opslagaccount maken.
  • Azure Synapse Analytics: u gebruikt een toegewezen SQL-pool als sinkgegevensarchief. Als u geen Azure Synapse Analytics-instantie hebt, zie Een toegewezen SQL-pool maken voor de stappen om er een te maken.

Nadat uw Synapse-werkruimte is gemaakt, hebt u twee manieren om Synapse Studio te openen:

  • Open uw Synapse-werkruimte in Azure Portal. Selecteer Openen op de kaart Synapse Studio openen onder Aan de slag.
  • Open Azure Synapse Analytics en meld u aan bij uw werkruimte.

In deze quickstart gebruiken we de werkruimte met de naam adftest2020 als voorbeeld. U wordt automatisch naar de startpagina van Synapse Studio geleid.

Startpagina van Synapse Studio

Gekoppelde services maken

In Azure Synapse Analytics is een gekoppelde service de plek waar u uw verbindingsgegevens voor andere services definieert. In deze sectie maakt u de volgende twee soorten gekoppelde services: gekoppelde services van Azure SQL Database en Azure Data Lake Storage Gen2 (ADLS Gen2).

  1. Selecteer op de startpagina van Synapse Studio het tabblad Beheren in het linkernavigatievenster.

  2. Selecteer Gekoppelde services onder Externe verbindingen.

    Nieuwe gekoppelde service maken

  3. Als u een gekoppelde service wilt toevoegen, selecteert u Nieuw.

  4. Selecteer in de galerie de optie Azure SQL Database. Selecteer vervolgens Doorgaan. U kunt 'sql' in het zoekvak typen om de connectors te filteren.

    Nieuwe gekoppelde Azure SQL Database-service maken

  5. Selecteer op de pagina Nieuwe gekoppelde service uw servernaam en DB-naam in de vervolgkeuzelijst en geef de gebruikersnaam en het wachtwoord op. Klik op Verbinding testen om de instellingen te valideren, en selecteer dan Maken.

    Gekoppelde Azure SQL Database-service configureren

  6. Herhaal stap 3-4, maar selecteer in plaats daarvan Azure Data Lake Storage Gen2 in de galerie. Selecteer op de pagina Nieuwe gekoppelde service de naam van uw opslagaccount in de vervolgkeuzelijst. Klik op Verbinding testen om de instellingen te valideren, en selecteer dan Maken.

    Azure Data Lake Storage Gen2 configureren

Een pijplijn maken

Een pijplijn bevat de logische stroom voor het uitvoeren van een reeks activiteiten. In deze sectie maakt u een pijplijn met een kopieeractiviteit waarmee gegevens uit Azure SQL Database worden opgenomen in een toegewezen SQL-pool.

  1. Ga naar het tabblad Integreren . Selecteer het pluspictogram naast de pijplijnheader en selecteer Pijplijn.

    Een nieuwe pijplijn maken

  2. Sleep onder Verplaatsen en transformeren in het deelvenster Activiteitengegevens kopiëren naar het pijplijncanvas.

  3. Selecteer de kopieeractiviteit en ga naar het tabblad Bron. Selecteer Nieuw om een nieuwe brongegevensset te maken.

    Een brongegevensset maken

  4. Selecteer Azure SQL Database als uw gegevensarchief en selecteer Doorgaan.

  5. Selecteer in het deelvenster Eigenschappen instellen de gekoppelde Azure SQL Database-service die u in de vorige stap hebt gemaakt.

  6. Selecteer onder Tabelnaam een voorbeeldtabel die u wilt gebruiken in de volgende kopieeractiviteit. In deze quickstart gebruiken we de tabel SalesLT.Customer als voorbeeld.

    Eigenschappen van brongegevensset instellen

  7. Wanneer u klaar bent, selecteert u OK.

  8. Selecteer de kopieeractiviteit en ga naar het tabblad Sink. Selecteer Nieuw om een nieuwe sinkgegevensset te maken.

  9. Selecteer de toegewezen SQL-pool van Azure Synapse als uw gegevensarchief en selecteer Doorgaan.

  10. Selecteer in het deelvenster Eigenschappen instellen de SQL Analytics-pool die u in een eerdere stap hebt gemaakt. Als u naar een bestaande tabel schrijft, selecteert u deze onder Tabelnaam in de vervolgkeuzelijst. Anders schakelt u Bewerken in en voert u de naam van de nieuwe tabel in. Wanneer u klaar bent, selecteert u OK.

  11. Schakel voor de instellingen van de Sink-gegevensset automatisch tabel maken in het veld Tabeloptie in.

    Automatisch maken inschakelen

  12. Schakel op de pagina Instellingen het selectievakje in voor het Inschakelen van fasering. Deze optie is van toepassing als uw brongegevens niet compatibel zijn met PolyBase. Selecteer in de sectie Faseringsinstellingen de gekoppelde Azure Data Lake Storage Gen2-service die u in een eerdere stap hebt gemaakt als faseringsopslag.

    Het archief wordt gebruikt voor het faseren van de gegevens voordat deze in Azure Synapse Analytics worden geladen met PolyBase. Nadat het kopiëren is voltooid, worden de tussentijdse gegevens in Azure Data Lake Storage Gen2 automatisch opgeschoond.

    Staging inschakelen

  13. Als u de pijplijn wilt valideren, selecteert u Valideren op de werkbalk. U ziet het resultaat van de pijplijnvalidatie-uitvoer aan de rechterkant van de pagina.

Fouten opsporen in de pijplijn en de pijplijn publiceren

Zodra u klaar bent met het configureren van uw pijplijn, kunt u een foutopsporingsuitvoering uitvoeren voordat u uw artefacten publiceert om te controleren of alles juist is.

  1. Selecteer Fouten opsporen om fouten op te sporen in de pijplijn. De status van de pijplijnuitvoering wordt weergegeven op het tabblad Uitvoer onder in het venster.

    Fouten opsporen in de pijplijn

  2. Zodra de pijplijn succesvol is uitgevoerd, selecteer alles publiceren in de bovenste werkbalk. Met deze actie worden entiteiten (gegevenssets en pijplijnen) gepubliceerd die u hebt gemaakt in de Synapse Analytics-service.

  3. Wacht tot je het bericht Succesvol gepubliceerd ziet. Als u meldingsberichten wilt zien, selecteert u de belknop rechtsboven.

De pijplijn activeren en bewaken

In deze sectie activeert u handmatig de pijplijn die in de vorige stap is gepubliceerd.

  1. Selecteer op de werkbalk de optie Trigger toevoegen en selecteer vervolgens Nu activeren. Klik op de pagina Pijplijnuitvoering op OK.

  2. Ga naar het tabblad Monitor in de linkerzijbalk. U ziet een pijplijn die wordt geactiveerd door een handmatige trigger.

  3. Wanneer de pijplijnuitvoering is voltooid, selecteert u de koppeling onder de kolom Pijplijnnaam om details van de uitvoering van de activiteit weer te geven of om de pijplijn opnieuw uit te voeren. Omdat er in dit voorbeeld slechts één activiteit is, ziet u slechts één vermelding in de lijst.

  4. Selecteer de koppeling Details (pictogram van een bril) in de kolom Naam activiteit om details van de kopieerbewerking te zien. U kunt details bekijken, zoals het volume van de gegevens die uit de bron zijn gekopieerd naar de sink, de gegevensdoorvoer, de uitvoeringsstappen met de overeenkomstige duur en de gebruikte configuraties.

    Details van activiteit

  5. Als u wilt terugkeren naar de weergave met de pijplijnuitvoeringen, selecteert u de koppeling Alle pijplijnuitvoeringen bovenaan. Selecteer Vernieuwen om de lijst te vernieuwen.

  6. Controleer of uw gegevens correct zijn geschreven in de toegewezen SQL-pool.

Volgende stappen

Ga naar het volgende artikel voor meer informatie over ondersteuning voor Azure Synapse Analytics: