Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Azure Synapse Analytics biedt verschillende analyse-engines om u te helpen bij het opnemen, transformeren, modelleren en analyseren van uw gegevens. Een toegewezen SQL-pool biedt reken- en opslagmogelijkheden op basis van T-SQL. Nadat u een toegewezen SQL-pool hebt gemaakt in uw Synapse-werkruimte, kunnen gegevens worden geladen, gemodelleerd, verwerkt en geleverd voor sneller analyse-inzicht.
In deze quickstart leert u hoe u gegevens uit Azure SQL Database laadt in Azure Synapse Analytics. U kunt vergelijkbare stappen volgen om gegevens te kopiëren vanuit andere typen gegevensarchieven. Deze vergelijkbare stroom is ook van toepassing op het kopiëren van gegevens voor andere bronnen en sinks.
Vereiste voorwaarden
- Azure-abonnement: Als u geen Azure-abonnement hebt, maakt u een gratis Azure-account voordat u begint.
- Azure Synapse-werkruimte: Maak een Synapse-werkruimte met behulp van Azure Portal aan de hand van de instructies in quickstart: Een Synapse-werkruimte maken.
- Azure SQL Database: in deze zelfstudie worden gegevens gekopieerd uit de Adventure Works LT-voorbeeldgegevensset in Azure SQL Database. U kunt deze voorbeelddatabase maken in SQL Database door de instructies in Een voorbeelddatabase maken in Azure SQL Database te volgen. U kunt ook andere gegevensarchieven gebruiken door vergelijkbare stappen te volgen.
- Azure Storage-account: Azure Storage wordt gebruikt als het tijdelijke opslaggebied in de kopieerbewerking. Als u geen Azure-opslagaccount hebt, raadpleegt u de instructies in Een opslagaccount maken.
- Azure Synapse Analytics: u gebruikt een toegewezen SQL-pool als sinkgegevensarchief. Als u geen Azure Synapse Analytics-instantie hebt, zie Een toegewezen SQL-pool maken voor de stappen om er een te maken.
Navigeer naar Synapse Studio
Nadat uw Synapse-werkruimte is gemaakt, hebt u twee manieren om Synapse Studio te openen:
- Open uw Synapse-werkruimte in Azure Portal. Selecteer Openen op de kaart Synapse Studio openen onder Aan de slag.
- Open Azure Synapse Analytics en meld u aan bij uw werkruimte.
In deze quickstart gebruiken we de werkruimte met de naam adftest2020 als voorbeeld. U wordt automatisch naar de startpagina van Synapse Studio geleid.
Gekoppelde services maken
In Azure Synapse Analytics is een gekoppelde service de plek waar u uw verbindingsgegevens voor andere services definieert. In deze sectie maakt u de volgende twee soorten gekoppelde services: gekoppelde services van Azure SQL Database en Azure Data Lake Storage Gen2 (ADLS Gen2).
Selecteer op de startpagina van Synapse Studio het tabblad Beheren in het linkernavigatievenster.
Selecteer Gekoppelde services onder Externe verbindingen.
Als u een gekoppelde service wilt toevoegen, selecteert u Nieuw.
Selecteer in de galerie de optie Azure SQL Database. Selecteer vervolgens Doorgaan. U kunt 'sql' in het zoekvak typen om de connectors te filteren.
Selecteer op de pagina Nieuwe gekoppelde service uw servernaam en DB-naam in de vervolgkeuzelijst en geef de gebruikersnaam en het wachtwoord op. Klik op Verbinding testen om de instellingen te valideren, en selecteer dan Maken.
Herhaal stap 3-4, maar selecteer in plaats daarvan Azure Data Lake Storage Gen2 in de galerie. Selecteer op de pagina Nieuwe gekoppelde service de naam van uw opslagaccount in de vervolgkeuzelijst. Klik op Verbinding testen om de instellingen te valideren, en selecteer dan Maken.
Een pijplijn maken
Een pijplijn bevat de logische stroom voor het uitvoeren van een reeks activiteiten. In deze sectie maakt u een pijplijn met een kopieeractiviteit waarmee gegevens uit Azure SQL Database worden opgenomen in een toegewezen SQL-pool.
Ga naar het tabblad Integreren . Selecteer het pluspictogram naast de pijplijnheader en selecteer Pijplijn.
Sleep onder Verplaatsen en transformeren in het deelvenster Activiteitengegevens kopiëren naar het pijplijncanvas.
Selecteer de kopieeractiviteit en ga naar het tabblad Bron. Selecteer Nieuw om een nieuwe brongegevensset te maken.
Selecteer Azure SQL Database als uw gegevensarchief en selecteer Doorgaan.
Selecteer in het deelvenster Eigenschappen instellen de gekoppelde Azure SQL Database-service die u in de vorige stap hebt gemaakt.
Selecteer onder Tabelnaam een voorbeeldtabel die u wilt gebruiken in de volgende kopieeractiviteit. In deze quickstart gebruiken we de tabel SalesLT.Customer als voorbeeld.
Wanneer u klaar bent, selecteert u OK.
Selecteer de kopieeractiviteit en ga naar het tabblad Sink. Selecteer Nieuw om een nieuwe sinkgegevensset te maken.
Selecteer de toegewezen SQL-pool van Azure Synapse als uw gegevensarchief en selecteer Doorgaan.
Selecteer in het deelvenster Eigenschappen instellen de SQL Analytics-pool die u in een eerdere stap hebt gemaakt. Als u naar een bestaande tabel schrijft, selecteert u deze onder Tabelnaam in de vervolgkeuzelijst. Anders schakelt u Bewerken in en voert u de naam van de nieuwe tabel in. Wanneer u klaar bent, selecteert u OK.
Schakel voor de instellingen van de Sink-gegevensset automatisch tabel maken in het veld Tabeloptie in.
Schakel op de pagina Instellingen het selectievakje in voor het Inschakelen van fasering. Deze optie is van toepassing als uw brongegevens niet compatibel zijn met PolyBase. Selecteer in de sectie Faseringsinstellingen de gekoppelde Azure Data Lake Storage Gen2-service die u in een eerdere stap hebt gemaakt als faseringsopslag.
Het archief wordt gebruikt voor het faseren van de gegevens voordat deze in Azure Synapse Analytics worden geladen met PolyBase. Nadat het kopiëren is voltooid, worden de tussentijdse gegevens in Azure Data Lake Storage Gen2 automatisch opgeschoond.
Als u de pijplijn wilt valideren, selecteert u Valideren op de werkbalk. U ziet het resultaat van de pijplijnvalidatie-uitvoer aan de rechterkant van de pagina.
Fouten opsporen in de pijplijn en de pijplijn publiceren
Zodra u klaar bent met het configureren van uw pijplijn, kunt u een foutopsporingsuitvoering uitvoeren voordat u uw artefacten publiceert om te controleren of alles juist is.
Selecteer Fouten opsporen om fouten op te sporen in de pijplijn. De status van de pijplijnuitvoering wordt weergegeven op het tabblad Uitvoer onder in het venster.
Zodra de pijplijn succesvol is uitgevoerd, selecteer alles publiceren in de bovenste werkbalk. Met deze actie worden entiteiten (gegevenssets en pijplijnen) gepubliceerd die u hebt gemaakt in de Synapse Analytics-service.
Wacht tot je het bericht Succesvol gepubliceerd ziet. Als u meldingsberichten wilt zien, selecteert u de belknop rechtsboven.
De pijplijn activeren en bewaken
In deze sectie activeert u handmatig de pijplijn die in de vorige stap is gepubliceerd.
Selecteer op de werkbalk de optie Trigger toevoegen en selecteer vervolgens Nu activeren. Klik op de pagina Pijplijnuitvoering op OK.
Ga naar het tabblad Monitor in de linkerzijbalk. U ziet een pijplijn die wordt geactiveerd door een handmatige trigger.
Wanneer de pijplijnuitvoering is voltooid, selecteert u de koppeling onder de kolom Pijplijnnaam om details van de uitvoering van de activiteit weer te geven of om de pijplijn opnieuw uit te voeren. Omdat er in dit voorbeeld slechts één activiteit is, ziet u slechts één vermelding in de lijst.
Selecteer de koppeling Details (pictogram van een bril) in de kolom Naam activiteit om details van de kopieerbewerking te zien. U kunt details bekijken, zoals het volume van de gegevens die uit de bron zijn gekopieerd naar de sink, de gegevensdoorvoer, de uitvoeringsstappen met de overeenkomstige duur en de gebruikte configuraties.
Als u wilt terugkeren naar de weergave met de pijplijnuitvoeringen, selecteert u de koppeling Alle pijplijnuitvoeringen bovenaan. Selecteer Vernieuwen om de lijst te vernieuwen.
Controleer of uw gegevens correct zijn geschreven in de toegewezen SQL-pool.
Volgende stappen
Ga naar het volgende artikel voor meer informatie over ondersteuning voor Azure Synapse Analytics: