Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of mappen te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen om mappen te wijzigen.
In deze zelfstudie leert u hoe u gegevens kunt analyseren met een serverloze SQL-pool.
De ingebouwde serverloze SQL-pool
Met serverloze SQL-pools kunt u SQL gebruiken zonder dat u capaciteit hoeft te reserveren. Facturering voor een serverloze SQL-pool is gebaseerd op de hoeveelheid gegevens die wordt verwerkt om de query uit te voeren en niet op het aantal knooppunten dat wordt gebruikt om de query uit te voeren.
Elke werkruimte wordt geleverd met een vooraf geconfigureerde serverloze SQL-pool met de naam Ingebouwd.
NYC Taxi-gegevens analyseren met een serverloze SQL-pool
Notitie
Zorg ervoor dat u de voorbeeldgegevens in het primaire opslagaccount hebt geplaatst
In Synapse Studio, ga naar de Ontwikkelen hub
Maak een nieuw SQL-script.
Plak de volgende code in het script. (Werk
contosolakebij naar de naam van uw opslagaccount enusersmet de naam van uw container.)SELECT TOP 100 * FROM OPENROWSET( BULK 'https://contosolake.dfs.core.windows.net/users/NYCTripSmall.parquet', FORMAT='PARQUET' ) AS [result]Selecteer Uitvoeren.
Gegevensverkenning is slechts een vereenvoudigd scenario waarin u de basiskenmerken van uw gegevens kunt begrijpen. Meer informatie over gegevensverkenning en -analyse in deze zelfstudie.
Database voor gegevensverkenning maken
U kunt rechtstreeks via master de database door de inhoud van de bestanden bladeren. Voor sommige eenvoudige scenario's voor gegevensverkenning hoeft u geen afzonderlijke database te maken.
Als u echter doorgaat met gegevensverkenning, wilt u mogelijk enkele hulpprogrammaobjecten maken, zoals:
- Externe gegevensbronnen die de benoemde verwijzingen voor opslagrekeningen vertegenwoordigen.
- Referenties voor databasebereik waarmee u kunt opgeven hoe u zich kunt verifiëren bij een externe gegevensbron.
- Databasegebruikers met de machtigingen voor toegang tot bepaalde gegevensbronnen of databaseobjecten.
- Weergaven, procedures en functies van hulpprogramma's die u in de query's kunt gebruiken.
Gebruik de
masterdatabase om een afzonderlijke database te maken voor aangepaste databaseobjecten. Aangepaste databaseobjecten kunnen niet worden gemaakt in demasterdatabase.CREATE DATABASE DataExplorationDB COLLATE Latin1_General_100_BIN2_UTF8Belangrijk
Gebruik een sortering met
_UTF8achtervoegsel om ervoor te zorgen dat UTF-8-tekst correct wordt geconverteerd naarVARCHARkolommen.Latin1_General_100_BIN2_UTF8biedt de beste prestaties in de query's die gegevens lezen uit Parquet-bestanden en Azure Cosmos DB-containers. Zie Sorteringstypen die worden ondersteund voor Synapse SQL voor meer informatie over het wijzigen van sorteringen.Schakel over van de databasecontext
masternaarDataExplorationDBmet behulp van de volgende opdracht. U kunt ook het UI-besturingselement use database gebruiken om naar uw huidige database te schakelen.USE DataExplorationDBVanaf
DataExplorationDBmaak gebruikersobjecten zoals referenties en gegevensbronnen aan.CREATE EXTERNAL DATA SOURCE ContosoLake WITH ( LOCATION = 'https://contosolake.dfs.core.windows.net')Notitie
Een externe gegevensbron kan zonder referentie worden gemaakt. Als er geen referentie bestaat, wordt de identiteit van de beller gebruikt voor toegang tot de externe gegevensbron.
Gebruik eventueel de zojuist gemaakte
DataExplorationDBdatabase om een aanmelding te maken voor een gebruiker inDataExplorationDBdie toegang heeft tot externe gegevens:CREATE LOGIN data_explorer WITH PASSWORD = 'My Very Strong Password 1234!';Maak vervolgens een databasegebruiker
DataExplorationDBvoor de bovenstaande inlog en verleen deADMINISTER DATABASE BULK OPERATIONSmachtiging.CREATE USER data_explorer FOR LOGIN data_explorer; GO GRANT ADMINISTER DATABASE BULK OPERATIONS TO data_explorer; GOVerken de inhoud van het bestand met behulp van het relatieve pad en de gegevensbron:
SELECT TOP 100 * FROM OPENROWSET( BULK '/users/NYCTripSmall.parquet', DATA_SOURCE = 'ContosoLake', FORMAT='PARQUET' ) AS [result]Publiceer uw wijzigingen in de werkruimte.
Gegevensverkenningsdatabase is slechts een eenvoudige tijdelijke aanduiding waar u uw hulpprogramma-objecten kunt opslaan. Met synapse SQL-pool kunt u veel meer doen en een logisch datawarehouse maken: een relationele laag die is gebouwd op Basis van Azure-gegevensbronnen. Meer informatie over het bouwen van een logisch datawarehouse in deze handleiding.