Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Van toepassing op: SQL Server 2017 (14.x) en latere versies
van Azure SQL Managed Instance
In deze vijfdelige zelfstudiereeks voor SQL-programmeurs leert u meer over Python-integratie in SQL Server Machine Learning Services of op Big Data-clusters.
In deze vijfdelige zelfstudiereeks voor SQL-programmeurs leert u meer over Python-integratie in SQL Server Machine Learning Services.
In deze vijfdelige zelfstudiereeks voor SQL-programmeurs leert u meer over Python-integratie in Machine Learning Services in Azure SQL Managed Instance.
U bouwt en implementeert een machine learning-oplossing op basis van Python met behulp van een voorbeelddatabase in SQL Server. U gebruikt T-SQL, Azure Data Studio of SQL Server Management Studio en een database-exemplaar met ondersteuning voor SQL Machine Learning en Python.
In deze reeks zelfstudies maakt u kennis met Python-functies die worden gebruikt in een werkstroom voor gegevensmodellering. Onderdelen zijn gegevensverkenning, het bouwen en trainen van een binair classificatiemodel en modelimplementatie. U gebruikt voorbeeldgegevens van de New York City Taxi and Limousine Commission. Het model dat u bouwt, voorspelt of een reis waarschijnlijk resulteert in een tip op basis van het tijdstip van de dag, de reisafstand en de ophaallocatie.
In het eerste deel van deze reeks installeert u de vereisten en herstelt u de voorbeelddatabase. In deel twee en drie ontwikkelt u enkele Python-scripts om uw gegevens voor te bereiden en een machine learning-model te trainen. Vervolgens voert u in deel vier en vijf deze Python-scripts uit in de database met behulp van op T-SQL opgeslagen procedures.
In dit artikel gaat u het volgende doen:
- Vereisten installeren
- De voorbeelddatabase herstellen
In deel twee verkent u de voorbeeldgegevens en genereert u enkele plots.
In deel drie leert u hoe u functies maakt op basis van onbewerkte gegevens met behulp van een Transact-SQL-functie. Vervolgens roept u die functie aan vanuit een opgeslagen procedure om een tabel te maken die de functiewaarden bevat.
In deel vier laadt u de modules en roept u de benodigde functies aan om het model te maken en te trainen met behulp van een opgeslagen SQL Server-procedure.
In deel vijf leert u hoe u de modellen kunt operationeel maken die u hebt getraind en opgeslagen in deel vier.
Opmerking
Deze handleiding is beschikbaar in R en Python. Zie voor de R-versie R-zelfstudie: Taxitarieven voor NYC voorspellen met binaire classificatie.
Vereiste voorwaarden
Alle taken kunnen worden uitgevoerd met behulp van Transact-SQL opgeslagen procedures in Azure Data Studio of Management Studio.
In deze reeks zelfstudies wordt ervan uitgegaan dat u bekend bent met basisdatabasebewerkingen, zoals het maken van databases en tabellen, het importeren van gegevens en het schrijven van SQL-query's. Er wordt niet van uitgegaan dat u Python kent en dat alle benodigde Python-code verstrekt wordt.
Achtergrond voor SQL-ontwikkelaars
Het proces van het bouwen van een machine learning-oplossing is een complex proces dat meerdere hulpprogramma's kan omvatten en de coördinatie van deskundigen in verschillende fasen:
- gegevens verkrijgen en opschonen
- de gegevens en bouwfuncties verkennen die nuttig zijn voor modellering
- het model trainen en afstemmen
- uitrol naar productie
Het ontwikkelen en testen van de werkelijke code wordt het beste uitgevoerd met behulp van een toegewezen ontwikkelomgeving. Nadat het script echter volledig is getest, kunt u het eenvoudig implementeren in SQL Server met behulp van Transact-SQL opgeslagen procedures in de vertrouwde omgeving van Azure Data Studio of Management Studio. Externe code verpakken in opgeslagen procedures is het primaire mechanisme voor het operationeel maken van code in SQL Server.
Nadat het model is opgeslagen in de database, kunt u het model aanroepen voor voorspellingen van Transact-SQL met behulp van opgeslagen procedures.
Of u nu een SQL-programmeur bent die nieuw is in Python of een Python-ontwikkelaar die nieuw is in SQL, deze vijfdelige reeks zelfstudies introduceert een typische werkstroom voor het uitvoeren van in-databaseanalyses met Python en SQL Server.
Volgende stappen
In dit artikel gaat u als volgt te werk:
- Geïnstalleerde vereisten
- De voorbeelddatabase hersteld