Anteckning
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Gäller för: SQL Server 2017 (14.x) och senare versioner
Azure SQL Managed Instance
I den här självstudieserien i fem delar för SQL-programmerare får du lära dig mer om Python-integrering i SQL Server Machine Learning Services eller i Big Data Clusters.
I den här självstudieserien i fem delar för SQL-programmerare får du lära dig mer om Python-integrering i SQL Server Machine Learning Services.
I den här självstudieserien i fem delar för SQL-programmerare får du lära dig mer om Python-integrering i Machine Learning Services i Azure SQL Managed Instance.
Du skapar och distribuerar en Python-baserad maskininlärningslösning med hjälp av en exempeldatabas på SQL Server. Du använder T-SQL, Azure Data Studio eller SQL Server Management Studio och en databasinstans med stöd för SQL-maskininlärning och Python-språk.
Den här självstudieserien beskriver Python-funktioner som används i ett arbetsflöde för datamodellering. Delar omfattar datautforskning, skapande och träning av en binär klassificeringsmodell och modelldistribution. Du använder exempeldata från New York City Taxi och Limousine Commission. Den modell som du skapar förutsäger om en resa sannolikt kommer att resultera i ett tips baserat på tid på dagen, tillryggalade avstånd och upphämtningsplats.
I den första delen av den här serien installerar du förhandskraven och återställer exempeldatabasen. I del två och tre utvecklar du några Python-skript för att förbereda dina data och träna en maskininlärningsmodell. I del fyra och fem kör du sedan dessa Python-skript i databasen med hjälp av T-SQL-lagrade procedurer.
I den här artikeln ska du:
- Installera krav
- Återställa exempeldatabasen
I del två utforskar du exempeldata och genererar några diagram.
I del tre får du lära dig hur du skapar funktioner från rådata med hjälp av en Transact-SQL funktion. Sedan anropar du funktionen från en lagrad procedur för att skapa en tabell som innehåller funktionsvärdena.
I del fyra läser du in modulerna och anropar nödvändiga funktioner för att skapa och träna modellen med hjälp av en lagrad SQL Server-procedur.
I del fem får du lära dig hur du operationaliserar de modeller som du har tränat och sparat i del fyra.
Anmärkning
Den här handledningen är tillgänglig i både R och Python. För R-versionen, se R-självstudie: Förutse taxipriser i NYC med binär klassificering.
Förutsättningar
Alla uppgifter kan utföras med hjälp av Transact-SQL lagrade procedurer i Azure Data Studio eller Management Studio.
Den här självstudieserien förutsätter kunskaper om grundläggande databasåtgärder, till exempel att skapa databaser och tabeller, importera data och skriva SQL-frågor. Det förutsätter inte att du känner till Python och att all Python-kod tillhandahålls.
Bakgrund för SQL-utvecklare
Processen med att skapa en maskininlärningslösning är komplex och kan omfatta flera verktyg och samordning av ämnesexperter i flera faser:
- hämta och rensa data
- utforska data och skapa funktioner som är användbara för modellering
- träna och justera modellen
- distribution till produktion
Utveckling och testning av den faktiska koden utförs bäst med hjälp av en dedikerad utvecklingsmiljö. Men när skriptet har testats fullt ut kan du enkelt distribuera det till SQL Server med hjälp av Transact-SQL lagrade procedurer i den välbekanta miljön i Azure Data Studio eller Management Studio. Att omsluta extern kod i lagrade procedurer är den primära mekanismen för att operationalisera kod i SQL Server.
När modellen har sparats i databasen kan du anropa modellen för förutsägelser från Transact-SQL med hjälp av lagrade procedurer.
Oavsett om du är en SQL-programmerare som är nybörjare på Python eller en Python-utvecklare som är nybörjare på SQL, introducerar den här självstudieserien i fem delar ett typiskt arbetsflöde för att utföra analys i databasen med Python och SQL Server.
Nästa steg
I den här artikeln kommer du att:
- Installerade förkrav
- Återställde exempeldatabasen