Anteckning
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Gäller för: SQL Server 2016 (13.x) och senare versioner
Azure SQL Managed Instance
I den här självstudieserien i fem delar för SQL-programmerare får du lära dig mer om R-integrering i SQL Server Machine Learning Services eller i Big Data Clusters.
I den här självstudieserien i fem delar för SQL-programmerare får du lära dig mer om R-integrering i SQL Server Machine Learning Services.
I den här självstudieserien i fem delar för SQL-programmerare får du lära dig mer om R-integrering i SQL Server 2016 R Services.
I den här självstudieserien i fem delar för SQL-programmerare får du lära dig mer om R-integrering i Machine Learning Services i Azure SQL Managed Instance.
Du skapar och distribuerar en R-baserad maskininlärningslösning med hjälp av en exempeldatabas på SQL Server. Du använder T-SQL, Azure Data Studio eller SQL Server Management Studio och en databasmotorinstans med stöd för SQL-maskininlärning och R-språk
Den här självstudieserien introducerar R-funktioner som används i ett arbetsflöde för datamodellering. Delar omfattar datautforskning, skapande och träning av en binär klassificeringsmodell och modelldistribution. Du använder exempeldata från New York City Taxi och Limousine Commission. Den modell som du skapar förutsäger om en resa sannolikt kommer att resultera i ett tips baserat på tid på dagen, tillryggalade avstånd och upphämtningsplats.
I den första delen av den här serien installerar du förhandskraven och återställer exempeldatabasen. I del två och tre utvecklar du några R-skript för att förbereda dina data och träna en maskininlärningsmodell. I del fyra och fem kör du sedan dessa R-skript i databasen med hjälp av T-SQL-lagrade procedurer.
I den här artikeln ska du:
- Installera krav
- Återställa exempeldatabasen
I del två utforskar du exempeldata och genererar några diagram.
I del tre får du lära dig hur du skapar funktioner från rådata med hjälp av en Transact-SQL funktion. Sedan anropar du funktionen från en lagrad procedur för att skapa en tabell som innehåller funktionsvärdena.
I del fyra läser du in modulerna och anropar nödvändiga funktioner för att skapa och träna modellen med hjälp av en lagrad SQL Server-procedur.
I del fem får du lära dig hur du operationaliserar de modeller som du har tränat och sparat i del fyra.
Anmärkning
Den här handledningen är tillgänglig i både R och Python. Python-versionen finns i Python-självstudie: Förutsäga taxipriser för NYC med binär klassificering.
Förutsättningar
- Installera SQL Server 2016 R Services
- Från och med SQL Server 2019 kräver isoleringsmekanismen att du ger lämpliga behörigheter till katalogen där plotfilen lagras. Mer information om hur du anger dessa behörigheter finns i avsnittet Filbehörigheter i SQL Server 2019 i Windows: Isoleringsändringar för Machine Learning Services.
- Återställ NYC Taxi-demodatabasen
Alla uppgifter kan utföras med hjälp av Transact-SQL lagrade procedurer i Azure Data Studio eller Management Studio.
Den här självstudien förutsätter att du är bekant med grundläggande databasåtgärder, till exempel att skapa databaser och tabeller, importera data och skriva SQL-frågor. Det förutsätter inte att du vet R och att all R-kod tillhandahålls.
Bakgrund för SQL-utvecklare
Processen med att skapa en maskininlärningslösning är komplex och kan omfatta flera verktyg och samordning av ämnesexperter i flera faser:
- hämta och rensa data
- utforska data och skapa funktioner som är användbara för modellering
- träna och justera modellen
- distribution till produktion
Utveckling och testning av den faktiska koden utförs bäst med hjälp av en dedikerad R-utvecklingsmiljö. Men när skriptet har testats fullt ut kan du enkelt distribuera det till SQL Server med hjälp av Transact-SQL lagrade procedurer i den välbekanta miljön i Azure Data Studio eller Management Studio. Att omsluta extern kod i lagrade procedurer är den primära mekanismen för att operationalisera kod i SQL Server.
När modellen har sparats i databasen kan du anropa modellen för förutsägelser från Transact-SQL med hjälp av lagrade procedurer.
Oavsett om du är en SQL-programmerare som är nybörjare på R eller en R-utvecklare som är ny i SQL, introducerar den här självstudieserien i fem delar ett typiskt arbetsflöde för att utföra analys i databasen med R och SQL Server.
Nästa steg
I den här artikeln kommer du att:
- Installerade förkrav
- Återställde exempeldatabasen