Dela via


Python-självstudie: Förutsäga skiduthyrning med linjär regression med SQL-maskininlärning

Gäller för: SQL Server 2017 (14.x) och senare versioner Azure SQL Managed Instance

I den här självstudieserien i fyra delar använder du Python och linjär regression i SQL Server Machine Learning Services eller i SQL Server 2019 Big Data Clusters för att förutsäga antalet skiduthyrningar. I självstudien används en Python-anteckningsbok i Azure Data Studio.

I den här självstudieserien i fyra delar använder du Python och linjär regression i SQL Server Machine Learning Services för att förutsäga antalet skiduthyrningar. I självstudien används en Python-anteckningsbok i Azure Data Studio.

I den här självstudieserien i fyra delar använder du Python och linjär regression i Azure SQL Managed Instance Machine Learning Services för att förutsäga antalet skiduthyrningar. I självstudien används en Python-anteckningsbok i Azure Data Studio.

Tänk dig att du äger ett skiduthyrningsföretag och vill förutsäga antalet uthyrningar som du kommer att ha på ett framtida datum. Den här informationen hjälper dig att förbereda ditt lager, din personal och dina anläggningar.

I seriens första del får du förbereda förutsättningarna. I del två och tre utvecklar du några Python-skript i en notebook-fil för att förbereda dina data och träna en maskininlärningsmodell. I del tre kör du sedan dessa Python-skript i databasen med hjälp av T-SQL-lagrade procedurer.

I den här artikeln får du lära dig att:

  • Importera en exempeldatabas

I del två får du lära dig hur du läser in data från en databas till en Python-dataram och förbereder data i Python.

I del tre får du lära dig hur du tränar en linjär regressionsmodell i Python.

I del fyra får du lära dig hur du lagrar modellen i en databas och sedan skapar lagrade procedurer från Python-skripten som du utvecklade i del två och tre. De lagrade procedurerna körs på servern för att göra förutsägelser baserat på nya data.

Förutsättningar

  • Python IDE – I den här självstudien används en Python-notebook-fil i Azure Data Studio. För mer information, se Hur man använder notebook-filer i Azure Data Studio.

  • SQL-frågeverktyg – Den här självstudien förutsätter att du använder Azure Data Studio.

  • Ytterligare Python-paket – Exemplen i den här självstudieserien använder följande Python-paket som kanske inte installeras som standard:

    • Pandas
    • pyodbc
    • scikit-learn (en maskininlärningsbibliotek)

    Så här installerar du följande paket:

    1. I din Azure Data Studio-anteckningsbok väljer du Hantera paket.
    2. I fönstret Hantera paket väljer du fliken Lägg till ny .
    3. För vart och ett av följande paket anger du paketnamnet, väljer Sök och väljer sedan Installera.

    Alternativt kan du öppna en kommandotolk, ändra till installationssökvägen för den version av Python som du använder i Azure Data Studio (till exempel cd %LocalAppData%\Programs\Python\Python37-32) och sedan köra pip install för varje paket.

Återställa exempeldatabasen

Exempeldatabasen som används i den här handledningen har sparats i en .bak databasbackup som du kan ladda ned och använda.

Anmärkning

Om du använder Machine Learning Services på SQL Server 2019 Big Data Clusters kan du läsa om hur du återställer en databas till stordataklustrets huvudinstans.

  1. Ladda ned filen TutorialDB.bak.

  2. Följ anvisningarna i Återställa en databas från en säkerhetskopia i Azure Data Studio med hjälp av följande information:

    • Importera från filen TutorialDB.bak som du laddade ned.
    • Ge måldatabasen namnet TutorialDB.
  3. Du kan kontrollera att den återställde databasen finns genom att fråga tabellen dbo.rental_data :

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    
  1. Ladda ned filen TutorialDB.bak.

  2. Följ anvisningarna i Återställ en databas till Azure SQL Managed Instance i SQL Server Management Studio med hjälp av följande information:

    • Importera från filen TutorialDB.bak som du laddade ned.
    • Ge måldatabasen namnet TutorialDB.
  3. Du kan kontrollera att den återställde databasen finns genom att fråga tabellen dbo.rental_data :

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    

Rensa resurser

Om du inte ska fortsätta med den här självstudien, bör du ta bort databasen TutorialDB.

Nästa steg

I del ett av den här självstudieserien har du slutfört följande steg:

  • Förutsättningarna har installerats
  • Importera en exempeldatabas

Om du vill förbereda data från TutorialDB-databasen följer du del två i den här självstudieserien: