Delen via


Python-zelfstudie: Skiverhuur voorspellen met lineaire regressie met SQL Machine Learning

Van toepassing op: SQL Server 2017 (14.x) en latere versies van Azure SQL Managed Instance

In deze vierdelige reeks zelfstudies gebruikt u Python en lineaire regressie in SQL Server Machine Learning Services of op SQL Server 2019 Big Data Clusters om het aantal skiverhuur te voorspellen. In de zelfstudie wordt een Python-notebook gebruikt in Azure Data Studio.

In deze vierdelige reeks zelfstudies gebruikt u Python en lineaire regressie in SQL Server Machine Learning Services om het aantal skiverhuur te voorspellen. In de zelfstudie wordt een Python-notebook gebruikt in Azure Data Studio.

In deze vierdelige reeks zelfstudies gebruikt u Python en lineaire regressie in Azure SQL Managed Instance Machine Learning Services om het aantal skiverhuur te voorspellen. In de zelfstudie wordt een Python-notebook gebruikt in Azure Data Studio.

Stel dat u eigenaar bent van een skiverhuurbedrijf en u het aantal verhuur wilt voorspellen dat u op een toekomstige datum hebt. Met deze informatie kunt u uw voorraad, personeel en faciliteiten voorbereiden.

In het eerste deel van deze serie wordt u voorbereid op de vereisten. In deel twee en drie ontwikkelt u enkele Python-scripts in een notebook om uw gegevens voor te bereiden en een machine learning-model te trainen. Vervolgens voert u in deel drie deze Python-scripts uit in de database met behulp van op T-SQL opgeslagen procedures.

In dit artikel leert u het volgende:

  • Een voorbeelddatabase importeren

In deel twee leert u hoe u de gegevens uit een database laadt in een Python-gegevensframe en de gegevens voorbereidt in Python.

In deel drie leert u hoe u een lineair regressiemodel traint in Python.

In deel vier leert u hoe u het model opslaat in een database en vervolgens opgeslagen procedures maakt op basis van de Python-scripts die u in deel twee en drie hebt ontwikkeld. De opgeslagen procedures worden uitgevoerd op de server om voorspellingen te doen op basis van nieuwe gegevens.

Vereiste voorwaarden

  • Python IDE : in deze zelfstudie wordt gebruikgemaakt van een Python-notebook in Azure Data Studio. Zie Notebooks gebruiken in Azure Data Studio voor meer informatie.

  • SQL-queryprogramma : in deze zelfstudie wordt ervan uitgegaan dat u Azure Data Studio gebruikt.

  • Aanvullende Python-pakketten: in de voorbeelden in deze reeks zelfstudies worden de volgende Python-pakketten gebruikt die mogelijk niet standaard worden geïnstalleerd:

    • Pandas
    • pyodbc
    • scikit-learn

    Ga als volgt te werk om deze pakketten te installeren:

    1. Selecteer Pakketten beheren in uw Azure Data Studio-notebook.
    2. Selecteer in het deelvenster Pakketten beheren het tabblad Nieuwe toevoegen .
    3. Voer voor elk van de volgende pakketten de pakketnaam in, selecteer Zoeken en selecteer Vervolgens Installeren.

    Als alternatief kunt u een opdrachtprompt openen, het installatiepad wijzigen voor de versie van Python die u gebruikt in Azure Data Studio (bijvoorbeeld cd %LocalAppData%\Programs\Python\Python37-32), en vervolgens pip install uitvoeren voor elk pakket.

De voorbeelddatabase herstellen

De voorbeelddatabase die in deze zelfstudie wordt gebruikt, is opgeslagen in een back-upbestand van de .bak database, zodat u deze kunt downloaden en gebruiken.

Opmerking

Als u Machine Learning Services op SQL Server 2019 Big Data-clusters gebruikt, kunt u zien hoe u een database herstelt in het hoofdexemplaar van het big data-cluster.

  1. Download het bestand TutorialDB.bak.

  2. Volg de aanwijzingen in Een database herstellen vanuit een back-upbestand in Azure Data Studio met behulp van deze details:

    • Importeer het TutorialDB.bak bestand dat u hebt gedownload.
    • Geef de doeldatabase TutorialDBeen naam.
  3. U kunt controleren of de herstelde database bestaat door een query uit te voeren op de dbo.rental_data tabel:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    
  1. Download het bestand TutorialDB.bak.

  2. Volg de aanwijzingen in Een database herstellen naar Azure SQL Managed Instance in SQL Server Management Studio met behulp van deze details:

    • Importeer het TutorialDB.bak bestand dat u hebt gedownload.
    • Geef de doeldatabase TutorialDBeen naam.
  3. U kunt controleren of de herstelde database bestaat door een query uit te voeren op de dbo.rental_data tabel:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    

De hulpbronnen opschonen

Als u niet verdergaat met deze handleiding, verwijder de TutorialDB database.

Volgende stap

In deel één van deze reeks zelfstudies hebt u deze stappen voltooid:

  • De vereisten geïnstalleerd
  • Een voorbeelddatabase importeren

Volg deel twee van deze reeks zelfstudies om de gegevens uit de TutorialDB-database voor te bereiden: