Python-zelfstudie: Een lineair regressiemodel implementeren met SQL Machine Learning

2025-10-31

Van toepassing op: SQL Server 2017 (14.x) en latere versies van Azure SQL Managed Instance

In deel vier van deze vierdelige reeks zelfstudies implementeert u een lineair regressiemodel dat in Python is ontwikkeld in een SQL Server-database met behulp van Machine Learning Services of Big Data-clusters.

In deel vier van deze vierdelige reeks zelfstudies implementeert u een lineair regressiemodel dat in Python is ontwikkeld in een SQL Server-database met behulp van Machine Learning Services.

In deel vier van deze vierdelige reeks zelfstudies implementeert u een lineair regressiemodel dat in Python is ontwikkeld in een Azure SQL Managed Instance-database met behulp van Machine Learning Services.

In dit artikel leert u het volgende:

Een opgeslagen procedure maken waarmee het machine learning-model wordt gegenereerd
Het model opslaan in een databasetabel
Een opgeslagen procedure maken die voorspellingen doet met behulp van het model
Het model uitvoeren met nieuwe gegevens

In deel 1 hebt u geleerd hoe u de voorbeelddatabase kunt herstellen.

In deel twee hebt u geleerd hoe u de gegevens uit een database in een Python-gegevensframe laadt en de gegevens voorbereidt in Python.

In deel drie hebt u geleerd hoe u een lineair machine learning-model voor regressie traint in Python.

Vereiste voorwaarden

In deel vier van deze zelfstudie wordt ervan uitgegaan dat u deel één en de bijbehorende vereisten hebt voltooid.

Een opgeslagen procedure maken waarmee het model wordt gegenereerd

Maak nu met behulp van de Python-scripts die u hebt ontwikkeld een opgeslagen procedure generate_rental_py_model die het lineaire regressiemodel traint en genereert met behulp van LinearRegression van scikit-learn.

Voer de volgende T-SQL-instructie uit in Azure Data Studio om de opgeslagen procedure te maken om het model te trainen.

-- Stored procedure that trains and generates a Python model using the rental_data and a linear regression algorithm
DROP PROCEDURE IF EXISTS generate_rental_py_model;
go
CREATE PROCEDURE generate_rental_py_model (@trained_model varbinary(max) OUTPUT)
AS
BEGIN
    EXECUTE sp_execute_external_script
      @language = N'Python'
    , @script = N'
from sklearn.linear_model import LinearRegression
import pickle

df = rental_train_data

# Get all the columns from the dataframe.
columns = df.columns.tolist()

# Store the variable well be predicting on.
target = "RentalCount"

# Initialize the model class.
lin_model = LinearRegression()

# Fit the model to the training data.
lin_model.fit(df[columns], df[target])

# Before saving the model to the DB table, convert it to a binary object
trained_model = pickle.dumps(lin_model)'

, @input_data_1 = N'select "RentalCount", "Year", "Month", "Day", "WeekDay", "Snow", "Holiday" from dbo.rental_data where Year < 2015'
, @input_data_1_name = N'rental_train_data'
, @params = N'@trained_model varbinary(max) OUTPUT'
, @trained_model = @trained_model OUTPUT;
END;
GO

Het model opslaan in een databasetabel

Maak een tabel in de TutorialDB-database en sla het model vervolgens op in de tabel.

Voer de volgende T-SQL-instructie uit in Azure Data Studio om een tabel te maken met de naam dbo.rental_py_models die wordt gebruikt om het model op te slaan.

USE TutorialDB;
DROP TABLE IF EXISTS dbo.rental_py_models;
GO
CREATE TABLE dbo.rental_py_models (
    model_name VARCHAR(30) NOT NULL DEFAULT('default model') PRIMARY KEY,
    model VARBINARY(MAX) NOT NULL
);
GO

Sla het model op in de tabel als een binair object, met de modelnaam linear_model.

DECLARE @model VARBINARY(MAX);
EXECUTE generate_rental_py_model @model OUTPUT;

INSERT INTO rental_py_models (model_name, model) VALUES('linear_model', @model);

Een opgeslagen procedure maken waarmee voorspellingen worden gedaan

Maak een opgeslagen procedure py_predict_rentalcount die voorspellingen doet met behulp van het getrainde model en een set nieuwe gegevens. Voer de onderstaande T-SQL uit in Azure Data Studio.

DROP PROCEDURE IF EXISTS py_predict_rentalcount;
GO
CREATE PROCEDURE py_predict_rentalcount (@model varchar(100))
AS
BEGIN
    DECLARE @py_model varbinary(max) = (select model from rental_py_models where model_name = @model);

    EXECUTE sp_execute_external_script
                @language = N'Python',
                @script = N'

# Import the scikit-learn function to compute error.
from sklearn.metrics import mean_squared_error
import pickle
import pandas

rental_model = pickle.loads(py_model)

df = rental_score_data

# Get all the columns from the dataframe.
columns = df.columns.tolist()

# Variable you will be predicting on.
target = "RentalCount"

# Generate the predictions for the test set.
lin_predictions = rental_model.predict(df[columns])
print(lin_predictions)

# Compute error between the test predictions and the actual values.
lin_mse = mean_squared_error(lin_predictions, df[target])
#print(lin_mse)

predictions_df = pandas.DataFrame(lin_predictions)

OutputDataSet = pandas.concat([predictions_df, df["RentalCount"], df["Month"], df["Day"], df["WeekDay"], df["Snow"], df["Holiday"], df["Year"]], axis=1)
'
, @input_data_1 = N'Select "RentalCount", "Year" ,"Month", "Day", "WeekDay", "Snow", "Holiday"  from rental_data where Year = 2015'
, @input_data_1_name = N'rental_score_data'
, @params = N'@py_model varbinary(max)'
, @py_model = @py_model
with result sets (("RentalCount_Predicted" float, "RentalCount" float, "Month" float,"Day" float,"WeekDay" float,"Snow" float,"Holiday" float, "Year" float));

END;
GO

Maak een tabel voor het opslaan van de voorspellingen.

DROP TABLE IF EXISTS [dbo].[py_rental_predictions];
GO

CREATE TABLE [dbo].[py_rental_predictions](
 [RentalCount_Predicted] [int] NULL,
 [RentalCount_Actual] [int] NULL,
 [Month] [int] NULL,
 [Day] [int] NULL,
 [WeekDay] [int] NULL,
 [Snow] [int] NULL,
 [Holiday] [int] NULL,
 [Year] [int] NULL
) ON [PRIMARY]
GO

Voer de opgeslagen procedure uit om het aantal verhuur te voorspellen

--Insert the results of the predictions for test set into a table
INSERT INTO py_rental_predictions
EXEC py_predict_rentalcount 'linear_model';

-- Select contents of the table
SELECT * FROM py_rental_predictions;

U zou resultaten moeten zien die er ongeveer als volgt uitzien.

Voorspellingsresultaten van opgeslagen procedure

U hebt een model gemaakt, getraind en geïmplementeerd. Vervolgens hebt u dat model in een opgeslagen procedure gebruikt om waarden te voorspellen op basis van nieuwe gegevens.

Volgende stappen

In deel vier van deze reeks zelfstudies hebt u de volgende stappen uitgevoerd:

Een opgeslagen procedure maken waarmee het machine learning-model wordt gegenereerd
Het model opslaan in een databasetabel
Een opgeslagen procedure maken die voorspellingen doet met behulp van het model
Het model uitvoeren met nieuwe gegevens

Zie voor meer informatie over het gebruik van Python met SQL Machine Learning:

Python-tutorials

Feedback

Is deze pagina nuttig?