Delen via


Modellen implementeren als standaardimplementatie

In dit artikel leert u hoe u een model implementeert vanuit de modelcatalogus als een standaardimplementatie.

Bepaalde modellen in de modelcatalogus kunnen worden geïmplementeerd als een standaardimplementatie met Standard-facturering. Dit implementatietype biedt een manier om modellen als API te gebruiken zonder ze te hosten in uw abonnement, terwijl de bedrijfsbeveiliging en -naleving die organisaties nodig hebben, behouden blijven. Voor deze implementatieoptie is geen quotum van uw abonnement vereist.

In dit artikel wordt een Meta Llama-modelimplementatie gebruikt voor illustratie. U kunt echter dezelfde stappen gebruiken om alle modellen in de modelcatalogus te implementeren die beschikbaar zijn voor standaardimplementatie.

Vereisten

  • Een Azure-abonnement met een geldige betalingswijze. Gratis of proefversie van Azure-abonnementen werkt niet. Als u geen Azure-abonnement hebt, maakt u eerst een betaald Azure-account .

  • Een Azure Machine Learning-werkruimte.

  • Op rollen gebaseerd toegangsbeheer van Azure (Azure RBAC) wordt gebruikt om toegang te verlenen tot bewerkingen in Azure Machine Learning. Als u de stappen in dit artikel wilt uitvoeren, moet aan uw gebruikersaccount de Azure AI Developer-rol voor de resourcegroep zijn toegewezen. Zie op rollen gebaseerd toegangsbeheer in Azure Machine Learning voor meer informatie over machtigingen.

  • U moet de volgende software installeren om te kunnen werken met Azure Machine Learning:

    U kunt elke compatibele webbrowser gebruiken om door Azure Machine Learning te navigeren.

Uw model en model-id zoeken in de modelcatalogus

  1. Meld u aan bij Azure Machine Learning-studio

  2. Voor modellen die worden aangeboden via Azure Marketplace, moet u ervoor zorgen dat uw account de rolmachtigingen voor Azure AI-ontwikkelaars heeft voor de resourcegroep of dat u voldoet aan de machtigingen die nodig zijn om u te abonneren op modelaanbiedingen.

    Modellen die worden aangeboden door niet-Microsoft-providers (bijvoorbeeld Llama- en Mistral-modellen) worden gefactureerd via Azure Marketplace. Voor dergelijke modellen moet u uw werkruimte inschrijven voor het specifieke modelaanbod. Modellen die worden aangeboden door Microsoft (bijvoorbeeld Phi-3-modellen) hebben deze vereiste niet, omdat facturering anders wordt uitgevoerd. Voor meer informatie over de facturering van serverloze implementaties van modellen in de modelcatalogus, zie Facturering voor standaardimplementaties.

  3. Ga naar uw werkruimte. Als u de standaardimplementatie wilt gebruiken, moet uw werkruimte behoren tot een van de regio's die worden ondersteund voor serverloze implementatie voor het specifieke model dat u wilt implementeren.

  4. Selecteer Modelcatalogus in de linkerzijbalk en zoek de modelkaart van het model dat u wilt implementeren. In dit artikel selecteert u een Bria-2.3-Fast-model .

    1. Als u het model implementeert met behulp van Azure CLI, Python SDK of ARM, kopieert u de model-id.

    Belangrijk

    Neem de versie niet op bij het kopiëren van de model-id. Standaardimplementaties implementeren altijd de nieuwste versie van het model die beschikbaar is. Bijvoorbeeld, voor de model-id azureml://registries/azureml-bria/models/Bria-2.3-Fast/versions/1, kopieer azureml://registries/azureml-bria/models/Bria-2.3-Fast.

    Een schermopname van de detailpagina van een model.

In de volgende sectie worden de stappen beschreven voor het abonneren van uw werkruimte op een modelaanbod. U kunt deze sectie overslaan en naar Het model implementeren in een standaardimplementatie gaan als u een Microsoft-model implementeert.

Abonneer uw werkruimte op het modelaanbod

Standaardimplementaties kunnen zowel door Microsoft als niet-Microsoft aangeboden modellen implementeren. Voor Microsoft-modellen (zoals Phi-3-modellen) hoeft u geen Azure Marketplace-abonnement te maken en kunt u ze rechtstreeks implementeren in standaardimplementaties om hun voorspellingen te gebruiken. Voor niet-Microsoft-modellen moet u eerst het abonnement maken. Als het de eerste keer is dat u het model in de werkruimte implementeert, moet u zich abonneren op uw werkruimte voor het specifieke modelaanbod van Azure Marketplace. Elke werkruimte heeft een eigen abonnement op de specifieke Azure Marketplace-aanbieding van het model, waarmee u uitgaven kunt beheren en bewaken.

Notitie

Modellen die via Azure Marketplace worden aangeboden, zijn beschikbaar voor implementatie naar standaardimplementaties in specifieke regio's. Controleer de beschikbaarheid van regio's voor modellen in standaardimplementaties om te controleren welke modellen en regio's beschikbaar zijn. Als de werkruimte die u nodig hebt niet wordt vermeld, kunt u implementeren in een werkruimte in een ondersteunde regio en vervolgens standaardimplementaties uit een andere werkruimte gebruiken.

  1. Maak het Marketplace-abonnement van het model. Wanneer u een abonnement maakt, accepteert u de voorwaarden die zijn gekoppeld aan de modelaanbieding. Houd er rekening mee dat u deze stap niet hoeft uit te voeren voor door Microsoft aangeboden modellen (zoals Phi-3).

    1. Selecteer Op de pagina Details van het model de optie Dit model gebruiken. Er wordt een venster Implementatieopties geopend, zodat u de keuze hebt tussen standaardimplementatie (serverloze API) en implementatie met behulp van een beheerde berekening.

      Een schermopname van het dialoogvenster voor het kiezen tussen standaardimplementaties en beheerde berekeningen.

      Notitie

      Voor modellen die alleen via standaardimplementatie kunnen worden geïmplementeerd, wordt de wizard Standaardimplementatie geopend nadat u dit model op de detailpagina van het model gebruiken hebt geselecteerd.

    2. Selecteer serverloze API om de standaardimplementatiewizard te openen.

      Een schermopname die laat zien hoe u een model implementeert met de standaardimplementatieoptie.

    3. Als u de opmerking Ziet dat u al een Azure Marketplace-abonnement voor deze werkruimte hebt, hoeft u het abonnement niet te maken omdat u er al een hebt. U kunt doorgaan met het implementeren van het model naar een standaardimplementatie.

    4. Selecteer in de implementatiewizard de koppeling naar azure Marketplace-voorwaarden voor meer informatie over de gebruiksvoorwaarden. U kunt ook het tabblad Prijzen en voorwaarden selecteren voor meer informatie over prijzen voor het geselecteerde model.

    5. Selecteer in de implementatiewizard de koppeling naar azure Marketplace-voorwaarden voor meer informatie over de gebruiksvoorwaarden. U kunt ook het tabblad Details van marketplace-aanbiedingen selecteren voor meer informatie over prijzen voor het geselecteerde model.

    6. Selecteer Abonneren en implementeren.

  2. Nadat u zich hebt geabonneerd op de werkruimte voor het specifieke Azure Marketplace-aanbod, hoeven volgende implementaties van dezelfde aanbieding in dezelfde werkruimte zich niet opnieuw te abonneren.

  3. U kunt op elk gewenst moment zien op welke modelaanbiedingen uw werkruimte momenteel is geabonneerd.

    1. Ga naar de Azure-portal

    2. Navigeer naar de resourcegroep waartoe de werkruimte behoort.

    3. Selecteer SaaS in het filter Type.

    4. U ziet alle aanbiedingen waarvoor u momenteel bent geabonneerd.

    5. Selecteer een resource om de details te bekijken.

Het model implementeren in een standaardimplementatie

Zodra u een abonnement voor een niet-Microsoft-model hebt gemaakt, kunt u het bijbehorende model implementeren in een standaardimplementatie. Voor Microsoft-modellen (zoals Phi-3-modellen) hoeft u geen abonnement te maken.

De standaardimplementatie biedt een manier om modellen als EEN API te gebruiken zonder deze te hosten voor uw abonnement, terwijl de bedrijfsbeveiligings- en nalevingsorganisaties nodig blijven. Voor deze implementatieoptie is geen quotum van uw abonnement vereist.

In deze sectie maakt u een eindpunt met de naam Bria-2.3-Fast.

  1. Het serverloze eindpunt maken

    1. Als u een Microsoft-model wilt implementeren waarvoor u zich niet hoeft te abonneren op een modelaanbod, selecteert u Dit model gebruiken en selecteert u vervolgens Serverloze API om de implementatiewizard te openen.

    2. Als u uw werkruimte hebt geabonneerd op de modelaanbieding in de vorige sectie, kunt u ook implementeren selecteren voor een niet-Microsoft-model waarvoor een modelabonnement is vereist. U kunt ook Doorgaan met uitrollen selecteren (als de implementatiewizard de opmerking bevat dat u al een Azure Marketplace-abonnement voor deze werkruimte heeft).

      Een schermopname van een werkruimte die al is geabonneerd op het aanbod.

    3. Geef de implementatie een naam. Deze naam maakt deel uit van de URL van de implementatie-API. Deze URL moet uniek zijn in elke Azure-regio.

      Een schermopname die laat zien hoe u de naam opgeeft van de implementatie die u wilt maken.

      Aanbeveling

      De optie Inhoudsfilter (preview) is standaard ingeschakeld. Laat de standaardinstelling voor de service staan om schadelijke inhoud te detecteren, zoals haat, zelfbeschadiging, seksuele en gewelddadige inhoud. Zie voor meer informatie over inhoudsfiltering (preview) Inhoudsveiligheid voor modellen die zijn geïmplementeerd via standaardimplementaties.

    4. Selecteer Implementeren. Wacht totdat de implementatie gereed is en u wordt omgeleid naar de pagina Implementaties.

  2. U kunt op elk moment de eindpunten zien die zijn geïmplementeerd in uw werkruimte:

    1. Ga naar uw werkruimte.

    2. Selecteer Eindpunten.

    3. Selecteer het tabblad Serverloze eindpunten om de standaardimplementaties weer te geven.

  3. Het gemaakte eindpunt maakt gebruik van sleutelverificatie voor autorisatie. Gebruik de volgende stappen om de sleutels op te halen die zijn gekoppeld aan een bepaald eindpunt.

    1. Als u wilt terugkeren naar de pagina van de implementatie, selecteert u de naam van het eindpunt in de lijst met serverloze eindpunten.
    2. Noteer de doel-URI en sleutel van het eindpunt. Gebruik deze om de implementatie aan te roepen en voorspellingen te genereren.

    Notitie

    Wanneer u Azure Portal gebruikt, worden standaardimplementaties niet standaard weergegeven in de resourcegroep. Gebruik de optie Verborgen typen weergeven om deze in de resourcegroep weer te geven.

  4. Op dit moment is uw eindpunt gereed om te worden gebruikt.

  5. Als u deze implementatie vanuit een andere werkruimte wilt gebruiken of als u van plan bent om promptstroom te gebruiken om intelligente toepassingen te bouwen, moet u een verbinding maken met de standaardimplementatie. Zie Gebruik geïmplementeerde standaardimplementaties vanuit een andere werkruimte of via Prompt Flow om te leren hoe u een bestaande standaardimplementatie in een nieuwe werkruimte of hub kunt configureren.

    Aanbeveling

    Als u een promptstroom gebruikt in dezelfde werkruimte waarin de implementatie is geïmplementeerd, moet u nog steeds de verbinding maken.

De standaardimplementatie gebruiken

Modellen die zijn geïmplementeerd in Azure Machine Learning en Azure AI Foundry in standaardimplementaties ondersteunen de Azure AI-modeldeductie-API die een gemeenschappelijke set mogelijkheden voor basismodellen beschikbaar maakt en die door ontwikkelaars kan worden gebruikt om voorspellingen van een diverse set modellen op een uniforme en consistente manier te gebruiken.

Lees meer over de mogelijkheden van deze API en hoe u deze kunt gebruiken bij het bouwen van toepassingen.

Eindpunten en abonnementen verwijderen

U kunt modelabonnementen en -eindpunten verwijderen. Als u een modelabonnement verwijdert, wordt ieder gekoppeld eindpunt Ongezond en onbruikbaar.

Een standaardimplementatie verwijderen:

  1. Ga naar Azure Machine Learning-studio.

  2. Selecteer Eindpunten in de linkerzijbalk.

  3. Selecteer het tabblad Serverloze eindpunten om de standaardimplementaties weer te geven.

  4. Open het eindpunt dat u wilt verwijderen.

  5. Selecteer Verwijderen.

Het gekoppelde modelabonnement verwijderen:

  1. Ga naar de Azure-portal

  2. Navigeer naar de resourcegroep waartoe de werkruimte behoort.

  3. Selecteer SaaS in het filter Type.

  4. Selecteer het abonnement dat u wilt verwijderen.

  5. Selecteer Verwijderen.

Kosten- en quotumoverwegingen voor modellen die zijn geïmplementeerd als standaardimplementaties

Het quotum wordt beheerd per implementatie. Elke implementatie heeft een frequentielimiet van 200.000 tokens per minuut en 1000 API-aanvragen per minuut. Momenteel beperken we echter tot één implementatie per model per werkruimte. Neem contact op met de ondersteuning voor Microsoft Azure als de huidige frequentielimieten niet voldoende zijn voor uw scenario's.

Kosten voor Microsoft-modellen

U vindt de prijsinformatie op het tabblad Prijzen en voorwaarden van de implementatiewizard bij het implementeren van Microsoft-modellen (zoals Phi-3-modellen) als standaardimplementaties.

Kosten voor niet-Microsoft-modellen

Niet-Microsoft-modellen die als standaardimplementaties worden geïmplementeerd, worden aangeboden via Azure Marketplace en geïntegreerd met Azure AI Foundry voor gebruik. U vindt prijzen van Azure Marketplace bij het implementeren of verfijnen van deze modellen.

Telkens wanneer een werkruimte zich abonneert op een bepaalde aanbieding van Azure Marketplace, wordt er een nieuwe resource gemaakt om de kosten bij te houden die zijn gekoppeld aan het verbruik. Dezelfde resource wordt gebruikt om de kosten te traceren die zijn gekoppeld aan deductie en verfijning; er zijn echter meerdere meters beschikbaar om elk scenario onafhankelijk te traceren.

Zie Kosten bewaken voor modellen die worden aangeboden via Azure Marketplace voor meer informatie over het bijhouden van kosten.

Een schermopname van verschillende resources die overeenkomen met verschillende modelaanbiedingen en de bijbehorende meters.

Vereiste machtigingen voor het abonneren op modelaanbiedingen

Op rollen gebaseerd toegangsbeheer van Azure (Azure RBAC) wordt gebruikt om toegang te verlenen tot bewerkingen in Azure Machine Learning. Als u de stappen in dit artikel wilt uitvoeren, moet aan uw gebruikersaccount de rol Eigenaar, Inzender of Azure AI Developer voor het Azure-abonnement zijn toegewezen. U kunt ook een aangepaste rol aan uw account toewijzen met de volgende machtigingen:

  • In het Azure-abonnement: als u de werkruimte wilt abonneren op een Azure Marketplace-aanbieding, één keer voor elke werkruimte, per aanbieding:

    • Microsoft.MarketplaceOrdering/agreements/offers/plans/read
    • Microsoft.MarketplaceOrdering/agreements/offers/plans/sign/action
    • Microsoft.MarketplaceOrdering/offerTypes/publishers/offers/plans/agreements/read
    • Microsoft.Marketplace/offerTypes/publishers/offers/plans/agreements/read
    • Microsoft.SaaS/register/action
  • In de resourcegroep—om de SaaS-resource te maken en te gebruiken:

    • Microsoft.SaaS/resources/read
    • Microsoft.SaaS/resources/write
  • In de werkruimte—als u eindpunten wilt implementeren (de azure Machine Learning-gegevenswetenschapperrol bevat deze machtigingen al):

    • Microsoft.MachineLearningServices/workspaces/marketplaceModelSubscriptions/*
    • Microsoft.MachineLearningServices/workspaces/serverlessEndpoints/*

Zie Beheer toegang tot een Azure Machine Learning-werkruimte voor meer informatie over machtigingen.