Delen via


Implementatieoverzicht voor Azure AI Foundry-modellen

De modelcatalogus in Azure AI Foundry is de hub voor het detecteren en gebruiken van een breed scala aan Foundry-modellen voor het bouwen van generatieve AI-toepassingen. U moet modellen implementeren om ze beschikbaar te maken voor het ontvangen van deductieaanvragen. Azure AI Foundry biedt een uitgebreide reeks implementatieopties voor Foundry-modellen, afhankelijk van uw behoeften en modelvereisten.

Implementatieopties

Azure AI Foundry biedt verschillende implementatieopties, afhankelijk van het type modellen en resources dat u moet inrichten. De volgende implementatieopties zijn beschikbaar:

  • Standaardimplementatie in Azure AI Foundry-resources
  • Implementatie naar serverloze API-eindpunten
  • Implementatie naar beheerde computers

Azure AI Foundry Portal kan automatisch een implementatieoptie kiezen op basis van uw omgeving en configuratie. Gebruik waar mogelijk Azure AI Foundry-resources voor implementatie. Modellen die ondersteuning bieden voor meerdere implementatieopties, worden standaard ingesteld op Azure AI Foundry-resources voor implementatie. Als u toegang wilt krijgen tot andere implementatieopties, gebruikt u de Azure CLI of Azure Machine Learning SDK voor implementatie.

Standaardimplementatie in Azure AI Foundry-resources

Azure AI Foundry-resources (voorheen Azure AI Services-resources genoemd) is de voorkeursimplementatieoptie in Azure AI Foundry. Het biedt het breedste scala aan mogelijkheden, waaronder regionale, gegevenszone of wereldwijde verwerking, en het biedt standaard- en geprovisioneerde doorvoeropties (PTU). Vlaggenschipmodellen in Azure AI Foundry Models ondersteunen deze implementatieoptie.

Deze implementatieoptie is beschikbaar in:

  • Azure AI Foundry-resources
  • Azure OpenAI-resources1
  • Azure AI Hub, wanneer deze is verbonden met een Azure AI Foundry-resource

1Als u Azure OpenAI-resources gebruikt, toont de modelcatalogus alleen Azure OpenAI in Foundry Models voor implementatie. U kunt de volledige lijst met Foundry-modellen ophalen door een upgrade uit te voeren naar een Azure AI Foundry-resource.

Zie Instructies voor het implementeren van modellen in Azure AI Foundry-modellen om aan de slag te gaan met standaardimplementatie in Azure AI Foundry-resources.

Serverloze API-eindpunt

Deze implementatieoptie is alleen beschikbaar inAzure AI Hub-resources. Hiermee kunt u toegewezen eindpunten maken om het model te hosten, toegankelijk via een API. Azure AI Foundry Models ondersteunen serverloze API-eindpunten met betalen per gebruik-facturering en u kunt alleen regionale implementaties maken voor serverloze API-eindpunten.

Zie Modellen implementeren als serverloze API-implementaties om aan de slag te gaan met implementatie naar een serverloos API-eindpunt.

Volledig beheerde rekenprocessen

Deze implementatieoptie is alleen beschikbaar inAzure AI Hub-resources. Hiermee kunt u een toegewezen eindpunt maken om het model te hosten in een toegewezen rekenproces. U moet rekencapaciteit in uw abonnement hebben voor het hosten van het model, en u wordt gefactureerd per computetijd.

Beheerde rekenkrachtimplementatie is vereist voor modelverzamelingen met:

  • Knuffelend gezicht
  • NVIDIA-inferentiemicroservices (NIM's)
  • Industriemodellen (Saifr, Rockwell, Bayer, Cerence, Sight Machine, Page AI, SDAIA)
  • Databricks
  • Aangepaste modellen

Zie Hoe u een beheerde rekenimplementatie implementeert en inferentie uitvoert en Azure AI Foundry-modellen implementeert voor beheerde rekenkracht met betalen per gebruik-facturering.

Mogelijkheden voor de implementatieopties

Gebruik waar mogelijk Standard-implementaties in Azure AI Foundry-resources . Deze implementatieoptie biedt de meeste mogelijkheden onder de beschikbare implementatieopties. De volgende tabel bevat details over specifieke mogelijkheden voor elke implementatieoptie:

Vermogen Standaardimplementatie in Azure AI Foundry-resources Serverloze API-eindpunt Volledig beheerde rekenprocessen
Welke modellen kunnen worden geïmplementeerd? Foundry-modellen Foundry-modellen met betalen per gebruik-facturering Geopende en aangepaste modellen
Uitrolmiddel Azure AI Foundryresource AI-project (in AI-hubresource) AI-project (in AI-hubresource)
Vereist AI-hubs Nee. Ja Ja
Opties voor gegevensverwerking Regionaal
Gegevenszone
Globaal
Regionaal Regionaal
Privénetwerken Ja Ja Ja
Inhoud filteren Ja Ja Nee.
Aangepaste inhoudsfiltering Ja Nee. Nee.
Sleutelloze verificatie Ja Nee. Nee.
Factureringsbasissen Tokengebruik en toegewezen doorvoereenheden Tokengebruik2 Rekenkernuren3

2 Een minimale eindpuntinfrastructuur wordt per minuut gefactureerd. U wordt niet gefactureerd voor de infrastructuur die als host fungeert voor het model in serverloze implementatie. Nadat u het eindpunt hebt verwijderd, worden er geen verdere kosten meer in rekening gebracht.

3 Facturering is per minuut, afhankelijk van de productlaag en het aantal exemplaren dat in de implementatie wordt gebruikt sinds het moment van maken. Nadat u het eindpunt hebt verwijderd, worden er geen verdere kosten meer in rekening gebracht.