Implementatieoverzicht voor Azure AI Foundry-modellen

2025-09-22

De modelcatalogus in Azure AI Foundry is de hub voor het detecteren en gebruiken van een breed scala aan Foundry-modellen voor het bouwen van generatieve AI-toepassingen. U moet modellen implementeren om ze beschikbaar te maken voor het ontvangen van deductieaanvragen. Azure AI Foundry biedt een uitgebreide reeks implementatieopties voor Foundry-modellen, afhankelijk van uw behoeften en modelvereisten.

Implementatieopties

Azure AI Foundry biedt verschillende implementatieopties, afhankelijk van het type modellen en resources dat u moet inrichten. De volgende implementatieopties zijn beschikbaar:

Standaardimplementatie in Azure AI Foundry-resources
Implementatie naar serverloze API-eindpunten
Implementatie naar beheerde computers

Azure AI Foundry Portal kan automatisch een implementatieoptie kiezen op basis van uw omgeving en configuratie. Gebruik waar mogelijk Azure AI Foundry-resources voor implementatie. Modellen die ondersteuning bieden voor meerdere implementatieopties, worden standaard ingesteld op Azure AI Foundry-resources voor implementatie. Als u toegang wilt krijgen tot andere implementatieopties, gebruikt u de Azure CLI of Azure Machine Learning SDK voor implementatie.

Standaardimplementatie in Azure AI Foundry-resources

Azure AI Foundry-resources (voorheen Azure AI Services-resources genoemd) is de voorkeursimplementatieoptie in Azure AI Foundry. Het biedt het breedste scala aan mogelijkheden, waaronder regionale, gegevenszone of wereldwijde verwerking, en het biedt standaard- en geprovisioneerde doorvoeropties (PTU). Vlaggenschipmodellen in Azure AI Foundry Models ondersteunen deze implementatieoptie.

Deze implementatieoptie is beschikbaar in:

Azure AI Foundry-resources
Azure OpenAI-resources¹
Azure AI Hub, wanneer deze is verbonden met een Azure AI Foundry-resource

¹Als u Azure OpenAI-resources gebruikt, toont de modelcatalogus alleen Azure OpenAI in Foundry Models voor implementatie. U kunt de volledige lijst met Foundry-modellen ophalen door een upgrade uit te voeren naar een Azure AI Foundry-resource.

Zie Instructies voor het implementeren van modellen in Azure AI Foundry-modellen om aan de slag te gaan met standaardimplementatie in Azure AI Foundry-resources.

Serverloze API-eindpunt

Deze implementatieoptie is alleen beschikbaar inAzure AI Hub-resources. Hiermee kunt u toegewezen eindpunten maken om het model te hosten, toegankelijk via een API. Azure AI Foundry Models ondersteunen serverloze API-eindpunten met betalen per gebruik-facturering en u kunt alleen regionale implementaties maken voor serverloze API-eindpunten.

Zie Modellen implementeren als serverloze API-implementaties om aan de slag te gaan met implementatie naar een serverloos API-eindpunt.

Volledig beheerde rekenprocessen

Deze implementatieoptie is alleen beschikbaar inAzure AI Hub-resources. Hiermee kunt u een toegewezen eindpunt maken om het model te hosten in een toegewezen rekenproces. U moet rekencapaciteit in uw abonnement hebben voor het hosten van het model, en u wordt gefactureerd per computetijd.

Beheerde rekenkrachtimplementatie is vereist voor modelverzamelingen met:

Knuffelend gezicht
NVIDIA-inferentiemicroservices (NIM's)
Industriemodellen (Saifr, Rockwell, Bayer, Cerence, Sight Machine, Page AI, SDAIA)
Databricks
Aangepaste modellen

Zie Hoe u een beheerde rekenimplementatie implementeert en inferentie uitvoert en Azure AI Foundry-modellen implementeert voor beheerde rekenkracht met betalen per gebruik-facturering.

Mogelijkheden voor de implementatieopties

Gebruik waar mogelijk Standard-implementaties in Azure AI Foundry-resources . Deze implementatieoptie biedt de meeste mogelijkheden onder de beschikbare implementatieopties. De volgende tabel bevat details over specifieke mogelijkheden voor elke implementatieoptie:

Vermogen	Standaardimplementatie in Azure AI Foundry-resources	Serverloze API-eindpunt	Volledig beheerde rekenprocessen
Welke modellen kunnen worden geïmplementeerd?	Foundry-modellen	Foundry-modellen met betalen per gebruik-facturering	Geopende en aangepaste modellen
Uitrolmiddel	Azure AI Foundryresource	AI-project (in AI-hubresource)	AI-project (in AI-hubresource)
Vereist AI-hubs	Nee.	Ja	Ja
Opties voor gegevensverwerking	Regionaal Gegevenszone Globaal	Regionaal	Regionaal
Privénetwerken	Ja	Ja	Ja
Inhoud filteren	Ja	Ja	Nee.
Aangepaste inhoudsfiltering	Ja	Nee.	Nee.
Sleutelloze verificatie	Ja	Nee.	Nee.
Factureringsbasissen	Tokengebruik en toegewezen doorvoereenheden	Tokengebruik²	Rekenkernuren³

² Een minimale eindpuntinfrastructuur wordt per minuut gefactureerd. U wordt niet gefactureerd voor de infrastructuur die als host fungeert voor het model in serverloze implementatie. Nadat u het eindpunt hebt verwijderd, worden er geen verdere kosten meer in rekening gebracht.

³ Facturering is per minuut, afhankelijk van de productlaag en het aantal exemplaren dat in de implementatie wordt gebruikt sinds het moment van maken. Nadat u het eindpunt hebt verwijderd, worden er geen verdere kosten meer in rekening gebracht.

Feedback

Is deze pagina nuttig?