Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
De modelcatalogus in Azure AI Foundry is de hub voor het detecteren en gebruiken van een breed scala aan Foundry-modellen voor het bouwen van generatieve AI-toepassingen. U moet modellen implementeren om ze beschikbaar te maken voor het ontvangen van deductieaanvragen. Azure AI Foundry biedt een uitgebreide reeks implementatieopties voor Foundry-modellen, afhankelijk van uw behoeften en modelvereisten.
Implementatieopties
Azure AI Foundry biedt verschillende implementatieopties, afhankelijk van het type modellen en resources dat u moet inrichten. De volgende implementatieopties zijn beschikbaar:
- Standaardimplementatie in Azure AI Foundry-resources
- Implementatie naar serverloze API-eindpunten
- Implementatie naar beheerde computers
Azure AI Foundry Portal kan automatisch een implementatieoptie kiezen op basis van uw omgeving en configuratie. Gebruik waar mogelijk Azure AI Foundry-resources voor implementatie. Modellen die ondersteuning bieden voor meerdere implementatieopties, worden standaard ingesteld op Azure AI Foundry-resources voor implementatie. Als u toegang wilt krijgen tot andere implementatieopties, gebruikt u de Azure CLI of Azure Machine Learning SDK voor implementatie.
Standaardimplementatie in Azure AI Foundry-resources
Azure AI Foundry-resources (voorheen Azure AI Services-resources genoemd) is de voorkeursimplementatieoptie in Azure AI Foundry. Het biedt het breedste scala aan mogelijkheden, waaronder regionale, gegevenszone of wereldwijde verwerking, en het biedt standaard- en geprovisioneerde doorvoeropties (PTU). Vlaggenschipmodellen in Azure AI Foundry Models ondersteunen deze implementatieoptie.
Deze implementatieoptie is beschikbaar in:
- Azure AI Foundry-resources
- Azure OpenAI-resources1
- Azure AI Hub, wanneer deze is verbonden met een Azure AI Foundry-resource
1Als u Azure OpenAI-resources gebruikt, toont de modelcatalogus alleen Azure OpenAI in Foundry Models voor implementatie. U kunt de volledige lijst met Foundry-modellen ophalen door een upgrade uit te voeren naar een Azure AI Foundry-resource.
Zie Instructies voor het implementeren van modellen in Azure AI Foundry-modellen om aan de slag te gaan met standaardimplementatie in Azure AI Foundry-resources.
Serverloze API-eindpunt
Deze implementatieoptie is alleen beschikbaar inAzure AI Hub-resources. Hiermee kunt u toegewezen eindpunten maken om het model te hosten, toegankelijk via een API. Azure AI Foundry Models ondersteunen serverloze API-eindpunten met betalen per gebruik-facturering en u kunt alleen regionale implementaties maken voor serverloze API-eindpunten.
Zie Modellen implementeren als serverloze API-implementaties om aan de slag te gaan met implementatie naar een serverloos API-eindpunt.
Volledig beheerde rekenprocessen
Deze implementatieoptie is alleen beschikbaar inAzure AI Hub-resources. Hiermee kunt u een toegewezen eindpunt maken om het model te hosten in een toegewezen rekenproces. U moet rekencapaciteit in uw abonnement hebben voor het hosten van het model, en u wordt gefactureerd per computetijd.
Beheerde rekenkrachtimplementatie is vereist voor modelverzamelingen met:
- Knuffelend gezicht
- NVIDIA-inferentiemicroservices (NIM's)
- Industriemodellen (Saifr, Rockwell, Bayer, Cerence, Sight Machine, Page AI, SDAIA)
- Databricks
- Aangepaste modellen
Zie Hoe u een beheerde rekenimplementatie implementeert en inferentie uitvoert en Azure AI Foundry-modellen implementeert voor beheerde rekenkracht met betalen per gebruik-facturering.
Mogelijkheden voor de implementatieopties
Gebruik waar mogelijk Standard-implementaties in Azure AI Foundry-resources . Deze implementatieoptie biedt de meeste mogelijkheden onder de beschikbare implementatieopties. De volgende tabel bevat details over specifieke mogelijkheden voor elke implementatieoptie:
| Vermogen | Standaardimplementatie in Azure AI Foundry-resources | Serverloze API-eindpunt | Volledig beheerde rekenprocessen |
|---|---|---|---|
| Welke modellen kunnen worden geïmplementeerd? | Foundry-modellen | Foundry-modellen met betalen per gebruik-facturering | Geopende en aangepaste modellen |
| Uitrolmiddel | Azure AI Foundryresource | AI-project (in AI-hubresource) | AI-project (in AI-hubresource) |
| Vereist AI-hubs | Nee. | Ja | Ja |
| Opties voor gegevensverwerking | Regionaal Gegevenszone Globaal |
Regionaal | Regionaal |
| Privénetwerken | Ja | Ja | Ja |
| Inhoud filteren | Ja | Ja | Nee. |
| Aangepaste inhoudsfiltering | Ja | Nee. | Nee. |
| Sleutelloze verificatie | Ja | Nee. | Nee. |
| Factureringsbasissen | Tokengebruik en toegewezen doorvoereenheden | Tokengebruik2 | Rekenkernuren3 |
2 Een minimale eindpuntinfrastructuur wordt per minuut gefactureerd. U wordt niet gefactureerd voor de infrastructuur die als host fungeert voor het model in serverloze implementatie. Nadat u het eindpunt hebt verwijderd, worden er geen verdere kosten meer in rekening gebracht.
3 Facturering is per minuut, afhankelijk van de productlaag en het aantal exemplaren dat in de implementatie wordt gebruikt sinds het moment van maken. Nadat u het eindpunt hebt verwijderd, worden er geen verdere kosten meer in rekening gebracht.