Dela via


Grundmodeller som stöds på Mosaic AI Model Serving

Den här artikeln beskriver de grundläggande modeller som du kan använda med Mosaic AI Model Serving.

Grundmodeller är stora, förtränade neurala nätverk som tränas på både stora och breda dataintervall. Dessa modeller är utformade för att lära sig allmänna mönster i språk, bilder eller andra datatyper och kan finjusteras för specifika uppgifter med ytterligare utbildning. Din användning av vissa grundmodeller omfattas av modellutvecklarens licens och acceptabla användningsprincip. Se Tillämpliga licenser och villkor för modellutvecklare.

Modellhantering erbjuder flexibla alternativ för att hantera och ställa frågor till grundmodeller baserat på dina behov.

  • AI Functions-optimerade modeller: Vissa modeller från Databricks är optimerade för AI Functions. Du kan tillämpa AI på dina data och köra produktionsarbetsbelastningar för batch-inferens i stor skala med hjälp av dessa funktioner och deras stödda modeller.
  • Betala per token: Perfekt för experimentering och snabb utforskning. Med det här alternativet kan du köra frågor mot förkonfigurerade slutpunkter på din Databricks-arbetsyta utan åtaganden om infrastruktur i förväg.
  • Provisionerat genomflöde: Rekommenderas för användningar i produktion som kräver prestandagarantier. Med det här alternativet kan du distribuera finjusterade grundmodeller med optimerade serverslutpunkter.
  • Externa modeller: Det här alternativet ger åtkomst till grundläggande modeller som finns utanför Databricks, till exempel de som tillhandahålls av OpenAI eller Anthropic. Dessa modeller kan hanteras centralt i Databricks för effektiv styrning.

Foundation-modeller som finns på Databricks

Databricks är värd för toppmoderna öppna grundmodeller, till exempel Meta Llama. Dessa modeller görs tillgängliga genom Foundation Model API:er.

I följande tabell sammanfattas modeller som är värdbaserade på Databricks och modellfamiljer som stöds i varje region baserat på modelltjänsten.

Viktig

  • Meta Llama 4 Maverick är tillgängligt för Foundation Model API:er med förberedd datagenomströmning för arbetsbelastningar i offentlig förhandsgranskning.

  • Från och med den 11 december 2024 ersätter Meta-Llama-3.3-70B-Instruct stödet för Meta-Llama-3.1-70B-Instruct i Foundation Model API:ers betalning per token-slutpunkter.

  • Meta-Llama-3.1-405B-Instruct är den största öppet tillgängliga, toppmoderna stora språkmodellen som skapats och tränats av Meta och distribuerats av Azure Machine Learning med hjälp av AzureML-modellkatalogen.

  • Från och med den 15 februari 2026 dras de modeller som är associerade med följande modellfamiljer tillbaka och är inte längre tillgängliga för användning i något av funktionsområdena modellservering. Se Tillbakadragna modeller för rekommenderade ersättningsmodeller och vägledning för hur du migrerar under utfasningen.

    • DBRX
    • Llama 3 70B
    • Llama 3 8B
    • Llama 2 70B
    • Llama 2 13B
    • Mistral 8x7B
    • Mixtral 8x7B
    • MPT 30B
    • MPT 7B
Region AI Functions-optimerade modeller Foundation Model-API:er betalar per token Foundation Model API:er med tilldelat dataflöde
australiacentral Stöds inte Stöds inte Stöds inte
australiacentral2 Stöds inte Stöds inte Stöds inte
australiaeast Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds och optimeras för batchinferens:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick (förhandsversion)*
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick (förhandsversion)*
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (engelska)
    • BGE v1.5 (engelska)
    • DeepSeek R1 (inte tillgängligt i Unity Catalog)
    Äldre modellfamiljer som stöds:
    • Meta Llama 3
    • Meta Llama 2
    • DBRX
    • Mistralen
    • Mixtral
    • MPT
australiasoutheast Stöds inte Stöds inte Stöds inte
brazilsouth Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds och optimeras för batchinferens:
  • OpenAI GPT OSS 120B*
  • OpenAI GPT OSS 20B*
  • Google Gemma 3 12B*
  • Meta Llama 4 Maverick* (förhandsversion)
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (förhandsversion)
    • Meta Llama 3.3*
    • Meta Llama 3.2 3B*
    • Meta Llama 3.2 1B*
    • Meta Llama 3.1*
    • GTE v1.5 (engelska)*
    • BGE v1.5 (engelska)*
    • DeepSeek R1 (inte tillgängligt i Unity Catalog)*
    Äldre modellfamiljer som stöds:
    • Meta Llama 3*
    • Meta Llama 2*
    • DBRX*
    • Mistral*
    • Mixtral*
    • MPT*
canadacentral Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds och optimeras för batchinferens:
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (förhandsversion)
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (förhandsversion)
    • Meta Llama 3.3*
    • Meta Llama 3.2 3B*
    • Meta Llama 3.2 1B*
    • Meta Llama 3.1*
    • GTE v1.5 (engelska)*
    • BGE v1.5 (engelska)*
    • DeepSeek R1 (inte tillgängligt i Unity Catalog)*
    Äldre modellfamiljer som stöds:
    • Meta Llama 3*
    • Meta Llama 2*
    • DBRX*
    • Mistral*
    • Mixtral*
    • MPT*
canadaeast Stöds inte Stöds inte Stöds inte
centralindia Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds och optimeras för batchinferens:
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (förhandsversion)
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (förhandsversion)
    • Meta Llama 3.3*
    • Meta Llama 3.2 3B*
    • Meta Llama 3.2 1B*
    • Meta Llama 3.1*
    • GTE v1.5 (engelska)*
    • BGE v1.5 (engelska)*
    • DeepSeek R1 (inte tillgängligt i Unity Catalog)*
    Äldre modellfamiljer som stöds:
    • Meta Llama 3*
    • Meta Llama 2*
    • DBRX*
    • Mistral*
    • Mixtral*
    • MPT*
centralus Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds och optimeras för batchinferens:
  • OpenAI GPT OSS 120B
  • OpenAI GPT OSS 20B
  • Google Gemma 3 12B
  • Meta Llama 4 Maverick (förhandsversion)
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (engelska)
    • BGE v1.5 (engelska)
    • DeepSeek R1 (inte tillgängligt i Unity Catalog)
    Äldre modellfamiljer som stöds:
    • Meta Llama 3
    • Meta Llama 2
    • DBRX
    • Mistralen
    • Mixtral
    • MPT
chinaeast2 Stöds inte Stöds inte Stöds inte
chinaeast3 Stöds inte Stöds inte Stöds inte
chinanorth2 Stöds inte Stöds inte Stöds inte
chinanorth3 Stöds inte Stöds inte Stöds inte
eastasia Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds och optimeras för batchinferens:
  • OpenAI GPT OSS 120B*
  • OpenAI GPT OSS 20B*
  • Google Gemma 3 12B*
  • Meta Llama 4 Maverick* (förhandsversion)
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (förhandsversion)
    • Meta Llama 3.3*
    • Meta Llama 3.2 3B*
    • Meta Llama 3.2 1B*
    • Meta Llama 3.1*
    • GTE v1.5 (engelska)*
    • BGE v1.5 (engelska)*
    • DeepSeek R1 (inte tillgängligt i Unity Catalog)*
    Äldre modellfamiljer som stöds:
    • Meta Llama 3*
    • Meta Llama 2*
    • DBRX*
    • Mistral*
    • Mixtral*
    • MPT*
eastus Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds och optimeras för batchinferens:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (engelska)
    • BGE v1.5 (engelska)
    • DeepSeek R1 (inte tillgängligt i Unity Catalog)
    Äldre modellfamiljer som stöds:
    • Meta Llama 3
    • Meta Llama 2
    • DBRX
    • Mistralen
    • Mixtral
    • MPT
eastus2 Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds och optimeras för batchinferens:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (engelska)
    • BGE v1.5 (engelska)
    • DeepSeek R1 (inte tillgängligt i Unity Catalog)
    Äldre modellfamiljer som stöds:
    • Meta Llama 3
    • Meta Llama 2
    • DBRX
    • Mistralen
    • Mixtral
    • MPT
francecentral Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds och optimeras för batchinferens:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (engelska)
    • BGE v1.5 (engelska)
    • DeepSeek R1 (inte tillgängligt i Unity Catalog)
    Äldre modellfamiljer som stöds:
    • Meta Llama 3
    • Meta Llama 2
    • DBRX
    • Mistralen
    • Mixtral
    • MPT
germanywestcentral Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds och optimeras för batchinferens:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (engelska)
    • BGE v1.5 (engelska)
    • DeepSeek R1 (inte tillgängligt i Unity Catalog)
    Äldre modellfamiljer som stöds:
    • Meta Llama 3
    • Meta Llama 2
    • DBRX
    • Mistralen
    • Mixtral
    • MPT
japaneast Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds och optimeras för batchinferens:
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (förhandsversion)
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (förhandsversion)
    • Meta Llama 3.3*
    • Meta Llama 3.2 3B*
    • Meta Llama 3.2 1B*
    • Meta Llama 3.1*
    • GTE v1.5 (engelska)*
    • BGE v1.5 (engelska)*
    • DeepSeek R1* (inte tillgängligt i Unity Catalog)
    Äldre modellfamiljer som stöds:
    • Meta Llama 3*
    • Meta Llama 2*
    • DBRX*
    • Mistral*
    • Mixtral*
    • MPT*
japanwest Stöds inte Stöds inte Stöds inte
koreacentral Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds och optimeras för batchinferens:
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (förhandsversion)
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick*
    • Meta Llama 3.3*
    • Meta Llama 3.2 3B*
    • Meta Llama 3.2 1B*
    • Meta Llama 3.1*
    • DeepSeek R1* (inte tillgängligt i Unity Catalog)
    Äldre modellfamiljer som stöds:
    • Meta Llama 3*
    • Meta Llama 2*
    • DBRX*
    • Mistral*
    • Mixtral*
    • MPT*
mexicocentral Stöds inte Stöds inte Stöds inte
northcentralus Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds och optimeras för batchinferens:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (engelska)
    • BGE v1.5 (engelska)
    • DeepSeek R1 (inte tillgängligt i Unity Catalog)
    Äldre modellfamiljer som stöds:
    • Meta Llama 3
    • Meta Llama 2
    • DBRX
    • Mistralen
    • Mixtral
    • MPT
northeurope Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds och optimeras för batchinferens:
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (förhandsversion)
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (engelska)
    • BGE v1.5 (engelska)
    • DeepSeek R1
    Äldre modellfamiljer som stöds:
    • Meta Llama 3
    • Meta Llama 2
    • DBRX
    • Mistralen
    • Mixtral
    • MPT
norwayeast Stöds inte Stöds inte Stöds inte
qatarcentral Stöds inte Stöds inte Stöds inte
southafricanorth Stöds inte Stöds inte Stöds inte
southcentralus Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds och optimeras för batchinferens:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (engelska)
    • BGE v1.5 (engelska)
    • DeepSeek R1
    Äldre modellfamiljer som stöds:
    • Meta Llama 3
    • Meta Llama 2
    • DBRX
    • Mistralen
    • Mixtral
    • MPT
southeastasia Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds och optimeras för batchinferens:
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (förhandsversion)
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (förhandsversion)
    • Meta Llama 3.3*
    • Meta Llama 3.2 3B*
    • Meta Llama 3.2 1B*
    • Meta Llama 3.1*
    • GTE v1.5 (engelska)*
    • BGE v1.5 (engelska)*
    • DeepSeek R1 (inte tillgängligt i system.ai i Unity Catalog)*
    Äldre modellfamiljer som stöds:
    • Meta Llama 3
    • Meta Llama 2
    • DBRX
    • Mistralen
    • Mixtral
    • MPT
southindia Stöds inte Stöds inte Stöds inte
swedencentral Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds och optimeras för batchinferens:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (engelska)
    • BGE v1.5 (engelska)
    • DeepSeek R1 (inte tillgängligt i Unity Catalog)
    Äldre modellfamiljer som stöds:
    • Meta Llama 3
    • Meta Llama 2
    • DBRX
    • Mistralen
    • Mixtral
    • MPT
switzerlandnorth Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds och optimeras för batchinferens:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (engelska)
    • BGE v1.5 (engelska)
    • DeepSeek R1 (inte tillgängligt i Unity Catalog)
    Äldre modellfamiljer som stöds:
    • Meta Llama 3
    • Meta Llama 2
    • DBRX
    • Mistralen
    • Mixtral
    • MPT
switzerlandwest Stöds inte Stöds inte Stöds inte
uaenorth Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds och optimeras för batchinferens:
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (förhandsversion)
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (förhandsversion)
    • Meta Llama 3.3*
    • Meta Llama 3.2 3B*
    • Meta Llama 3.2 1B*
    • Meta Llama 3.1*
    • GTE v1.5 (engelska)*
    • BGE v1.5 (engelska)*
    • DeepSeek R1* (inte tillgängligt i Unity Catalog)
    Äldre modellfamiljer som stöds:
    • Meta Llama 3*
    • Meta Llama 2*
    • DBRX*
    • Mistral*
    • Mixtral*
    • MPT*
uksouth Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds och optimeras för batchinferens:
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (förhandsversion)
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (förhandsversion)
    • Meta Llama 3.3*
    • Meta Llama 3.2 3B*
    • Meta Llama 3.2 1B*
    • Meta Llama 3.1*
    • GTE v1.5 (engelska)*
    • BGE v1.5 (engelska)*
    • DeepSeek R1* (inte tillgängligt i Unity Catalog)
    Äldre modellfamiljer som stöds:
    • Meta Llama 3*
    • Meta Llama 2*
    • DBRX*
    • Mistral*
    • Mixtral*
    • MPT*
ukwest Stöds inte Stöds inte Stöds inte
westcentralus Stöds inte Stöds inte Stöds inte
westeurope Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds och optimeras för batchinferens:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (engelska)
    • BGE v1.5 (engelska)
    • DeepSeek R1 (inte tillgängligt i Unity Catalog)
    Äldre modellfamiljer som stöds:
    • Meta Llama 3
    • Meta Llama 2
    • DBRX
    • Mistralen
    • Mixtral
    • MPT
westindia Stöds inte Stöds inte Stöds inte
westus Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds och optimeras för batchinferens:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (engelska)
    • BGE v1.5 (engelska)
    • DeepSeek R1 (inte tillgängligt i Unity Catalog)
    Äldre modellfamiljer som stöds:
    • Meta Llama 3
    • Meta Llama 2
    • DBRX
    • Mistralen
    • Mixtral
    • MPT
westus2 Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds och optimeras för batchinferens:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (engelska)
    • BGE v1.5 (engelska)
    • DeepSeek R1 (inte tillgängligt i Unity Catalog)
    Äldre modellfamiljer som stöds:
    • Meta Llama 3
    • Meta Llama 2
    • DBRX
    • Mistralen
    • Mixtral
    • MPT
westus3 Stöds inte Stöds inte Stöds inte

* Den här modellen stöds baserat på GPU-tillgänglighet och kräver att routning mellan geografiska områden är aktiverad.

Access Foundation-modeller som finns utanför Databricks

Grundmodeller som skapats av LLM-leverantörer, till exempel OpenAI och Anthropic, är också tillgängliga på Databricks med hjälp av externa modeller. Dessa modeller finns utanför Databricks och du kan skapa en slutpunkt för att fråga dem. Dessa slutpunkter kan styras centralt från Azure Databricks, vilket effektiviserar användningen och hanteringen av olika LLM-leverantörer i din organisation.

I följande tabell visas en icke-fullständig lista över modeller som stöds och motsvarande slutpunktstyper. Du kan använda de listade modellassociationerna för att hjälpa dig att konfigurera en slutpunkt för alla nyligen släppta modelltyper när de blir tillgängliga med en viss leverantör. Kunderna ansvarar för att säkerställa efterlevnaden av tillämpliga modelllicenser.

Obs

Med den snabba utvecklingen av LLM:er finns det ingen garanti för att listan är uppdaterad hela tiden. Nya modellversioner från samma provider stöds vanligtvis även om de inte finns med i listan.

Modellprovider llm/v1/completions llm/v1/chat llm/v1/inbäddningar
OpenAI**
  • gpt-3.5-turbo-instruct
  • babbage-002
  • davinci-002
  • o1
  • o1-mini
  • o1-mini-2024-09-12
  • gpt-3.5-turbo
  • gpt-4
  • gpt-4-turbo
  • gpt-4-turbo-2024-04
  • gpt-4o
  • gpt-4o-2024-05-13
  • gpt-4o-mini
  • text-embedding-ada-002
  • text-inbäddning-3-stor
  • text-inbäddning-3-liten
Azure OpenAI**
  • text-davinci-003
  • gpt-35-turbo-instruct
  • o1
  • o1-mini
  • gpt-35-turbo
  • gpt-35-turbo-16k
  • gpt-4
  • gpt-4-turbo
  • gpt-4-32k
  • gpt-4o
  • gpt-4o-mini
  • text-embedding-ada-002
  • text-inbäddning-3-stor
  • text-inbäddning-3-liten
Människoorienterad
  • claude-1
  • claude-1.3-100k
  • claude-2
  • claude-2.1
  • claude-2.0
  • claude-instant-1.2
  • claude-3-5-sonnet-latest
  • claude-3-5-haiku-latest
  • claude-3-5-opus-senaste
  • claude-3-5-sonnet-20241022
  • claude-3-5-haiku-20241022
  • claude-3-5-sonnet-20240620
  • claude-3-haiku-20240307
  • claude-3-opus-20240229
  • claude-3-sonnet-20240229
Cohere**
  • kommando
  • kommandolampa
  • command-r7b-12-2024
  • command-r-plus-08-2024
  • kommando-r-08-2024
  • Kommando-R-plus
  • kommando-R
  • kommando
  • kommando-ljus-nattlig
  • kommandolampa
  • command-nightly
  • embed-english-v2.0
  • embed-multilingual-v2.0
  • embed-english-light-v2.0
  • bädda-in-engelska-v3.0
  • embed-english-light-v3.0
  • inbädda-flerspråkig-v3.0
  • embed-multilingual-light-v3.0
Mosaiks AI-modelltjänstgöring Databricks-serverslutpunkt Databricks-serverslutpunkt Databricks-serverslutpunkt
** Amazon Bedrock Antropisk:
  • claude-instant-v1
  • claude-v2

Hålla samman
  • command-text-v14
  • command-light-text-v14

AI21 Labs:
  • j2-grande-instruct
  • j2-jumbo-instruct
  • j2-mid
  • j2-mid-v1
  • j2-ultra
  • j2-ultra-v1
Antropisk:
  • claude-3-5-sonnet-20241022-v2:0
  • claude-3-5-haiku-20241022-v1:0
  • claude-3-opus-20240229-v1:0
  • claude-3-sonnet-20240229-v1:0
  • claude-3-5-sonnet-20240620-v1:0

Hålla samman
  • command-r-plus-v1:0
  • command-r-v1:0

Amason:
  • nova-lite-v1:0
  • nova-micro-v1:0
  • nova-pro-v1:0
Amason:
  • titan-embed-text-v2:0
  • titan-embed-text-v1
  • titan-embed-g1-text-02

Hålla samman
  • bädda-in-engelska-v3
  • embed-multilingual-v3
AI21 Labs
  • j2-mid
  • j2-ljus
  • j2-ultra
Google Cloud Vertex AI text-bison
  • chatbison
  • gemini-pro
  • gemini-1.0-pro
  • gemini-1.5-pro
  • gemini-1.5-flash
  • gemini-2.0-flash
  • text-embedding-004
  • text-embedding-005
  • textinbäddning-gecko

** Modellleverantören stöder anpassade slutförande- och chattmodeller. Om du vill köra frågor mot en finjusterad modell fyller du i fältet name i external model-konfigurationen med namnet på din finjusterade modell.

Modellprovidern stöder anpassade slutförandemodeller.

Skapa basmodell som betjänar slutpunkter

Om du vill köra frågor mot och använda grundmodeller i dina AI-program måste du först skapa en modell som betjänar slutpunkten. Modellservern använder ett enhetligt API och användargränssnitt för att skapa och uppdatera basmodell som betjänar slutpunkter.

Frågegrundsmodell som betjänar slutpunkter

När du har skapat din tjänsteslutpunkt kan du fråga din grundmodell. Modellservern använder ett enhetligt OpenAI-kompatibelt API och SDK för att köra frågor mot grundmodeller. Den här enhetliga upplevelsen förenklar hur du experimenterar med och anpassar grundmodeller för produktion i moln och leverantörer som stöds.

Se Använda grundmodeller.