Dela via


AI och maskininlärning på Databricks

Skapa, distribuera och hantera AI- och maskininlärningsprogram med Mosaic AI, en integrerad plattform som förenar hela AI-livscykeln från förberedelse av data till produktionsövervakning.

En uppsättning självstudier för att komma igång finns i AI- och maskininlärningskurser.

Skapa generativa AI-applikationer

Utveckla och distribuera generativa AI-program i företagsklass, till exempel finjusterade LLM:er, AI-agenter och hämtningsförhöjd generation.

Feature Description
AI Playground Prototypa och testa generativa AI-modeller med utformning av anrop utan kodning och justering av parametrar.
Agent Bricks Enkel metod för att skapa och optimera domänspecifika AI-agentsystem av hög kvalitet för vanliga AI-användningsfall.
Grundmodeller Hantera toppmoderna LLM:er, inklusive Meta Llama, Anthropic Claude och OpenAI GPT via säkra, skalbara API:er.
Mosaic AI Agent Framework Skapa och distribuera agenter av produktionskvalitet, inklusive RAG-program och system med flera agenter med Python.
MLflow för GenAI Mäta, förbättra och övervaka kvalitet under hela GenAI-programmets livscykel med hjälp av AI-drivna mått och omfattande spårningsobservabilitet.
Vektorsökning Lagra och fråga inbäddningsvektorer med automatisk synkronisering till din kunskapsbas för RAG-program.
Serverlös GPU-beräkning Anpassa djupinlärningsarbetsbelastningar med en och flera noder för träning och finjustering av anpassade modeller med hjälp av dina favoritramverk och få toppmodern effektivitet, prestanda och kvalitet.
Finjustering av grundmodell Anpassa grundmodeller med dina egna data för att optimera prestanda för specifika program.

Träna klassiska maskininlärningsmodeller

Skapa maskininlärningsmodeller med automatiserade verktyg och samarbetsmiljöer för utveckling.

Feature Description
AutoML Skapa automatiskt högkvalitativa modeller med minimal kod med hjälp av automatiserad funktionsutveckling och justering av hyperparametrar.
Databricks Runtime för ML Förkonfigurerade kluster med Stöd för TensorFlow, PyTorch, Keras och GPU för djupinlärningsutveckling.
MLflow-spårning Spåra experiment, jämföra modellprestanda och hantera hela livscykeln för modellutveckling.
Funktionsutveckling Skapa, hantera och tillhandahåll funktioner med automatiserade data-pipelines och upptäckande av funktioner.
Databricks-notebook-filer Samarbetsutvecklingsmiljö med stöd för Python-, R-, Scala- och SQL för ML-arbetsflöden.

Träna djupinlärningsmodeller

Använd inbyggda ramverk för att utveckla djupinlärningsmodeller.

Feature Description
Distribuerad utbildning Exempel på distribuerad djupinlärning med Ray, TorchDistributor och DeepSpeed.
Metodtips för djupinlärning i Databricks Metodtips för djupinlärning i Databricks.
PyTorch Enkelnod och distribuerad träning med PyTorch.
TensorFlow Träning med en nod och distribuerad träning med TensorFlow och TensorBoard.
Referenslösningar Referenslösningar för djupinlärning.

Distribuera och hantera modeller

Distribuera modeller till produktion med skalbara slutpunkter, slutsatsdragning i realtid och övervakning i företagsklass.

Feature Description
Modelltjänst Distribuera anpassade modeller och LLM:er som skalbara REST-slutpunkter med stöd för automatisk skalning och GPU.
AI Gateway Styra och övervaka åtkomsten till generativa AI-modeller med användningsspårning, nyttolastloggning och säkerhetskontroller.
Externa modeller Integrera modeller från tredje part som finns utanför Databricks med enhetlig styrning och övervakning.
API:er för grundmodell Få åtkomst till och fråga efter toppmoderna öppna modeller som hanteras av Databricks.

Övervaka och styra ML-system

Säkerställa modellkvalitet, dataintegritet och efterlevnad med omfattande övervaknings- och styrningsverktyg.

Feature Description
Unity-katalog Styr data, funktioner, modeller och funktioner med enhetlig åtkomstkontroll, ursprungsspårning och identifiering.
Lakehouse-övervakning Övervaka datakvalitet, modellprestanda och prediktionsavvikelser med automatiserade aviseringar och grundorsaksanalys.
MLflow för modeller Spåra, utvärdera och övervaka generativa AI-program under hela utvecklingslivscykeln.

Produktionsanpassa ML-arbetsflöden

Skala maskininlärningsåtgärder med automatiserade arbetsflöden, CI/CD-integrering och produktionsklara pipelines.

Feature Description
Modeller i Unity-katalogen Använd modellregistret i Unity Catalog för centraliserad styrning och för att hantera modellens livscykel, inklusive distributioner.
Lakeflow-jobb Skapa automatiserade arbetsflöden och produktionsklara ETL-pipelines för ML-databearbetning.
Ray på Databricks Skala ML-arbetsbelastningar med distribuerad databehandling för storskalig modellträning och slutsatsdragning.
MLOps-arbetsflöden Implementera MLOps från slutpunkt till slutpunkt med automatiserade tränings-, testnings- och distributionspipelines.
Git-integrering Versionshantering av ML-kod och notebooks med sömlös Git-integrering och samarbete.