Komma igång med Azure Databricks
Om du vill använda Azure Databricks måste du skapa en Azure Databricks-arbetsyta i din Azure-prenumeration. En arbetsyta är en Azure Databricks-distribution på ett molntjänstkonto. Det ger en enhetlig miljö för att arbeta med Azure Databricks-tillgångar för en angiven uppsättning användare.
Du kan skapa en Azure Databricks-arbetsyta genom att:
- Använda användargränssnittet i Azure-portalen.
- Använda en Azure Resource Manager -mall (ARM), Bicep eller Terraform.
- Genom att använda cmdleten New-AzDatabricksWorkspace i Azure PowerShell.
- Använd kommandot az databricks workspace create i Azure-kommandoradsgränssnittet (CLI).
När du skapar en arbetsyta måste du ange:
- Ett arbetsytenamn.
- Välj en tillgänglig region. Tillgängliga regioner finns i Tillgängliga Azure-tjänster per region.
- En prisnivå:
- Standard – Apache Spark-kärnfunktioner med Microsoft Entra ID-integrering.
- Premium – Rollbaserade åtkomstkontroller och andra funktioner på företagsnivå.
- Utvärdering – En 14-dagars kostnadsfri utvärderingsversion av en arbetsyta på premiumnivå
- Namn på hanterad resursgrupp (valfritt): en automatiskt skapad resursgrupp där Azure etablerar och hanterar de infrastrukturresurser som behövs för din Databricks-arbetsyta.
Om du väljer att skapa en Azure Databricks-distribution med hjälp av Azure CLI är det här kommandot az databricks workspace att komma ihåg:
az databricks workspace create
--resource-group myresourcegroup \
--name mydatabricksws \
--location westus2 \
--sku standard
Motsvarande New-AzDatabricksWorkspace PowerShell-cmdlet :
New-AzDatabricksWorkspace -Name mydatabricksws -ResourceGroupName myresourcegroup -Location westus2 -ManagedResourceGroupName databricks-group -Sku standard
Navigera i användargränssnittet för Azure Databricks-arbetsytan
När du har etablerat en Azure Databricks-arbetsyta kan du använda arbetsytans användargränssnitt för att arbeta med data- och beräkningsresurser. Arbetsytans användargränssnitt är ett webbaserat gränssnitt där du kan skapa och hantera resurser i arbetsytan, till exempel Spark-kluster, och använda notebooks och frågor för att arbeta med data i filer och tabeller.
Startsidan innehåller genvägar till vanliga uppgifter och arbetsyteobjekt som hjälper dig att komma igång. Du kan importera data, skapa en notebook-fil, skapa en fråga och konfigurera ett AutoML-experiment.
Sidofältet visar vanliga Databricks-kategorier (Arbetsyta, Senaste, Katalog, Jobb och Pipelines, Beräkning, Marketplace). Den delas sedan ut efter produktområde:
- SQL: SQL-redigerare, frågor, instrumentpaneler, Genie, aviseringar, frågehistorik, SQL Warehouses
- Datateknik: Jobbkörningar, datainmatning
- Maskininlärning: Lekplats, experiment, funktioner, modeller, servering
Välj + Nytt för:
- Skapa arbetsyteobjekt som notebook-filer, frågor, lagringsplatser, instrumentpaneler, aviseringar, jobb, pipelines, experiment, modeller och serveringsslutpunkter.
- Skapa beräkningsresurser som kluster, SQL-lager och ML-slutpunkter.
Använd det övre fältet för att söka efter arbetsyteobjekt som anteckningsböcker, frågor, dashboards, aviseringar, filer, mappar, bibliotek, tabeller som är registrerade i Unity Catalog, jobb och repos på ett ställe. Du kan också komma åt objekt som nyligen visats i sökfältet.
Arbetsytan är tillgänglig på flera språk. Om du vill ändra arbetsytans språk väljer du ditt användarnamn i det övre navigeringsfältet, väljer Inställningar och går till fliken Inställningar .
Få hjälp från Databricks Assistant
Databricks Assistant är ett AI-baserat parprogrammeringsverktyg och supportverktyg som hjälper dig att arbeta mer effektivt i Databricks genom att generera, förklara och åtgärda kod eller frågor eller sökfrågor direkt i anteckningsböcker, dashboardar och filer.
Det kan hjälpa till med en mängd olika uppgifter, inklusive att identifiera och korrigera fel, skapa datavisualiseringar, diagnostisera jobbproblem och filtrera eller analysera data med hjälp av frågor på naturligt språk. Assistenten kan visa relevant vägledning från Azure Databricks-dokumentationen.
Genom att använda Metadata för Unity Catalog anpassar den sina svar baserat på organisationens datatillgångar – tabeller, kolumner och beskrivningar – vilket gör det enklare att utforska och arbeta med dina data.