Dela via


Hantera anteckningsboksformat

Den här artikeln beskriver standardformatet för notebook-filer i Azure Databricks, hur du ändrar notebook-format och hur du hanterar utdataincheckningar om din notebook-fil finns i en källkontrollerad mapp.

Som standard skapas notebook-filer i Databricks i .ipynb-format (IPython eller Jupyter). Du kan också välja att använda källformat i stället.

Du kan fortfarande importera och exportera notebook-filer i olika format. Se Importera och exportera Databricks-notebook-filer.

Anteckningsboksformat

Databricks har stöd för att skapa och redigera notebook-filer i två format: IPYNB (standard) och källa.

Du kan hantera källfiler, inklusive notebook-filer, med hjälp av Git-mappar. Endast vissa Databricks-tillgångstyper stöds i Git-mappar. Formatet påverkar hur notebook-filer checkas in på fjärranslutna lagringsplatser enligt beskrivningen i tabellen nedan.

Anteckningsbokens källformat Beskrivning
källa Ett grundläggande format som endast samlar in källkod med ett suffix som signalerar kodspråket, till exempel .py, .scala, .r och .sql.
IPYNB (Jupyter) Ett omfattande format som samlar in källkod, notebook-miljö, visualiseringsdefinitioner, notebook-widgetar och valfria utdata. En IPYNB-notebook-fil kan innehålla kod på valfritt språk som stöds av Databricks-notebook-filer (trots py del av .ipynb). Med hjälp av IPYNB-formatet kan du välja att versionskontrollera utdata från en anteckningsbok tillsammans med anteckningsboken.

IPYNB-formatet stöder också en bättre visningsupplevelse för Databricks-notebook-filer på fjärranslutna Git-lagringsplatser. Om du använder GitHub eller GitLab kan du aktivera funktioner som ger dig förbättrade diff av dina notebook-filer i pull-begäranden, vilket gör det enklare att visa och kodgranskningsändringar i en notebook-fil.

Mer information om GitHub-stöd för omfattande diff av IPYNB-notebook-filer finns i Funktionsförhandsvisning: Rich Jupyter Notebook Diffs. Mer information om GitLab-stöd för IPYNB-notebook-diff finns i Jupyter Notebook-filer.

För att skilja källformatets notebook-filer från vanliga Python-, Scala- och SQL-filer lägger Azure Databricks till kommentaren "Databricks notebook source" överst i Notebook-filer för Python, Scala och SQL. Den här kommentaren säkerställer att Azure Databricks tolkar filen korrekt som en notebook-fil i stället för en skriptfil.

Ändra standardinställningen för notebook-format

IPYNB-notebook-filer är standardformatet när du skapar en ny notebook-fil i Azure Databricks.

Om du vill ändra standardvärdet till Azure Databricks-källformatet loggar du in på din Azure Databricks-arbetsyta, klickar på din profil längst upp till höger på sidan och klickar sedan på Inställningar och navigerar till Developer. Ändra standardformatet för anteckningsboken under Redigerarinställningar rubriken.

Ändra standardformatet för notebook-filer i utvecklarinställningarna för din profil

Konvertera anteckningsboksformat

Du kan konvertera en befintlig notebook-fil till ett annat format via Azure Databricks-användargränssnittet.

Så här konverterar du en befintlig notebook-fil till ett annat format:

  1. Öppna anteckningsboken på arbetsytan.

  2. Välj Arkiv på arbetsytans meny, välj Notebook-format och välj önskat format. Du kan välja antingen Jupyter (.ipynb) (rekommenderas) eller Source (.scala, .py, .sql, .r). Anteckningsbokens aktuella format är nedtonat och har en bockmarkering bredvid sig.

    Arbetsytans arkivmeny, expanderad, med notisformatsalternativ.

Mer information om vilka typer av notebook-filer som stöds i Azure Databricks finns i Importera och exportera Databricks-notebook-filer.

Hantera utdataincheckningar för IPYNB-notebook-filer

Utdata är resultatet av att köra en notebook-fil på Databricks-plattformen, inklusive tabellvisningar och visualiseringar. För IPYNB-notebook-filer i källkontrollerade mappar kan du hantera hur notebook-utdata skickas till fjärrlagringsplatsen.

Tillåt kommittering av .ipynb notebook-utdata

Utdata kan bara bekräftas om en arbetsyteadministratör har aktiverat den här funktionen. Som standardinställning tillåter den administrativa inställningen för Git-mappar inte att notebook-utdata göras. Om du har administratörsbehörighet för arbetsytan kan du ändra den här inställningen:

  1. Gå till Administratörsinställningar>Arbetsyteinställningar i Azure Databricks-administratörskonsolen.

  2. Under Git-mappar, väljer du Tillåt att Git-mappar exporterar IPYNB-utdata och väljer sedan Tillåt: IPYNB-utdata kan aktiveras.

    administratörskonsol: Tillåt Att Git-mappar exporterar IPYNB-utdata.

Viktig

När utdata finns med inkluderas visualiserings- och instrumentpanelskonfigurationerna i de.ipynb anteckningsböcker som du skapar.

Kontrollera IPYNB-notebookens utdataartefakt-incheckningar

När du committar en .ipynb-fil skapar Databricks en konfigurationsfil som låter dig kontrollera hur du committar utdata: .databricks/commit_outputs.

  1. Om du har en .ipynb notebook-fil men ingen konfigurationsfil på fjärrlagringsplatsen går du till dialogrutan Git-status.

  2. I meddelandedialogrutan väljer du Skapa commit_outputs konfigurationsfil.

    Notebook-åtgärdsgränssnitt: Skapa commit_outputs-fil-knappen.

Du kan också generera konfigurationsfiler från menyn File. Menyn File har en kontroll för att automatiskt uppdatera konfigurationsfilen där du kan ange inkludering eller exkludering av utdata för en specifik IPYNB-notebook-fil.

  1. I menyn Fil väljer du Checka in notebooks-utdata.

    Notebook-redigeraren: Kommitta notebooks utdata status och kontroll.

  2. I dialogrutan bekräftar du ditt val av att kommittera notebook-utdata.

    dialogrutan för att spara notebook-utdata.