Anteckning
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Den här artikeln beskriver standardformatet för notebook-filer i Azure Databricks, hur du ändrar notebook-format och hur du hanterar utdataincheckningar om din notebook-fil finns i en källkontrollerad mapp.
Som standard skapas notebook-filer i Databricks i .ipynb-format (IPython eller Jupyter). Du kan också välja att använda källformat i stället.
Du kan fortfarande importera och exportera notebook-filer i olika format. Se Importera och exportera Databricks-notebook-filer.
Anteckningsboksformat
Databricks har stöd för att skapa och redigera notebook-filer i två format: IPYNB (standard) och källa.
Du kan hantera källfiler, inklusive notebook-filer, med hjälp av Git-mappar. Endast vissa Databricks-tillgångstyper stöds i Git-mappar. Formatet påverkar hur notebook-filer checkas in på fjärranslutna lagringsplatser enligt beskrivningen i tabellen nedan.
| Anteckningsbokens källformat | Beskrivning |
|---|---|
| källa | Ett grundläggande format som endast samlar in källkod med ett suffix som signalerar kodspråket, till exempel .py, .scala, .r och .sql. |
| IPYNB (Jupyter) | Ett omfattande format som samlar in källkod, notebook-miljö, visualiseringsdefinitioner, notebook-widgetar och valfria utdata. En IPYNB-notebook-fil kan innehålla kod på valfritt språk som stöds av Databricks-notebook-filer (trots py del av .ipynb). Med hjälp av IPYNB-formatet kan du välja att versionskontrollera utdata från en anteckningsbok tillsammans med anteckningsboken. |
IPYNB-formatet stöder också en bättre visningsupplevelse för Databricks-notebook-filer på fjärranslutna Git-lagringsplatser. Om du använder GitHub eller GitLab kan du aktivera funktioner som ger dig förbättrade diff av dina notebook-filer i pull-begäranden, vilket gör det enklare att visa och kodgranskningsändringar i en notebook-fil.
Mer information om GitHub-stöd för omfattande diff av IPYNB-notebook-filer finns i Funktionsförhandsvisning: Rich Jupyter Notebook Diffs. Mer information om GitLab-stöd för IPYNB-notebook-diff finns i Jupyter Notebook-filer.
För att skilja källformatets notebook-filer från vanliga Python-, Scala- och SQL-filer lägger Azure Databricks till kommentaren "Databricks notebook source" överst i Notebook-filer för Python, Scala och SQL. Den här kommentaren säkerställer att Azure Databricks tolkar filen korrekt som en notebook-fil i stället för en skriptfil.
Ändra standardinställningen för notebook-format
IPYNB-notebook-filer är standardformatet när du skapar en ny notebook-fil i Azure Databricks.
Om du vill ändra standardvärdet till Azure Databricks-källformatet loggar du in på din Azure Databricks-arbetsyta, klickar på din profil längst upp till höger på sidan och klickar sedan på Inställningar och navigerar till Developer. Ändra standardformatet för anteckningsboken under Redigerarinställningar rubriken.
Konvertera anteckningsboksformat
Du kan konvertera en befintlig notebook-fil till ett annat format via Azure Databricks-användargränssnittet.
Så här konverterar du en befintlig notebook-fil till ett annat format:
Öppna anteckningsboken på arbetsytan.
Välj Arkiv på arbetsytans meny, välj Notebook-format och välj önskat format. Du kan välja antingen Jupyter (.ipynb) (rekommenderas) eller Source (.scala, .py, .sql, .r). Anteckningsbokens aktuella format är nedtonat och har en bockmarkering bredvid sig.
Mer information om vilka typer av notebook-filer som stöds i Azure Databricks finns i Importera och exportera Databricks-notebook-filer.
Hantera utdataincheckningar för IPYNB-notebook-filer
Utdata är resultatet av att köra en notebook-fil på Databricks-plattformen, inklusive tabellvisningar och visualiseringar. För IPYNB-notebook-filer i källkontrollerade mappar kan du hantera hur notebook-utdata skickas till fjärrlagringsplatsen.
Tillåt kommittering av .ipynb notebook-utdata
Utdata kan bara bekräftas om en arbetsyteadministratör har aktiverat den här funktionen. Som standardinställning tillåter den administrativa inställningen för Git-mappar inte att notebook-utdata göras. Om du har administratörsbehörighet för arbetsytan kan du ändra den här inställningen:
Gå till Administratörsinställningar>Arbetsyteinställningar i Azure Databricks-administratörskonsolen.
Under Git-mappar, väljer du Tillåt att Git-mappar exporterar IPYNB-utdata och väljer sedan Tillåt: IPYNB-utdata kan aktiveras.
Viktig
När utdata finns med inkluderas visualiserings- och instrumentpanelskonfigurationerna i de.ipynb anteckningsböcker som du skapar.
Kontrollera IPYNB-notebookens utdataartefakt-incheckningar
När du committar en .ipynb-fil skapar Databricks en konfigurationsfil som låter dig kontrollera hur du committar utdata: .databricks/commit_outputs.
Om du har en
.ipynbnotebook-fil men ingen konfigurationsfil på fjärrlagringsplatsen går du till dialogrutan Git-status.I meddelandedialogrutan väljer du Skapa commit_outputs konfigurationsfil.
Du kan också generera konfigurationsfiler från menyn File. Menyn File har en kontroll för att automatiskt uppdatera konfigurationsfilen där du kan ange inkludering eller exkludering av utdata för en specifik IPYNB-notebook-fil.
I menyn Fil väljer du Checka in notebooks-utdata.
I dialogrutan bekräftar du ditt val av att kommittera notebook-utdata.