Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
In dit artikel wordt de standaardnotatie voor notitieblokken in Azure Databricks beschreven, hoe u de indeling van uw notitieblok wijzigt en hoe u uitvoerdoorvoeringen beheert als uw notebook zich in een door de bron beheerde map bevindt.
Notebooks in Databricks worden standaard aangemaakt in het formaat .ipynb (IPython of Jupyter). U kunt er ook voor kiezen om in plaats daarvan de bronindeling te gebruiken.
U kunt nog steeds notitieblokken importeren en exporteren in verschillende indelingen. Zie Databricks-notebooks importeren en exporteren.
Notitieboekformaten
Databricks ondersteunt het maken en bewerken van notebooks in twee indelingen: IPYNB (standaard) en bron.
U kunt bronbestanden, inclusief notebooks, beheren met behulp van Git-mappen. Alleen bepaalde Databricks-assettypen worden ondersteund in Git-mappen. Het formaat beïnvloedt hoe notitieboeken naar externe repositories worden gepusht, zoals beschreven in de onderstaande tabel.
| Notitieblok bronformaat | Beschrijving |
|---|---|
| bron | Een basisindeling die alleen broncode vastlegt, met een achtervoegsel dat de codetaal aangeeft, zoals .py, .scala, .r en .sql. |
| IPYNB (Jupyter) | Een uitgebreide indeling die broncode, notebookomgeving, visualisatiedefinities, notebookwidgets en optionele uitvoer vastlegt. Een IPYNB-notebook kan code bevatten in elke taal die wordt ondersteund door Databricks-notebooks (ondanks het py deel van .ipynb). Met behulp van het IPYNB-formaat kun je optioneel de versie van de uitvoer van een notebook beheren samen met de notebook. |
Het IPYNB-formaat ondersteunt ook een betere weergave-ervaring voor Databricks-notebooks op externe Git-repositories. Als je GitHub of GitLab gebruikt, kun je functies inschakelen die verbeterde verschillen van je notebooks in pull requests bieden, wat het eenvoudiger maakt om veranderingen aan een notebook te bekijken en te beoordelen.
Om meer te leren over de ondersteuning van GitHub voor uitgebreide verschillen in IPYNB-notebooks, zie Feature Preview: Rich Jupyter Notebook Diffs. Om meer te weten te komen over GitLab-ondersteuning voor IPYNB-notebook-verschillen, zie Jupyter Notebook-bestanden.
Om notebooks met bronformaat te onderscheiden van reguliere Python-, Scala- en SQL-bestanden, voegt Azure Databricks de opmerking “Databricks notebook source” toe aan de bovenkant van Python-, Scala- en SQL-notebooks. Deze opmerking zorgt ervoor dat Azure Databricks het bestand correct parseert als een notebook in plaats van een scriptbestand.
Wijzig de standaardinstelling voor notitieboekopmaak
IPYNB-bestanden zijn het standaardformaat bij het maken van een nieuw notebook in Azure Databricks.
Als u de standaardinstelling wilt wijzigen naar de Azure Databricks-bronindeling, meldt u zich aan bij uw Azure Databricks-werkruimte, klikt u in de rechterbovenhoek van de pagina op uw profiel en vervolgens op Instellingen en gaat u naar Ontwikkelaar. Wijzig de standaardindeling van het notitieblok onder de Editor-instellingen rubriek.
Notitieblokindeling converteren
U kunt een bestaand notebook converteren naar een andere indeling via de gebruikersinterface van Azure Databricks.
Een bestaand notitieblok converteren naar een andere indeling:
Open het notitieblok in uw werkruimte.
Selecteer Bestand in het werkruimtemenu, selecteer Notitieboekformaat, en kies het gewenste formaat. U kunt kiezen tussen Jupyter (.ipynb) (Aanbevolen) of Bronbestand (.scala, .py, .sql, .r). De huidige indeling van het notitieblok wordt grijs weergegeven en bevat een vinkje ernaast.
Zie Databricks-notebooks importeren en exporteren voor meer informatie over de soorten notebooks die worden ondersteund in Azure Databricks.
Beheer IPYNB notebook-uitvoerverzoeken
Uitvoerresultaten zijn de uitkomsten van het uitvoeren van een notebook op het Databricks-platform, inclusief tabelweergaven en visualisaties. Voor IPYNB-notebooks in door bron beheerde mappen kunt u beheren hoe notebookuitvoer wordt doorgevoerd in de externe opslagplaats.
Sta toe dat notebookuitvoer wordt gecommit .ipynb
Uitvoer kan alleen worden doorgevoerd als een werkruimtebeheerder deze functie heeft ingeschakeld. De beheerinstelling voor Git-mappen staat standaard niet toe dat .ipynb notebookuitvoer wordt doorgevoerd. Als u beheerdersbevoegdheden voor de werkruimte hebt, kunt u deze instelling wijzigen:
Ga naar beheerinstellingen>Werkruimte-instellingen in de Azure Databricks-beheerconsole.
Onder Git-mappen, kies Sta Git-mappen toe om IPYNB-uitvoer te exporteren en selecteer vervolgens Toestaan: IPYNB-uitvoer kan worden in- of uitgeschakeld.
Belangrijk
Wanneer uitvoer wordt opgenomen, worden de visualisatie- en dashboardconfiguraties opgenomen in de.ipynb notebooks die u maakt.
Beheer IPYNB-notitieboek uitvoer artefact commits
Wanneer u een .ipynb bestand doorvoert, maakt Databricks een configuratiebestand waarmee u kunt bepalen hoe u uitvoer doorvoert: .databricks/commit_outputs.
Als u een
.ipynbnotebookbestand hebt maar geen configuratiebestand in uw externe opslagplaats, gaat u naar het dialoogvenster Git-status.Selecteer in het meldingsdialoogvenster de optie het configuratiebestand commit_outputs aanmaken.
U kunt ook configuratiebestanden genereren vanuit het menu Bestand. Het menu Bestand bevat een besturingselement om het configuratiebestand automatisch bij te werken, waar u de opname of uitsluiting van uitvoer voor een specifiek IPYNB-notebook kunt opgeven.
Selecteer in het menu Bestand de optie Notebooks-uitvoer doorvoeren.
Bevestig uw keuze in het dialoogvenster om notebookuitvoer door te voeren.
Dialoogvenster notitieblokuitvoer bevestigen.
