Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Het doel van de meeste big data-oplossingen is inzicht te bieden in gegevens via analyse en rapportage. Analyse en rapportage kunnen vooraf geconfigureerde rapporten en visualisaties of interactieve gegevensverkenning omvatten.
Opties voor gegevensanalysetechnologie
Er zijn verschillende opties voor analyse, visualisaties en rapportage in Azure, afhankelijk van uw behoeften:
Power BI
Power BI is een suite met hulpprogramma's voor zakelijke analyses. Het kan verbinding maken met honderden gegevensbronnen en u kunt deze gebruiken voor niet-geplande analyse. Gebruik Power BI Embedded om Power BI te integreren in uw eigen toepassingen zonder extra licenties.
Organisaties kunnen Power BI gebruiken om rapporten te produceren en naar de organisatie te publiceren. Iedereen kan gepersonaliseerde dashboards maken, met ingebouwde governance en beveiliging. Power BI gebruikt Microsoft Entra ID om gebruikers te verifiëren die zich aanmelden bij de Power BI-service. Hierbij worden de Power BI-referenties gebruikt wanneer een gebruiker toegang probeert te krijgen tot resources waarvoor verificatie is vereist.
Jupyter-notebooks
Jupyter-notebooks bieden een browsergebaseerde shell waarmee gegevenswetenschappers notebookbestanden kunnen maken die Python-, Scala- of R-code en Markdown-tekst bevatten. Deze mogelijkheden zorgen ervoor dat notitieblokken een effectieve manier zijn om samen te werken door code te delen en documenteren en resulteert in één document.
De meeste soorten HDInsight-clusters, zoals Spark of Hadoop, zijn vooraf geconfigureerd met Jupyter-notebooks voor interactie met gegevens en het verzenden van taken voor verwerking. Afhankelijk van het type HDInsight-cluster dat u gebruikt, worden een of meer kernels aangeboden om uw code te interpreteren en uit te voeren. Spark-clusters in HDInsight bieden bijvoorbeeld Spark-gerelateerde kernels die u kunt selecteren om Python- of Scala-code uit te voeren met behulp van de Spark-engine.
Jupyter-notebooks bieden een effectieve omgeving voor het analyseren, visualiseren en verwerken van uw gegevens voordat u geavanceerdere visualisaties bouwt met behulp van een BI-rapportageprogramma zoals Power BI.
Zeppelin-notebooks
Zeppelin-notebooks bieden ook een browsergebaseerde shell met vergelijkbare functionaliteit als Jupyter-notebooks. Sommige HDInsight-clusters zijn vooraf geconfigureerd met Zeppelin-notebooks. Als u echter een HDInsight Interactive Query-cluster (ook wel Apache Hive LLAP genoemd) gebruikt, is Zeppelin het enige notebook dat u kunt gebruiken om interactieve Hive-query's uit te voeren. Als u een HDInsight-cluster gebruikt dat lid is van een domein, zijn Zeppelin-notebooks ook het enige type notebooks waarmee u verschillende gebruikersaanmeldingsgegevens kunt toewijzen om de toegang tot notebooks en de onderliggende Hive-tabellen te beheren.
Jupyter-notebooks in VS Code
VS Code is een gratis code-editor en ontwikkelplatform dat u lokaal kunt gebruiken of verbinding kunt maken met externe berekeningen. Wanneer u VS Code gebruikt met de Jupyter-extensie, biedt het een volledig geïntegreerde omgeving voor Jupyter-ontwikkeling die kan worden uitgebreid met meer taalextensies. Kies deze optie als u een eersteklas, gratis Jupyter-ervaring wilt en in staat wilt zijn om uw voorkeurscomputingbronnen te gebruiken.
Met BEHULP van VS Code kunt u notebooks ontwikkelen en uitvoeren op externe apparaten en containers. Om de overgang van Azure Notebooks te vereenvoudigen, is de containerafbeelding beschikbaar zodat je deze kunt gebruiken met VS Code.
Jupyter (voorheen IPython Notebook) is een opensource-project waarmee u eenvoudig Markdown-tekst en uitvoerbare Python-broncode kunt combineren op één canvas dat een notebook wordt genoemd. VS Code biedt ondersteuning voor het systeemeigen werken met Jupyter-notebooks en via Python-codebestanden.
Criteria voor sleutelselectie
Begin met het verfijnen van uw keuzes door de volgende vragen te beantwoorden:
Moet u verbinding maken met talloze gegevensbronnen en een gecentraliseerde locatie bieden om rapporten te maken voor gegevens verspreid over uw domein? Als u dit doet, kiest u een optie waarmee u verbinding kunt maken met honderden gegevensbronnen.
Wilt u dynamische visualisaties insluiten in een externe website of toepassing? Als u dit doet, kiest u een optie die mogelijkheden voor insluiten biedt.
Wilt u uw visualisaties en rapporten offline ontwerpen? Als u dit doet, kiest u een optie met offlinemogelijkheden.
Hebt u veel verwerkingskracht nodig om grote of complexe AI-modellen te trainen of met grote gegevenssets te werken? Als u dit doet, kiest u een optie die verbinding kan maken met een big data-cluster.
Mogelijkheidsmatrix
De volgende tabel bevat een overzicht van de belangrijkste verschillen in mogelijkheden.
Algemene mogelijkheden
| Mogelijkheid | Power BI | Jupyter-notebooks | Zeppelin-notebooks | Jupyter-notebooks in VS Code |
|---|---|---|---|---|
| Verbinding maken met big data-clusters voor geavanceerde verwerking | Ja | Ja | Ja | Nr. |
| Beheerde service | Ja | Ja 1 | Ja 1 | Ja |
| Verbinding maken met honderden gegevensbronnen | Ja | Nr. | Nr. | Nr. |
| Functionaliteiten offline | Ja 2 | Nr. | Nr. | Nr. |
| Mogelijkheden voor insluiten | Ja | Nr. | Nr. | Nr. |
| Automatisch vernieuwen van gegevens | Ja | Nr. | Nr. | Nr. |
| Toegang tot talloze opensource-pakketten | Nr. | Ja 3 | Ja 3 | Ja 4 |
| Opties voor gegevenstransformatie of opschoning | Power Query, R | 40 talen, waaronder Python, R, Julia en Scala | Meer dan 20 interpreters, waaronder Python, JDBC en R | Python, F#, R |
| Prijzen | Gratis voor Power BI Desktop (creatie). Zie power BI-prijzen voor hostingopties. | Gratis | Gratis | Gratis |
| Samenwerking met meerdere gebruikers | Ja | Ja (via delen of met een server met meerdere gebruikers, zoals JupyterHub) | Ja | Ja (via delen) |
[1] Wanneer deze wordt gebruikt als onderdeel van een beheerd HDInsight-cluster.
[2] Met het gebruik van Power BI Desktop.
[3] U kunt in de Maven-opslagplaats zoeken naar door de community bijgedragen pakketten.
[4] U kunt Python-pakketten installeren met behulp van pip of Conda. U kunt R-pakketten installeren vanuit CRAN of GitHub. U kunt pakketten in F# installeren via nuget.org met behulp van paket-afhankelijkheidsmanager.
Bijdragers
Microsoft onderhoudt dit artikel. De volgende inzenders hebben dit artikel geschreven.
Hoofdauteur:
- Zoiner Tejada | CEO en architect
Als u niet-openbare LinkedIn-profielen wilt zien, meldt u zich aan bij LinkedIn.
Volgende stappen
- Inleiding tot Databricks-notebooks
- Azure Databricks-notebooks uitvoeren met Azure Data Factory
- Jupyter-notebooks uitvoeren in uw werkruimte
- Wat is Power BI?