Dela via


Välj en dataanalys- och rapporteringsteknik i Azure

Målet för de flesta stordatalösningar är att ge insikter om data genom analys och rapportering. Analys och rapportering kan omfatta förkonfigurerade rapporter och visualiseringar eller interaktiv datautforskning.

Teknikalternativ för dataanalys

Det finns flera alternativ för analys, visualiseringar och rapportering i Azure, beroende på dina behov:

Power BI

Power BI är en uppsättning affärsanalysverktyg. Den kan ansluta till hundratals datakällor och du kan använda den för oplanerad analys. Använd Power BI Embedded för att integrera Power BI i dina egna program utan extra licensiering.

Organisationer kan använda Power BI för att skapa rapporter och publicera dem i organisationen. Alla kan skapa anpassade instrumentpaneler med inbyggd styrning och säkerhet. Power BI använder Microsoft Entra-ID för att autentisera användare som loggar in på Power BI-tjänsten. Den använder Power BI-autentiseringsuppgifterna när en användare försöker komma åt resurser som kräver autentisering.

Jupyter Notebook

Jupyter Notebooks tillhandahåller ett webbläsarbaserat gränssnitt som gör att dataforskare kan skapa notebook-filer som innehåller Python-, Scala- eller R-kod och Markdown-text. De här funktionerna gör notebook-filer till ett effektivt sätt att samarbeta genom att dela och dokumentera kod och resulterar i ett enda dokument.

De flesta sorter av HDInsight-kluster, till exempel Spark eller Hadoop, är förkonfigurerade med Jupyter Notebooks för att interagera med data och skicka jobb för bearbetning. Beroende på vilken typ av HDInsight-kluster du använder tillhandahålls en eller flera kernels för att tolka och köra koden. Spark-kluster i HDInsight tillhandahåller till exempel Spark-relaterade kernels som du kan välja för att köra Python- eller Scala-kod med hjälp av Spark-motorn.

Jupyter Notebooks ger en effektiv miljö för att analysera, visualisera och bearbeta dina data innan du skapar mer avancerade visualiseringar med hjälp av ett BI-rapporteringsverktyg som Power BI.

Zeppelin anteckningsböcker

Zeppelin Notebooks tillhandahåller också ett webbläsarbaserat gränssnitt som har liknande funktioner som Jupyter Notebooks. Vissa HDInsight-kluster är förkonfigurerade med Zeppelin-notebook-filer. Men om du använder ett HDInsight Interactive Query-kluster (även kallat Apache Hive LLAP) är Zeppelin den enda notebook-fil som du kan använda för att köra interaktiva Hive-frågor. Om du använder ett domänanslutet HDInsight-kluster är Zeppelin-notebook-filer den enda typen av notebook-filer som gör att du kan tilldela olika användarinloggningar för att styra åtkomsten till notebook-filer och underliggande Hive-tabeller.

Jupyter Notebooks i VS Code

VS Code är en kostnadsfri kodredigerare och utvecklingsplattform som du kan använda lokalt eller anslutet till fjärrberäkning. När du använder VS Code med Jupyter-tillägget ger det en helt integrerad miljö för Jupyter-utveckling som kan förbättras med fler språktillägg. Välj det här alternativet om du vill ha en förstklassig, kostnadsfri Jupyter-upplevelse och kunna använda valfri beräkning.

Genom att använda VS Code kan du utveckla och köra notebook-filer mot fjärr- och containrar. För att förenkla övergången från Azure Notebooks är containeravbildningen också tillgänglig för dig att använda med VS Code.

Jupyter (tidigare IPython Notebook) är ett projekt med öppen källkod som gör att du enkelt kan kombinera Markdown-text och körbar Python-källkod på en arbetsyta som kallas notebook-fil. VS Code stöder arbete med Jupyter-notebook-filer internt och via Python-kodfiler.

Kriterier för nyckelval

Börja begränsa dina val genom att svara på följande frågor:

  • Behöver du ansluta till flera datakällor och tillhandahålla en central plats för att skapa rapporter för dataspridning i hela domänen? Om du gör det väljer du ett alternativ som gör att du kan ansluta till hundratals datakällor.

  • Vill du bädda in dynamiska visualiseringar på en extern webbplats eller ett program? Om du gör det väljer du ett alternativ som tillhandahåller inbäddningsfunktioner.

  • Vill du utforma dina visualiseringar och rapporter när du är offline? Om du gör det väljer du ett alternativ som har offlinefunktioner.

  • Behöver du tung bearbetningskraft för att träna stora eller komplexa AI-modeller eller arbeta med stora datamängder? Om du gör det väljer du ett alternativ som kan ansluta till ett stordatakluster.

Kapacitetsmatris

I följande tabell sammanfattas de viktigaste skillnaderna i funktioner.

Allmänna funktioner

Kapacitet Power BI Jupyter Notebook Zeppelin anteckningsböcker Jupyter Notebooks i VS Code
Ansluta till stordatakluster för avancerad bearbetning Ja Ja Ja Nej
Hanterad tjänst Ja Ja 1 Ja 1 Ja
Ansluta till hundratals datakällor Ja Nej Nej Nej
Offlinefunktioner Ja 2 Nej Nej Nej
Inbäddningsfunktioner Ja Nej Nej Nej
Automatisk datauppdatering Ja Nej Nej Nej
Åtkomst till flera paket med öppen källkod Nej Ja 3 Ja 3 Ja 4
Alternativ för datatransformering eller rensning Power Query, R 40 språk, inklusive Python, R, Julia och Scala Fler än 20 tolkar, inklusive Python, JDBC och R Python, F#, R
Prissättning Kostnadsfritt för författande i Power BI Desktop. Se Priser för Power BI för värdalternativ. Kostnadsfri Kostnadsfri Kostnadsfri
Samarbete mellan flera användare Ja Ja (via delning eller med en server med flera användare som JupyterHub) Ja Ja (via delning)

[1] När det används som en del av ett hanterat HDInsight-kluster.

[2] Med hjälp av Power BI Desktop.

[3] Du kan söka på Maven-lagringsplatsen efter community-bidragna paket.

[4] Du kan installera Python-paket med hjälp av antingen pip eller Conda. Du kan installera R-paket från CRAN eller GitHub. Du kan installera paket i F# via nuget.org med hjälp av paketberoendehanteraren.

Deltagare

Microsoft ansvarar för den här artikeln. Följande deltagare skrev den här artikeln.

Huvudförfattare:

Om du vill se linkedin-profiler som inte är offentliga loggar du in på LinkedIn.

Nästa steg