Vad är Apache HBase i Azure HDInsight

2025-04-02

Apache HBase är en NoSQL-databas med öppen källkod som bygger på Apache Hadoop och modelleras efter Google BigTable. HBase ger slumpartad åtkomst och stark konsistens för stora mängder data i en schemalös databas. Databasen ordnas efter kolumnfamiljer.

Från användarperspektiv liknar HBase en databas. Data lagras i raderna och kolumnerna i en tabell, och data i en rad grupperas efter kolumnfamilj. HBase är en schemalös databas. Kolumnerna och datatyperna kan vara odefinierade innan du använder dem. Den öppna källkoden skalas linjärt för att hantera petabyte med data på tusentals noder. Den kan förlita sig på dataredundans, batchbearbetning och andra funktioner som tillhandahålls av distribuerade program i Hadoop-miljön.

Hur implementeras Apache HBase i Azure HDInsight?

HDInsight HBase erbjuds som ett hanterat kluster som är integrerat i Azure-miljön. Klustren är konfigurerade för att lagra data direkt i Azure Storage, vilket ger låg svarstid och ökad elasticitet i prestanda- och kostnadsval. Den här egenskapen gör det möjligt för kunder att skapa interaktiva webbplatser som fungerar med stora datamängder. Skapa tjänster som lagrar sensor- och telemetridata från miljontals slutpunkter. Och för att analysera dessa data med Hadoop-jobb. HBase och Hadoop är bra utgångspunkter för stordataprojekt i Azure. Tjänsterna kan göra det möjligt för realtidsprogram att fungera med stora datamängder.

HDInsight-implementeringen använder utskalningsarkitekturen för HBase för att tillhandahålla automatisk horisontell partitionering av tabeller. Och stark konsekvens för läsningar och skrivningar samt automatisk redundans. Prestanda utökas av cachelagring i minnet för läsning och snabb strömning för skrivning. HBase-kluster kan skapas i virtuella nätverk. Mer information finns i Create HDInsight clusters on Azure Virtual Network (Skapa HDInsight-kluster i Azure Virtual Network).

Hur hanteras data i HDInsight HBase?

Data kan hanteras i HBase med hjälp av create, get, put och scan-kommandona från HBase-skalet. Data skrivs till databasen med hjälp av put och läses med hjälp av get. Kommandot scan används för att hämta data från flera rader i en tabell. Data kan också hanteras med hjälp av HBase C#-API:et, som tillhandahåller ett klientbibliotek ovanpå HBase REST API. En HBase-databas kan också frågas med hjälp av Apache Hive. En introduktion till dessa programmeringsmodeller finns i Komma igång med Apache HBase med Apache Hadoop i HDInsight. Coprocessorer är också tillgängliga, vilket tillåter databearbetning i de noder som är värdar för databasen.

Anmärkning

Thrift stöds inte av HBase i HDInsight.

Användningsfall för Apache HBase

Det kanoniska användningsfallet för vilket BigTable (och i tillägg, HBase) skapades från webbsökning. Sökmotorer skapar index som mappar termer till de webbsidor som innehåller dem. Men det finns många andra användningsfall som HBase är lämpligt för , varav flera är specificerade i det här avsnittet.

Scenarium	Beskrivning
Nyckelvärdesdatabas	HBase kan användas som ett nyckelvärdeslager och är lämpligt för att hantera meddelandesystem. Facebook använder HBase för sina meddelandesystem och är idealiskt för att lagra och hantera Internetkommunikation. WebTable använder HBase för att söka efter och hantera tabeller som extraheras från webbsidor.
Sensordata	HBase är användbart för att samla in data som samlas in stegvis från olika källor. Dessa data omfattar social analys och tidsserier. Och hålla interaktiva instrumentpaneler uppdaterade med trender och räknare och hantering av granskningsloggsystem. Exempel är Bloomberg Traders terminal och Open Time Series Database (OpenTSDB). OpenTSDB lagrar och ger åtkomst till mått som samlas in om hälsotillståndet för serversystem.
Realtidsfråga	Apache Phoenix är en SQL-frågemotor för Apache HBase. Den används som en JDBC-drivrutin och gör det möjligt att köra frågor mot och hantera HBase-tabeller med hjälp av SQL.
HBase som en plattform	Program kan köras ovanpå HBase genom att använda det som ett datalager. Exempel är Phoenix, OpenTSDB `Kiji`och Titan. Program kan också integreras med HBase. Exempel är: Apache Hive, Apache Pig, Solr, Apache Flume, Apache Impala, Apache Spark `Ganglia`och Apache Drill.

Nästa steg

Kom igång med Apache HBase med Apache Hadoop i HDInsight
Skapa HDInsight-kluster i Azure Virtual Network
Konfigurera replikering i Apache HBase på HDInsight

Feedback

Var den här sidan till hjälp?