你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

快速入门:使用 HBase Shell 查询 Azure HDInsight 中的 Apache HBase

本快速入门介绍如何使用 Apache HBase Shell 创建 HBase 表、插入数据,然后查询表。

如果没有 Azure 订阅,请在开始之前创建一个免费帐户

先决条件

创建表并操作数据

对于大多数人,数据以表格格式显示:

HDInsight Apache HBase 表格数据。

在 HBase( Cloud BigTable 的实现)中,相同的数据如下所示:

HDInsight Apache HBase BigTable 数据。

可以使用 SSH 连接到 HBase 群集,然后使用 Apache HBase Shell 创建 HBase 表、插入数据和查询数据。

  1. 使用 ssh 命令连接到 HBase 群集。 编辑以下命令,将 CLUSTERNAME 替换为群集的名称,然后输入该命令:

    ssh sshuser@CLUSTERNAME-ssh.azurehdinsight.net
    
  2. 使用 hbase shell 命令启动 HBase 交互式 shell。 在 SSH 连接中输入以下命令:

    hbase shell
    
  3. 使用 create 命令创建包含两列系列的 HBase 表。 输入以下命令:

    create 'Contacts', 'Personal', 'Office'
    
  4. 使用 list 命令列出 HBase 中的所有表。 输入以下命令:

    list
    
  5. 使用 put 命令在特定表中指定行的指定列中插入值。 输入以下命令:

    put 'Contacts', '1000', 'Personal:Name', 'John Dole'
    put 'Contacts', '1000', 'Personal:Phone', '1-425-000-0001'
    put 'Contacts', '1000', 'Office:Phone', '1-425-000-0002'
    put 'Contacts', '1000', 'Office:Address', '1111 San Gabriel Dr.'
    
  6. 使用 scan 命令扫描并返回 Contacts 表数据。 输入以下命令:

    scan 'Contacts'
    
  7. 使用 get 命令提取行的内容。 输入以下命令:

    get 'Contacts', '1000'
    

    你会看到与使用scan命令相似的结果,因为只有一行。

  8. 使用 delete 命令删除表中的单元格值。 输入以下命令:

    delete 'Contacts', '1000', 'Office:Address'
    
  9. 使用 disable 命令禁用表。 输入以下命令:

    disable 'Contacts'
    
  10. 使用 drop 命令从 HBase 中删除表。 输入以下命令:

    drop 'Contacts'
    
  11. 使用 exit 命令停止 HBase 交互式 shell。 输入以下命令:

    exit
    

有关 HBase 表架构的详细信息,请参阅 Apache HBase 架构设计简介。 有关更多 HBase 命令,请参阅 Apache HBase 参考指南

清理资源

完成本快速入门后,可以删除群集。 使用 HDInsight 时,数据存储在 Azure 存储中,因此可以在不使用群集时安全地删除群集。 即使未使用 HDInsight 群集,也会向你收费。 由于群集的费用是存储费用的倍数,因此在不使用群集时删除群集具有经济意义。

若要删除群集,请参阅 使用浏览器、PowerShell 或 Azure CLI 删除 HDInsight 群集

后续步骤

本快速入门介绍了如何使用 Apache HBase Shell 创建 HBase 表、插入数据,然后查询表。 若要详细了解 HBase 中存储的数据,下一篇文章将介绍如何使用 Apache Spark 执行查询。