适用于:SQL Server 2019 (15.x)
Important
Microsoft SQL Server 2019 大数据群集已停用。 对 SQL Server 2019 大数据群集的支持已于 2025 年 2 月 28 日结束。 有关详细信息,请参阅Microsoft SQL Server 平台上的公告博客文章和大数据选项。
本文介绍 SQL Server 大数据群集部署的资源。
大数据群集基于部署配置文件部署 Pod。 有关详细信息,请参阅 默认配置。
本文介绍使用 aks-dev-test-ha 配置文件部署的 Pod,并包括 Spark 池。 查询 Kubernetes 以查看群集中部署的 Pod。 以下示例返回特定命名空间下的 Pod 列表。
kubectl get pods -n <namespace>
使用大数据群集的名称替换 <namespace>。
有关详细信息,请参阅如何在 Kubernetes 上部署 SQL Server 大数据群集。
下图显示了大数据群集中部署的组件:
有关体系结构的信息,请参阅 SQL Server 大数据群集简介。
Deployed pods
下表列出了在大数据群集中部署的 pod。
| Name | Area |
|---|---|
control-<nnnn> |
Control |
controldb-<#> |
Control |
controlwd-<nnnn> |
Control |
logsdb-<#> |
Control |
logsui-<nnnn> |
Control |
metricsdb-<#> |
Control |
metricsdc-<nnnn> |
Control |
metricsui-<nnnn> |
Control |
mgmtproxy-<nnnn> |
Control |
zookeeper-<#> |
Control |
dns-<nnnn> |
Control |
master-<#n> |
Master instance |
operator-<nnnn> |
Master instance |
compute-<#n>-<#m> |
Compute pool |
data-<#>-<#> |
Data pool |
storage-<#>-<#> |
Storage pool |
nmnode-<#>-<#> |
Storage pool |
sparkhead-<#> |
Storage pool |
appproxy-<#m> |
Application pool |
gateway-<#> |
Gateway service |
并非所有 Pod 都包含在每个大数据群集中。 具有高可用性或 Active Directory 集成的部署包括特定的 Pods。
特定于高可用性的 Pod:
operator-<nnnn>zookeeper-<#>
特定于 Active Directory 的 Pod:
dns-<nnnn>
以下部分介绍 Pod 并列出每个 Pod 中的容器。
Control
控制模块提供控制服务。
| Pod name | Count | Kubernetes 控制器类型 | 容器 |
|---|---|---|---|
control-# |
1 | ReplicaSet | - controller- security-support- fluentbit |
controldb |
1 | StatefulSet | - mssql-server- fluentbit |
controlwd |
1 | ReplicaSet | - controlwatchdog |
logsdb-# |
1 | StatefulSet | - elasticsearch |
logsui |
1 | ReplicaSet | - kibana |
metricsdb-# |
1 | StatefulSet | - influxdb |
metricsdc |
每个 Kubernetes 节点 1 个。 | DaemonSet | - telegraf |
metricsui-nnnn |
1 | ReplicaSet | - grafana |
mgmtproxy-nnnn |
1 | ReplicaSet | - service-proxy- fluentbit |
dns-nnnn |
0 或 1 用于 Active Directory 集成 | ReplicaSet | - dns- fluentbit |
Master instance
master-<#n> 是 SQL Server 主实例。
- 通过 DDL 管理数据池
- 通过 DML 操作数据池中的数据
- 将分析查询的执行卸载到数据池
| Pod name | Count | Kubernetes 控制器类型 | 容器 |
|---|---|---|---|
master-<#n> |
1 个或多个以确保高可用性。 | StatefulSet | - mssql-server- fluentbit- collectd- mssql-ha-supervisor
*
|
operator* |
0 或 1 以实现高可用性 | ReplicaSet | - mssql-ha-operator |
* 仅高可用性部署。 作员实现并注册 SQL Server 和可用性组资源的自定义资源定义。 部署作员后,它会将自身注册为侦听器,以获取有关在 Kubernetes 群集中部署的 SQL Server 资源的通知。
mssql-ha-supervisor 支持可用性组。
每个 master Pod 都包含一个 SQL Server 实例。 高可用性部署包括 3 个 Pod。 每个 Pod 都包含一个 SQL Server 实例,其中包含 SQL Server Always On 可用性组中的数据库。
根据您的工作负载,在部署时添加额外的 Pod。
Compute pool
计算池提供用于计算的 SQL Server 实例。
| Pod name | Count | Kubernetes 控制器类型 | 容器 |
|---|---|---|---|
compute-<#n>-<#m> |
1 个或多个。 | StatefulSet | - mssql-server- fluentbit- collectd |
-
#n标识计算池。 -
#m标识池中的实例 ID。
计算池 SQL Server 实例是无状态的。 它们只需要为tempdb提供存储。
根据您的工作负载,在部署时添加额外的 Pod。
Data pool
数据池提供用于存储和计算的 SQL Server 实例。
| Pod name | Count | Kubernetes 控制器类型 | 容器 |
|---|---|---|---|
data-<#n>-<#m> |
0 或更多 | StatefulSet | - mssql-server - fluentbit- collectd |
-
#n标识数据池。 -
#m标识池中的实例 ID。
根据工作负荷,在部署时添加额外的 Pod。
Storage pool
存储池通过 Spark 实现数据引入,数据存储在 HDFS 中,并通过 HDFS 和 SQL Server 终结点进行数据访问。
| Pod name | Count | Kubernetes 控制器类型 | 容器 |
|---|---|---|---|
storage-0-# |
1 个或多个。 根据工作负荷,在部署时添加额外的 Pod。 | StatefulSet | - hadoop- mssql-server- fluentbit |
nmnode-0-# |
1 个或多个以实现高可用性 | StatefulSet | - hadoop- fluentbit |
sparkehead-# |
1 个或多个以实现高可用性 | StatefulSet | - hadoop-yarn-jobhistory- hadoop-livy-sparkhistory- hadoop-hivemetastore-- fluentbit |
zookeeper |
0 或 3 以实现高可用性。 | StatefulSet | - zookeeper- fluentbit |
Application pool
应用程序池包含在一些测试配置文件中。 应用程序池托管在为大数据群集部署应用程序时定义的应用程序服务代理。
appproxy 是位于应用程序池应用程序前面的 Web API。 它会对用户进行身份验证,然后将请求路由到应用程序。
| Pod name | Kubernetes 控制器类型 | 容器 |
|---|---|---|
appproxy |
ReplicaSet | - app-service-proxy- fluentbit |
有关详细信息,请参阅 大数据群集上的应用程序部署简介。
根据工作负荷,在部署时添加额外的 Pod。
Gateway service
网关服务为 Spark、HDFS、Yarn、Yarn UI 和 Spark UI 提供 Knox 网关。
| Pod name | Kubernetes 控制器类型 | 容器 |
|---|---|---|
gateway-<#> |
StatefulSet | - knox- fluentbit |
仅支持一个网关。
开源容器引用
有关特定开源项目和版本,请参阅 开源软件参考。
Next steps
若要了解有关 SQL Server 大数据群集 的详细信息,请参阅以下资源: