使用 Azure MCP 服务器,可以使用自然语言提示管理 Azure 资源(包括 Azure 托管 Lustre),简化 AI 培训和 HPC 环境的基础结构作。 了解如何使用可缩放 Lustre 文件系统优化 AI 和 HPC 工作负载。
Azure 托管 Lustre 是基于开源 Lustre 技术构建的高性能可缩放文件系统,针对 Azure 上的 AI 和 HPC 工作负载进行了优化。 它提供大规模模拟、模型训练和微调所需的吞吐量、并行度和低延迟访问。
注释
Azure MCP 服务器工具为完成任务所需的数据定义参数。 其中一些参数特定于每个工具,如下所示。 其他参数是全局参数,由所有工具共享。 有关详细信息,请参阅 工具参数。
文件系统:创建文件系统
使用指定的网络、容量、维护时段和可用性区域创建 Azure 托管 Lustre(AMLFS)文件系统。
示例提示包括:
- 基本文件系统创建:“使用 SKU”AMLFS-Durable-Premium-125“在 eastus 中创建 Azure 托管 Lustre 文件系统'amlfs-prod-001',大小为 128 TiB, 在子网”/subscriptions/0000000-0000-0000-0000-000000000000/resourceGroups/my-rg/providers/Microsoft.Network/virtualNetworks/vnet-001/subnets/subnet-001“,区域 1,在周日 02:00 维护”
- 开发环境:“在 westus2 中使用”AMLFS-Durable-Premium-40“SKU 在子网”/subscriptions/0000000-0000-0000-0000“中创建测试文件系统”dev-amlfs“0-0000-000000000000/resourceGroups/dev-rg/providers/Microsoft.Network/virtualNetworks/dev-vnet/subnets/amlfs-subnet', 可用性区域 2, 维护星期三 14:00”
- 使用加密保护文件系统:“使用”AMLFS-Durable-Premium-125“SKU 在 northeurope 中创建加密的文件系统”secure-amlfs“,容量为 64 TiB, subnet '/subscriptions/0000000-0000-0000-0000-00000000000/resourceGroups/security-rg/providers/Microsoft.Network/virtualNetworks/secure-vnet/subnets/lustre-subnet', zone 1, maintenance friday at 23:00, using custom encryption with key Vault'/subscriptions/0000000-0000-0000-0000-00000000000/resourceGroups/security-rg/providers/Microsoft.KeyVault/vaults/secure-kv' 和密钥 ''https://secure-kv.vault.azure.net/keys/lustre-key/a1b2c3d4e5f6g7h8i9j0k1l2m3n4o5p”
- 预算优化设置:“使用”AMLFS-Durable-Premium-40“在 eastus2 中创建经济高效的文件系统”budget-fs“, 48 TiB,子网”/subscriptions/0000000-0000-0000-0000-00000000000/resourceGroups/budget-rg/providers/Microsoft.Network/virtualNetworks/budget-vnet/subnets/storage-subnet“,区域 1,维护星期日为 05:00”
| 参数 | 必需还是可选 | Description |
|---|---|---|
| 名称 | 必选 | AMLFS 资源名称。 必须是 DNS 友好型(字母、数字、连字符)。 示例:amlfs-001。 |
| 位置 | 必选 | Azure 区域/区域短名称(使用 Azure 位置令牌,小写)。 示例:uaenorth、swedencentral、eastus。 |
| SKU | 必选 | AMLFS SKU。 允许的确切值:AMLFS-Durable-Premium-40、、AMLFS-Durable-Premium-250AMLFS-Durable-Premium-125、 AMLFS-Durable-Premium-500。 |
| 大小 | 必选 | TIB 中的 AMLFS 大小(无单位)。 示例:4、12、128。 |
| 子网 ID | 必选 | 完整的子网资源 ID。 必需格式:/subscriptions/{sub}/resourceGroups/{rg}/providers/Microsoft.Network/virtualNetworks/{vnet}/subnets/{subnet}。 示例:/subscriptions/0000/resourceGroups/my-rg/providers/Microsoft.Network/virtualNetworks/vnet-001/subnets/subnet-001。 |
| 区域 | 必选 | 可用性区域标识符。 使用与区域的 AZ 标签匹配的一位数字符串(例如 1)。 示例:1。 |
| 维护日 | 必选 | 首选维护日。 允许的值:Monday、、、WednesdayTuesday、ThursdayFriday、SaturdaySunday。 |
| 维护时间 | 必选 | 首选的 UTC 维护时间。 格式: HH:MM (24小时)。 示例:00:00、23:00。 |
| HSM 容器 | 可选 | HSM 集成的完整 Blob 容器资源 ID。 HPC 缓存资源提供程序在父存储帐户上部署存储 Blob 数据参与者和存储帐户参与者角色之前必须具有。 格式:/subscriptions/{sub}/resourceGroups/{rg}/providers/Microsoft.Storage/storageAccounts/{account}/blobServices/default/containers/{container}。 示例:/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/rg/providers/Microsoft.Storage/storageAccounts/stacc/blobServices/default/containers/hsm-container。 |
| HSM 日志容器 | 可选 | HSM 日志记录的完整 Blob 容器资源 ID。 HPC 缓存资源提供程序在父存储帐户上部署存储 Blob 数据参与者和存储帐户参与者角色之前必须具有。 与 HSM 容器的格式相同。 示例:/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/rg/providers/Microsoft.Storage/storageAccounts/stacc/blobServices/default/containers/hsm-logs。 |
| 导入前缀 | 可选 | 可选 HSM 导入前缀(从开头 /的容器中的路径前缀)。 示例:'/ingest/'、'/archive/2019/'。 |
| 根壁球模式 | 可选 | 根壁球模式。 允许的值:All、RootOnly、None。 |
| 无壁球 NID 列表 | 可选 | 以逗号分隔的 NID 列表(网络标识符)不进行挤压。 示例:'10.0.2.4@tcp;10.0.2.[6-8]@tcp'。 |
| Squash UID | 可选 | 要对根进行挤压的数值 UID。 如果根壁模式不 None是必需的。 示例:1000。 |
| Squash GID | 可选 | 要对根进行挤压的数值 GID。 如果根壁模式不 None是必需的。 示例:1000。 |
| 自定义加密 | 可选 | 使用 Key Vault 密钥启用客户管理的加密。 需要密钥 URL 和源保管库时 true,已为 Key Vault 密钥访问配置了用户分配的标识。 |
| 密钥 URL | 可选 | 完整 Key Vault 密钥 URL。 格式:https://{vaultName}.vault.azure.net/keys/{keyName}/{keyVersion}。 示例:https://kv-amlfs-001.vault.azure.net/keys/key-amlfs-001/a1b2c3d4e5f6g7h8i9j0k1l2m3n4o5p。 |
| 源保管库 | 可选 | 完整 Key Vault 资源 ID。 格式:/subscriptions/{sub}/resourceGroups/{rg}/providers/Microsoft.KeyVault/vaults/{vaultName}。 示例:/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/rg/providers/Microsoft.KeyVault/vaults/kv-amlfs-001。 |
| 用户分配的标识 ID | 可选 | 启用自定义加密时,用户分配的托管标识资源 ID(完整资源 ID)用于 Key Vault 访问。 标识必须具有 RBAC 角色才能访问加密密钥。 格式:/subscriptions/{sub}/resourceGroups/{rg}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{name}。 示例:/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/rg/providers/Microsoft.ManagedIdentity/userAssignedIdentities/identity1。 |
文件系统:列出文件系统
获取 Azure 托管 Lustre 文件系统的清单并检查其属性。
示例提示包括:
- 列出所有文件系统:“列出所有 Azure 托管 Lustre 文件系统”。
- 显示文件系统详细信息:“获取文件系统'my-lustre-fs'的详细信息。
- 检查文件系统状态:“我的文件系统”my-lustre-fs“的状态是什么?
- 按资源组进行筛选:“列出资源组”bigdata-rg“中的 Azure 托管 Lustre 文件系统。
- 按大小筛选:“显示大于 100 TiB 的文件系统。
文件系统:计算所需的子网大小
根据 SKU 和大小计算 Azure 托管 Lustre 文件系统所需的子网大小。 使用此计算来规划 AMLFS 的网络部署。
示例提示包括:
- 基本计算:“SKU”AMLFS-Durable-Premium-125“和大小为 128 TiB 的文件系统”my-lustre-fs“所需的子网大小是多少?
- 小型部署:“使用 SKU”AMLFS-Durable-Premium-250“计算 Azure 托管 Lustre 文件系统的子网大小,大小为 8 TiB”
- 大规模规划:“使用”AMLFS-Durable-Premium-500“SKU 的 512 TiB 文件系统需要什么子网大小?
- 开发环境:“使用”AMLFS-Durable-Premium-125“SKU 和 32 TiB 容量计算测试文件系统所需的子网大小”
- 生产规划:“使用”AMLFS-Durable-Premium-250“的生产文件系统”prod-amlfs-001“的子网大小要求是多少?
- 高性能设置:“使用”AMLFS-Durable-Premium-500“和 1024 TiB 计算 AI 训练文件系统的子网要求
- 研究环境:“使用 SKU”AMLFS-Durable-Premium-125“和 64 TiB 的研究文件系统”ml-data-fs“需要什么子网大小?
| 参数 | 必需还是可选 | Description |
|---|---|---|
| SKU | 必选 | AMLFS SKU。 允许的值:AMLFS-Durable-Premium-40、AMLFS-Durable-Premium-125、、AMLFS-Durable-Premium-250AMLFS-Durable-Premium-500。 |
| 大小 | 必选 | AMLFS 大小(以字节为单位)(TiB)。 |
文件系统:获取 SKU
检索可用的 Azure 托管 Lustre SKU,包括增量、带宽、缩放目标和区域支持。
示例提示包括:
- 列出可用的 SKU:“显示可用的 Azure 托管 Lustre SKU”。
- 按区域获取 SKU:“显示西欧可用的 Azure 托管 Lustre SKU。
| 参数 | 必需还是可选 | Description |
|---|---|---|
| 位置 | 可选 | Azure 区域。 示例:uaenorth、swedencentral、eastus。 |
文件系统:更新文件系统
更新现有 Azure 托管 Lustre (AMLFS) 文件系统的维护时段和/或根壁球设置。 提供维护日和时间或根壁球字段(no-squash-nid-list、、squash-uidsquash-gid)。 如果根壁球不是 None,则必须提供根壁球字段。 如果更新维护时段,则应提供维护日和维护时间。
示例提示包括:
- 基本维护时段更新:“将 Azure 托管 Lustre 文件系统的维护时段”amlfs-prod-001“更新到星期日 02:00”
- 周末维护计划:“将文件系统”hpc-lustre-fs“的维护时段更改为星期六,时间是 23:00”
- 工作时间维护:“将 Azure 托管 Lustre 文件系统”dev-amlfs“维护更新为周三 14:30”
- 非高峰计划:“将文件系统”analytics-lustre“的维护时段设置为星期一 01:00”
- 根壁配置:“使用根壁球模式”All“更新文件系统”secure-amlfs“,并使用无壁球 NID 列表”10.0.2.4@tcp;10.0.2“来更新文件系统 UID 1000 和 GID 1000。[6-8]@tcp'”
- 组合更新:“将文件系统'ml-amlfs'维护更新到星期五(星期五)03:00,并将根壁球模式设置为”None”
- 安全强化:“将 Azure 托管 Lustre 文件系统”production-fs“与no squash NID 列表”10.0.2.4@tcp;10.0.2 配置。[6-8]@tcp',和壁球 GID 999”
- 开发环境:“将文件系统”test-lustre“维护时段更新到周四 12:00 进行开发测试”
- 区域维护:“将文件系统”europe-amlfs“的维护计划设置为周二04:00,以尽量减少影响”
| 参数 | 必需还是可选 | Description |
|---|---|---|
| 名称 | 必选 | AMLFS 资源名称。 必须是 DNS 友好型(字母、数字、连字符)。 示例:amlfs-001。 |
| 维护日 | 可选 | 首选维护日。 允许的值:Monday、、、WednesdayTuesday、ThursdayFriday、SaturdaySunday。 |
| 维护时间 | 可选 | 首选的 UTC 维护时间。 格式: HH:MM (24小时)。 示例:00:00、23:00。 |
| 无壁球 NID 列表 | 可选 | 以逗号分隔的 NID 列表(网络标识符)不进行挤压。 示例:'10.0.2.4@tcp;10.0.2.[6-8]@tcp'。 |
| Squash UID | 可选 | 要对根进行挤压的数值 UID。 如果根壁模式不 None是必需的。 示例:1000。 |
| Squash GID | 可选 | 要对根进行挤压的数值 GID。 如果根壁模式不 None是必需的。 示例:1000。 |
| 根壁球模式 | 可选 | 根壁球模式。 允许的值:All、RootOnly、None。 |
文件系统:验证子网大小
验证提供的子网是否可以为给定 SKU 和大小托管 Azure 托管 Lustre 文件系统。
示例提示包括:
- 基本验证:“验证网络 '/subscriptions/00000000-0000-0000-0000-0000000000000/resourceGroups/my-rg/providers/Microsoft.Network/virtualNetworks/vnet-001/subnets/subnet-001”可以使用 SKU“AMLFS-Durable-Premium-125”托管大小为 128 TiB 的 Azure 托管 Lustre 文件系统”
- 生产环境:“检查子网'/subscriptions/0000000-0000-0000-0000-000000000000/resourceGroups/hpc-rg/providers /Microsoft.Network/virtualNetworks/hpc-vnet/subnets/lustre-subnet”支持在 eastus 中使用 SKU“AMLFS-Durable-Premium-250”的 256 TiB 文件系统
- 开发设置:“使用子网”/subscriptions/dev-sub/resourceGroups/dev-rg/providers/Microsoft.Network/virtualNetworks/dev-vnet/subnets/amlfs-subnets/amlfs-subnets/amlfs-subnet“验证 Azure 托管 Lustre 文件系统大小为 48 TiB 的子网容量”
- 大规模部署:“子网'/subscriptions/0000000-0000-0000-0000-00000000000/resourceGroups/ai-rg/providers /Microsoft.Network/virtualNetworks/ai-vnet/subnets/storage-subnet'在瑞典中心使用”AMLFS-Durable-Premium-500“SKU 托管 512 TiB Azure 托管 Lustre 文件系统?
| 参数 | 必需还是可选 | Description |
|---|---|---|
| SKU | 必选 | AMLFS SKU。 允许的确切值:AMLFS-Durable-Premium-40、、AMLFS-Durable-Premium-250AMLFS-Durable-Premium-125、 AMLFS-Durable-Premium-500。 |
| 大小 | 必选 | TIB 中的 AMLFS 大小(无单位)。 示例:4、12、128。 |
| 子网 ID | 必选 | 完整的子网资源 ID。 必需格式:/subscriptions/{sub}/resourceGroups/{rg}/providers/Microsoft.Network/virtualNetworks/{vnet}/subnets/{subnet}。 示例:/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/my-rg/providers/Microsoft.Network/virtualNetworks/vnet-001/subnets/subnet-001。 |
| 位置 | 必选 | Azure 区域/区域短名称(使用 Azure 位置令牌,小写)。 示例:uaenorth、swedencentral、eastus。 |