HPC Pack 2016 Update 3 发行说明

这些发行说明解决了有关 Microsoft HPC Pack 2016 Update 3 的高性能计算(HPC)群集管理员的后期中断问题和信息。

下载并安装 Microsoft HPC Pack 2016 Update 3

HPC Pack 2016 Update 3 可从Microsoft下载中心下载。 将其下载到本地计算机,该计算机将充当本地头节点。 下载后,右键单击安装包的 zip 文件,然后单击 属性 查看文件属性。 如果存在指示文件可能被阻止的安全警告,请单击 取消阻止。 然后,将安装包文件解压缩到本地文件夹并运行 Setup.exe。

修复了以下问题

性能和可靠性改进

  • 修复 HPC 服务可能无法自动重启问题。
  • 修复了 HPC 诊断服务导致的 Web 门户(w3wp)中的端口耗尽问题。
  • 修复计划程序 TCP 连接泄漏。
  • 修复 6730 上的管理服务连接和端口泄漏。
  • 修复了反序列化网络流时因未经处理的异常而导致的计划程序崩溃。
  • 修复 ArgumentNullException 的 HpcBrokerWorker.exe 崩溃。

管理

  • 修复了在启用了动态内存功能的 Hyper-V 虚拟机上运行时,计算/中转站节点频繁脱机的问题。
  • 修复了仅 Kerberos 环境中的管理服务 WCF 连接错误。
  • 修复了 HPC 节点有时“版本”和“OS 版本”不正确的问题。
  • 通过增加服务限制中的最大并发数来修复 1000 多个节点的节点预配失败。
  • 修复了 HPC 群集管理器和 HPC 作业管理器中无法删除任务环境的问题。
  • 修复 HPC 群集管理器或 HPC 作业管理器因空引用问题而崩溃的问题。

SOA 运行时

  • 修复由已在服务主机上使用错误的地址触发的对象释放的错误消息。 调度
  • 修复了包含所需节点的排队作业除了预留节点之外,还会占用更多空闲节点的问题,该节点可能会阻止其他排队作业运行。
  • 修复 Azure 突发超时,节点以僵尸状态结束。

Linux 节点管理器

  • 修复了“正在使用的核心”不正确的错误。
  • 修复了在 CentOS 上设置CCP_SWITCH_USER时 HPC Pack 环境变量将丢失的 bug。
  • 修复了使用 cgroup 时内存限制为第一个 NUMA 节点的 bug。
  • 修复了节点管理器启动时僵尸任务清理会失败的 bug。
  • 修复了在未启用 cgroup 时任务取消后,任务中的进程实际上不会终止的 bug。
  • 修复了监视 GPU 指标时的节点管理器崩溃问题。
  • 将由 Linux nodemanager 创建的主目录所有者更改为用户,而不是将其保留根目录。
  • 修复用户主目录未设置为默认路径时的相互信任失败问题。

已知问题

重要

所有 HPC Pack 2016 和 2019 Update 2 及更早的群集(包括仅限 Windows 的群集)都必须参考 管理 HPC Pack 的 Linux 身份验证密钥,以设置 Linux 身份验证密钥以解决 CVE-2025-21198 的关键漏洞。