你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Foundry Local 的最佳做法和故障排除指南

重要

  • Foundry Local 以预览版提供。 公共预览版提供对活动部署中的功能的早期访问。
  • 正式发布 (GA) 之前,功能、方法和流程可能会发生更改或具有受限的功能。

本文列出了 Foundry Local 的最佳做法和故障排除提示。

安全最佳做法

  • 仅在符合组织安全策略的环境中运行 Foundry Local。
  • 处理敏感数据时,请确保设备满足组织的安全要求。
  • 加密缓存包含敏感微调数据的模型的设备上的磁盘。

许可注意事项

查看在 Foundry Local 中运行的模型的许可影响。 运行以下命令,查看目录中每个模型的完整模型许可条款。 在以下命令中,将占位符 <model> 替换为模型名称:

foundry model info <model> --license

生产部署范围

Foundry Local 适用于设备推理、非分布式、容器化或多计算机生产部署。

故障排除

常见问题和解决方案

問题 可能的原因 解决方案
慢推理 仅具有大型参数计数的 CPU 模型。 当 GPU 优化模型变体可用时,请使用它。
模型下载失败 网络连接问题。 检查 Internet 连接并运行 foundry cache list 以验证缓存状态。
服务连接错误 (Request to local service failed. Uri:http://127.0.0.1:0/foundry/list 端口绑定问题或服务无法访问。 运行 foundry service restart 以重启服务并解决端口绑定问题。
服务无法启动。 端口冲突或权限问题。 使用 报告 日志 问题。
Intel NPU 未检测到或不起作用 缺少或过时的 Intel NPU 驱动程序。 安装 适用于 Windows 的 Intel NPU 驱动程序 以启用 NPU 加速。
高通 NPU 错误 (Qnn error code 5005: "Failed to load from EpContext model. qnn_backend_manager." 过时的 Qualcomm NPU 驱动程序或 NPU 资源冲突。 安装 Qualcomm NPU 驱动程序。 如果问题仍然存在,请重新启动以清除 NPU 资源冲突,尤其是在使用 Windows Copilot+ 功能之后。
winget install Microsoft.FoundryLocal --scope machine 失败并显示“当前系统配置不支持安装此包”。 Winget 阻止 MSIX 计算机范围安装,因为使用打包上下文中的预配 API 时出现 OS bug。 请改用 Add-AppxProvisionedPackage.msix下载及其依赖项,然后在提升的 PowerShell 中运行: Add-AppxProvisionedPackage -Online -PackagePath .\FoundryLocal.msix -DependencyPackagePath .\VcLibs.appx -SkipLicense 此命令为所有用户安装 Foundry Local。

改善性能

如果推理速度缓慢,请考虑以下策略:

  • 同时从 AI Toolkit for VS Code 运行 ONNX 模型会导致资源争用。 运行 Foundry Local 之前,请停止 AI 工具包推理会话。
  • 当 GPU 加速可用时,请使用 GPU 加速。
  • 通过在推理期间监视内存使用情况来识别瓶颈。
  • 尝试更多量化模型变体(如 INT8 而不是 FP16)。
  • 调整非交互工作负荷的批大小。