部署多模式模型

已完成

若要处理包含音频的提示,需要部署 多模式 生成 AI 模型-换句话说,该模型不仅支持基于文本的输入,而且还支持基于音频的输入。 Azure AI Foundry 中提供的多模式模型包括(等等):

  • Microsoft Phi-4-multimodal-instruct
  • OpenAI GPT-4o
  • OpenAI gpt-4o-迷你

小窍门

若要详细了解 Azure AI Foundry 中的可用模型,请参阅 Azure AI Foundry 文档中的 Azure AI Foundry 门户文章中的模型目录和集合

使用基于音频的提示测试多模式模型

部署多模式模型后,可以在 Azure AI Foundry 门户的聊天场中对其进行测试。 某些模型允许您在测试环境中通过上传文件或录制消息来包含音频附件。

聊天场的屏幕截图,其中包含基于音频的提示。

在聊天场中,可以上传本地音频文件并将文本添加到消息,以从多模式模型获取响应。