适用于 Azure MCP 服务器的 Azure AI 语音工具

使用 Azure MCP 服务器通过自然语言提示管理 Azure AI 语音功能，例如语音转文本（SST）。无需记住特定的命令语法。

注释

Azure MCP 服务器工具为完成任务所需的数据定义参数。其中一些参数特定于每个工具，如下所示。其他参数是全局参数，由所有工具共享。有关详细信息，请参阅工具参数。

语音转文本：识别

使用 Azure AI 服务语音从音频文件中识别语音。此命令使用音频文件，并使用高级语音识别功能将其转换为文本。支持的音频格式包括 WAV、MP3、OPUS/OGG、FLAC、ALAW、MULAW、MP4、M4A 和 AAC。压缩格式要求在系统上安装 GStreamer。

示例提示包括：

参数	必需还是可选	Description
终结点	必选	Azure AI 服务终结点 URL（例如 `https://your-service.cognitiveservices.azure.com/`）。
文件	必选	要识别的本地音频文件的路径。
语言	可选	语音识别的语言（例如 `en-US`， `es-ES`）。默认值为 `en-US`。
短语	可选	用于提高识别准确性的短语提示。可以多次指定，也可以指定为逗号分隔值。
格式	可选	输出格式： `simple` 或 `detailed`。默认值为 `simple`。
亵渎	可选	不雅内容筛选器： `masked`、 `removed`或 `raw`。默认值为 `masked`。

此页面是否有帮助？