Delen via


Azure AI Speech-hulpprogramma's voor de Azure MCP-server

Gebruik de Azure MCP-server om Functies van Azure AI Speech te beheren, zoals spraak-naar-tekst (SST) met prompts in natuurlijke taal. U hoeft geen specifieke opdrachtsyntaxis te onthouden.

Opmerking

Hulpprogrammaparameters: de Hulpprogramma's van Azure MCP Server definiëren parameters voor gegevens die ze nodig hebben om taken uit te voeren. Sommige van deze parameters zijn specifiek voor elk hulpprogramma en worden hieronder beschreven. Andere parameters zijn globaal en worden gedeeld door alle hulpprogramma's. Zie Hulpprogrammaparameters voor meer informatie.

Spraak-naar-tekst: Herkennen

Spraak herkennen vanuit een audiobestand met behulp van Azure AI Services Speech. Met deze opdracht wordt een audiobestand gebruikt en geconverteerd naar tekst met behulp van geavanceerde spraakherkenningsmogelijkheden. Ondersteunde audio-indelingen zijn WAV, MP3, OPUS/MSP, FLAC, ALAW, MULAW, MP4, M4A en AAC. Voor gecomprimeerde indelingen moet GStreamer op het systeem worden geïnstalleerd.

Voorbeelden van prompts zijn:

  • Basisconversie: "Converteer dit audiobestand naar tekst met behulp van Azure Speech Services"
  • Met taaldetectie: 'Spraak herkennen uit mijn audiobestand met taaldetectie'
  • Met het filteren van grof taalgebruik: 'Spraak uit audiobestand transcriberen met grof taalfilters'
  • Eindpunt opgeven: 'Spraak naar tekst converteren vanuit audiobestand met behulp van mijn cognitive services-eindpunt'
  • Spaanse taal: "Het audiobestand transcriberen in de Spaanse taal"
  • Gedetailleerde uitvoer: 'Spraak naar tekst converteren met een gedetailleerde uitvoerindeling van audiobestand'
  • Met zinshints: 'Spraak herkennen met woordgroepenhints voor betere nauwkeurigheid'
  • Hints voor meerdere woordgroepen: 'Audio transcriberen met behulp van hints voor meerdere woordgroepen: 'Azure', 'cognitive services', 'machine learning''
  • Door komma's gescheiden hints: 'Spraak naar tekst converteren met door komma's gescheiden woordgroepen: 'Azure, cognitive services, API''
  • Onbewerkte uitvoer van grof taalgebruik: "Audio transcriberen met onbewerkte grof taalgebruik van bestand"
Kenmerk Verplicht of optioneel Description
Eindpunt Verplicht De EINDPUNT-URL van Azure AI Services (bijvoorbeeld https://your-service.cognitiveservices.azure.com/).
bestand Verplicht Pad naar het lokale audiobestand dat moet worden herkend.
Taal Optioneel De taal voor spraakherkenning (bijvoorbeeld en-US, es-ES). De standaardinstelling is en-US.
Zinnen Optioneel Zinshints om de nauwkeurigheid van de herkenning te verbeteren. Kan meerdere keren of als door komma's gescheiden waarden worden opgegeven.
Formatteren Optioneel Uitvoerindeling: simple of detailed. De standaardinstelling is simple.
Godslastering Optioneel Scheldfilter: masked, removedof raw. De standaardinstelling is masked.