Spela upp ljud i samtal

2025-06-05

Med uppspelningsåtgärden som tillhandahålls via Azure Communication Services Call Automation SDK kan du spela upp ljudmeddelanden till deltagare i samtalet. Den här åtgärden kan nås via implementeringen på serversidan av ditt program. Du kan spela upp ljud för att anropa deltagarna via en av två metoder;

Ge Azure Communication Services åtkomst till förinspelade ljudfiler i WAV-format, som Azure Communication Services kan komma åt med stöd för autentisering.
Vanlig text som kan konverteras till talutdata genom integrering med Azure AI-tjänster.

Du kan använda den nyligen tillkännagivna integreringen mellan Azure Communication Services och Azure AI-tjänster för att spela upp anpassade svar med hjälp av Azure Text-To-Speech. Du kan använda mänskliga som fördefinierade neurala röster direkt eller skapa anpassade neurala röster som är unika för din produkt eller ditt varumärke. Mer information om röster, språk och språk som stöds finns i Språk och röststöd för Speech-tjänsten.

Kommentar

Azure Communication Services stöder för närvarande två filformat, MP3-filer med ID3V2TAG- och WAV-filer som är formaterade som 16-bitars Pulse Code Modulation (PCM) monokanalsljud som registrerats vid 16 KHz. Du kan skapa egna ljudfiler med hjälp av talsyntes med verktyget Skapa ljudinnehåll.

Fördefinierade neurala text till talröster

Microsoft använder avancerad maskininlärning för att övervinna begränsningarna i traditionell talsyntes vid hantering av stress och intonation i talat språk. Prosody-förutsägelse och röstsyntes sker samtidigt, vilket resulterar i en mer flytande och naturlig ljudutdata. Du kan använda dessa neurala röster för att göra interaktioner med dina chattrobotar och röstassistenter mer naturliga och engagerande. Det finns över 100 fördefinierade röster att välja mellan. Läs mer om Azure Text-to-Speech-röster.

Vanliga användningsfall

Spelåtgärden kan användas på många sätt, några exempel på hur utvecklare kanske vill använda uppspelningsåtgärden i sina program visas här.

Meddelanden

Ditt program kanske vill spela upp någon form av meddelande när en deltagare ansluter eller lämnar anropet för att meddela andra användare.

Självbetjäningskunder

I scenarier med IVR-system (Interactive Voice Response) och virtuella assistenter kan du använda ditt program eller dina robotar för att spela upp ljudfrågor till uppringare. Den här uppmaningen kan vara i form av en meny som vägleder uppringaren genom deras interaktion.

Håll musik

Spelåtgärden kan också användas för att spela hold-musik för uppringare. Den här åtgärden kan konfigureras i en loop så att musiken fortsätter att spelas upp tills en agent är tillgänglig för att hjälpa anroparen.

Spela upp efterlevnadsmeddelanden

Som en del av efterlevnadskraven i olika branscher förväntas leverantörerna spela upp juridiska meddelanden eller efterlevnadsmeddelanden till uppringare, till exempel "Det här samtalet registreras i kvalitetssyfte".

Exempelarkitektur för att spela upp ljud i anrop med text-till-tal

Diagram som visar exempelarkitektur för Spela upp med AI.

Exempelarkitektur för att spela upp ljud i ett anrop

Skärmbild av flöde för uppspelningsåtgärd.

Kända begränsningar

Text till tal-prompter stöder högst 4 000 tecken. Om din fråga är längre än den här gränsen föreslår vi att du använder Speech Synthesis Markup Language (SSML) för text-till-tal-baserade uppspelningsåtgärder.
HD-röster från Azure AI Foundry stöds inte officiellt. Om du använder dessa röster resulterar det i timeouter.
För scenarier där du överskrider kvotgränsen för Speech-tjänsten kan du begära att den här gränsen ökas genom att följa stegen som beskrivs här.

Nästa steg

Kolla in vår guide för att lära dig hur du spelar upp anpassade röstmeddelanden till användare.
Lär dig mer om användnings- och driftloggar som publicerats av samtalsautomation.
Lär dig mer om att samla in kundindata.

Feedback

Var den här sidan till hjälp?