Namnområde Microsoft::CognitiveServices::Speech

2025-03-20

Sammanfattning

Medlemmar	Beskrivningar
uppräkning PropertyId	Definierar talegenskaps-ID:t. Har ändrats i version 1.4.0.
uppräkning	Utdataformat.
uppräkning ProfanityOption	Tar bort svordomar (svordomar) eller ersätter bokstäver med profana ord med stjärnor. Har lagts till i version 1.5.0.
uppräkning ResultReason	Anger möjliga orsaker till att ett igenkänningsresultat kan genereras.
uppräkning AnnulleringReason	Definierar möjliga orsaker till att ett igenkänningsresultat kan avbrytas.
uppräkning AnnulleringErrorCode	Definierar felkod om AnnulleringReason är Fel. Har lagts till i version 1.1.0.
uppräkningen NoMatchReason	Definierar möjliga orsaker till att ett igenkänningsresultat kanske inte identifieras.
uppräkning ActivityJSONType	Definierar möjliga typer för ett aktivitets-json-värde. Har lagts till i version 1.5.0.
uppräkning SpeechSynthesisOutputFormat	Definierar möjliga ljudformat för talsyntesutdata. Uppdaterad i version 1.19.0.
uppräkning streamstatus	Definierar den möjliga statusen för ljuddataströmmen. Har lagts till i version 1.4.0.
uppräkning ServicePropertyChannel	Definierar kanaler som används för att skicka egenskapsinställningar till tjänsten. Har lagts till i version 1.5.0.
uppräkning av VoiceProfileType	Definierar röstprofiltyper.
uppräkning RecognitionFactorScope	Definierar omfånget som en igenkänningsfaktor tillämpas på.
uppräkningspronunciationAssessmentGradingSystem	Definierar punktsystemet för uttalspoängkalibrering; standardvärdet är FivePoint. Har lagts till i version 1.14.0.
enum PronunciationAssessmentGranularity	Definierar uttalsutvärderingens kornighet; standardvärdet är Phoneme. Har lagts till i version 1.14.0.
enum SynthesisVoiceType	Definierar typen av syntesröster som lagts till i version 1.16.0.
enum SynthesisVoiceGender	Definierar könet för syntesröster som lagts till i version 1.17.0.
enum SynthesisVoiceStatus	Definierar status för syntesröster.
uppräkning SpeechSynthesisBoundaryType	Definierar gränstypen för talsyntesgränshändelsen Som lagts till i version 1.21.0.
uppräkning SegmentationStrategy	Den strategi som används för att avgöra när en talad fras har avslutats och ett slutligt identifierat resultat ska genereras. Tillåtna värden är "Default", "Time" och "Semantic".
klass AsyncRecognizer	AsyncRecognizer abstrakt basklass.
klassen AudioDataStream	Representerar ljuddataström som används för att använda ljuddata som en ström. Har lagts till i version 1.4.0.
klassen AutoDetectSourceLanguageConfig	Klass som definierar källkonfiguration för automatisk identifiering Uppdaterad i 1.13.0.
klassen AutoDetectSourceLanguageResult	Innehåller automatiskt identifierat källspråkresultat som lagts till i 1.8.0.
klassen BaseAsyncRecognizer	BaseAsyncRecognizer-klass.
klassen CancellationDetails	Innehåller detaljerad information om varför ett resultat avbröts.
klass ClassLanguageModel	Representerar en lista över grammatiker för dynamiska grammatikscenarier. Har lagts till i version 1.7.0.
klassen Anslutning	Anslutningen är en proxyklass för att hantera anslutningen till taltjänsten för den angivna identifieraren. Som standard hanterar en identifierare autonomt anslutning till tjänsten vid behov. Klassen Anslutning innehåller ytterligare metoder för användare att uttryckligen öppna eller stänga en anslutning och prenumerera på ändringar av anslutningsstatus. Det är valfritt att använda Anslutning. Den är avsedd för scenarier där finjustering av programmets beteende baserat på anslutningsstatus behövs. Användare kan också anropa Open() för att initiera en tjänstanslutning manuellt innan de påbörjar igenkänningen på den identifierare som är associerad med den här anslutningen. När du har startat en igenkänning kan det hända att det inte går att anropa Open() eller Close(). Detta påverkar inte identifieraren eller den pågående igenkänningen. Anslutningen kan ta bort av olika skäl. Identifieraren försöker alltid att återupprätta anslutningen efter behov för att garantera pågående åtgärder. I alla dessa fall anger anslutna/frånkopplade händelser ändringen av anslutningsstatusen. Uppdaterad i version 1.17.0.
klassen ConnectionEventArgs	Innehåller data för ConnectionEvent. Har lagts till i version 1.2.0.
klassen ConnectionMessage	ConnectionMessage representerar implementeringsspecifika meddelanden som skickas till och tas emot från taltjänsten. Dessa meddelanden tillhandahålls i felsökningssyfte och bör inte användas för produktionsanvändningsfall med Azure Cognitive Services Speech Service. Meddelanden som skickas till och tas emot från Taltjänsten kan komma att ändras utan föregående meddelande. Detta inkluderar meddelandeinnehåll, rubriker, nyttolaster, beställning osv. Har lagts till i version 1.10.0.
klassen ConnectionMessageEventArgs	Innehåller data för ConnectionMessageEvent.
klassen EmbeddedSpeechConfig	Klass som definierar inbäddad talkonfiguration (offline).
klassen EventArgs	Basklass för händelseargument.
klassen EventSignal	Klienter kan ansluta till händelsesignalen för att ta emot händelser eller koppla från händelsesignalen för att sluta ta emot händelser.
klassen EventSignalBase	Klienter kan ansluta till händelsesignalen för att ta emot händelser eller koppla från händelsesignalen för att sluta ta emot händelser.
klassen Grammatik	Representerar basklass grammatik för anpassning av taligenkänning. Har lagts till i version 1.5.0.
klassen GrammarList	Representerar en lista över grammatiker för dynamiska grammatikscenarier. Har lagts till i version 1.7.0.
klassen GrammarPhrase	Representerar en fras som kan talas av användaren. Har lagts till i version 1.5.0.
klassen HybridSpeechConfig	Klass som definierar hybridkonfigurationer (moln och inbäddade) för taligenkänning eller talsyntes.
klassen KeywordRecognitionEventArgs	Klass för de händelser som KeywordRecognizer.
klassen KeywordRecognitionModel	Representerar nyckelordsigenkänningsmodellen som används med StartKeywordRecognitionAsync-metoder.
klassen KeywordRecognitionResult	Klass som definierar de resultat som genereras av KeywordRecognizer.
klassen KeywordRecognizer	Typ av identifierare som är specialiserad på att endast hantera nyckelordsaktivering.
klassen NoMatchDetails	Innehåller detaljerad information för NoMatch-igenkänningsresultat.
klassen PersonalVoiceSynthesisRequest	Klass som definierar talsyntesbegäran för personlig röst (aka.ms/azureai/personal-voice). Den här klassen är i förhandsversion och kan komma att ändras. Har lagts till i version 1.39.0.
klassen PhraseListGrammar	Representerar en fraslista grammatik för dynamiska grammatikscenarier. Har lagts till i version 1.5.0.
klassen PronunciationAssessmentConfig	Klass som definierar uttalsutvärderingskonfiguration som lagts till i 1.14.0.
klassen PronunciationAssessmentResult	Klass för uttalsutvärderingsresultat.
klassen PropertyCollection	Klass för att hämta eller ange ett egenskapsvärde från en egenskapssamling.
klassen RecognitionEventArgs	Innehåller data för RecognitionEvent.
klassen RecognitionResult	Innehåller detaljerad information om resultatet av en igenkänningsåtgärd.
klassen Recognizer	Känna igen basklass.
klassen SessionEventArgs	Basklass för sessionshändelseargument.
klassen SmartHandle	Smart handtagsklass.
klassen SourceLanguageConfig	Klass som definierar konfiguration av källspråk, tillagd i 1.8.0.
klassen SourceLanguageRecognizer	Klass för källspråksidentkännare. Du kan använda den här klassen för fristående språkidentifiering. Har lagts till i version 1.17.0.
klassen SpeechConfig	Klass som definierar konfigurationer för tal-/avsiktsigenkänning eller talsyntes.
klassen SpeechRecognitionCanceledEventArgs	Klassen för taligenkänning avbröt händelseargument.
klassen SpeechRecognitionEventArgs	Klass för argument för taligenkänningshändelser.
klassen SpeechRecognitionModel	Information om taligenkänningsmodell.
klassen SpeechRecognitionResult	Basklass för taligenkänningsresultat.
klassen SpeechRecognizer	Klass för taligenkänning.
klassen SpeechSynthesisBookmarkEventArgs	Klass för talsyntesbokmärkeshändelseargument. Har lagts till i version 1.16.0.
klassen SpeechSynthesisCancellationDetails	Innehåller detaljerad information om varför ett resultat avbröts. Har lagts till i version 1.4.0.
klassen SpeechSynthesisEventArgs	Klass för talsynteshändelseargument. Har lagts till i version 1.4.0.
klassen SpeechSynthesisRequest	Klass som definierar talsyntesbegäran. Den här klassen är i förhandsversion och kan komma att ändras. Har lagts till i version 1.37.0.
klassen SpeechSynthesisResult	Innehåller information om resultatet från text-till-tal-syntes. Har lagts till i version 1.4.0.
klassen SpeechSynthesisVisemeEventArgs	Klass för talsyntes viseme-händelseargument. Har lagts till i version 1.16.0.
klassen SpeechSynthesisWordBoundaryEventArgs	Klass för talsyntesens ordgränshändelseargument. Har lagts till i version 1.7.0.
klassen SpeechSynthesizer	Klass för talsyntes. Uppdaterad i version 1.14.0.
klassen SpeechTranslationModel	Information om talöversättningsmodell.
klassen SynthesisVoicesResult	Innehåller information om resultatet från röstlistan över talsynteser. Har lagts till i version 1.16.0.
klassen VoiceInfo	Innehåller information om syntesröstinformation uppdaterad i version 1.17.0.

Medlemmar

enum PropertyId

Värden	Beskrivningar
SpeechServiceConnection_Key	Prenumerationsnyckeln för Cognitive Services Speech Service. Om du använder en avsiktsigenkänning måste du ange LUIS-slutpunktsnyckeln för din specifika LUIS-app. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::FromSubscription.
SpeechServiceConnection_Endpoint	Cognitive Services Speech Service-slutpunkten (url). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::FromEndpoint. Obs! Den här slutpunkten är inte samma som slutpunkten som används för att hämta en åtkomsttoken.
SpeechServiceConnection_Region	Cognitive Services Speech Service-regionen. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::FromSubscription, SpeechConfig::FromEndpoint, SpeechConfig::FromHost, SpeechConfig::FromAuthorizationToken.
SpeechServiceAuthorization_Token	Cognitive Services Speech Service-auktoriseringstoken (även kallad åtkomsttoken). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::FromAuthorizationToken, SpeechRecognizer::SetAuthorizationToken, IntentRecognizer::SetAuthorizationToken, TranslationRecognizer::SetAuthorizationToken.
SpeechServiceAuthorization_Type	Auktoriseringstypen För Cognitive Services Speech Service. Används för närvarande inte.
SpeechServiceConnection_EndpointId	Slutpunkts-ID:t för Cognitive Services Custom Speech eller Custom Voice Service. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::SetEndpointId. Obs! Slutpunkts-ID:t är tillgängligt i den anpassade talportalen, som visas under Slutpunktsinformation.
SpeechServiceConnection_Host	Cognitive Services Speech Service-värden (url). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::FromHost.
SpeechServiceConnection_ProxyHostName	Värdnamnet för proxyservern som används för att ansluta till Cognitive Services Speech Service. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::SetProxy. Obs! Det här egenskaps-ID:t lades till i version 1.1.0.
SpeechServiceConnection_ProxyPort	Porten för proxyservern som används för att ansluta till Cognitive Services Speech Service. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::SetProxy. Obs! Det här egenskaps-ID:t lades till i version 1.1.0.
SpeechServiceConnection_ProxyUserName	Användarnamnet för proxyservern som används för att ansluta till Cognitive Services Speech Service. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::SetProxy. Obs! Det här egenskaps-ID:t lades till i version 1.1.0.
SpeechServiceConnection_ProxyPassword	Lösenordet för proxyservern som används för att ansluta till Cognitive Services Speech Service. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::SetProxy. Obs! Det här egenskaps-ID:t lades till i version 1.1.0.
SpeechServiceConnection_Url	URL-strängen som skapats från talkonfigurationen. Den här egenskapen är avsedd att vara skrivskyddad. SDK:et använder det internt. OBS! Har lagts till i version 1.5.0.
SpeechServiceConnection_ProxyHostBypass	Anger listan över värdar för vilka proxyservrar inte ska användas. Den här inställningen åsidosätter alla andra konfigurationer. Värdnamn avgränsas med kommatecken och matchas på ett skiftlägesokänsligt sätt. Jokertecken stöds inte.
SpeechServiceConnection_TranslationToLanguages	Listan över kommaavgränsade språk som används som målöversättningsspråk. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechTranslationConfig::AddTargetLanguage och SpeechTranslationConfig::GetTargetLanguages.
SpeechServiceConnection_TranslationVoice	Namnet på cognitive service-texten till taltjänstens röst. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechTranslationConfig::SetVoiceName. Obs! Giltiga röstnamn finns här.
SpeechServiceConnection_TranslationFeatures	Översättningsfunktioner. För internt bruk.
SpeechServiceConnection_IntentRegion	Language Understanding Service-regionen. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället LanguageUnderstandingModel.
SpeechServiceConnection_RecoMode	Igenkänningsläget för Cognitive Services Speech Service. Kan vara "INTERACTIVE", "CONVERSATION", "DICTATION". Den här egenskapen är avsedd att vara skrivskyddad. SDK:et använder det internt.
SpeechServiceConnection_RecoLanguage	Det talade språket som ska kännas igen (i BCP-47-format). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::SetSpeechRecognitionLanguage.
Speech_SessionId	Sessions-ID: t. Det här ID:t är en universellt unik identifierare (även kallad UUID) som representerar en specifik bindning av en ljudindataström och den underliggande taligenkänningsinstansen som den är bunden till. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SessionEventArgs::SessionId.
SpeechServiceConnection_UserDefinedQueryParameters	Frågeparametrarna som tillhandahålls av användare. De skickas till tjänsten som URL-frågeparametrar. Har lagts till i version 1.5.0.
SpeechServiceConnection_RecoBackend	Strängen för att ange den serverdel som ska användas för taligenkänning. tillåtna alternativ är online och offline. Under normala omständigheter bör du inte använda den här egenskapen direkt. För närvarande är offlinealternativet endast giltigt när EmbeddedSpeechConfig används. Har lagts till i version 1.19.0.
SpeechServiceConnection_RecoModelName	Namnet på den modell som ska användas för taligenkänning. Under normala omständigheter bör du inte använda den här egenskapen direkt. För närvarande är detta endast giltigt när EmbeddedSpeechConfig används. Har lagts till i version 1.19.0.
SpeechServiceConnection_RecoModelKey	Den här egenskapen är inaktuell.
SpeechServiceConnection_RecoModelIniFile	Sökvägen till ini-filen för modellen som ska användas för taligenkänning. Under normala omständigheter bör du inte använda den här egenskapen direkt. För närvarande är detta endast giltigt när EmbeddedSpeechConfig används. Har lagts till i version 1.19.0.
SpeechServiceConnection_SynthLanguage	Det talade språket som ska syntetiseras (t.ex. en-US) har lagts till i version 1.4.0.
SpeechServiceConnection_SynthVoice	Namnet på TTS-rösten som ska användas för talsyntes som lagts till i version 1.4.0.
SpeechServiceConnection_SynthOutputFormat	Strängen för att ange TTS-utdataljudformatet Har lagts till i version 1.4.0.
SpeechServiceConnection_SynthEnableCompressedAudioTransmission	Anger om du använder komprimerat ljudformat för talsyntesljudöverföring. Den här egenskapen påverkar bara när SpeechServiceConnection_SynthOutputFormat är inställt på ett pcm-format. Om den här egenskapen inte har angetts och GStreamer är tillgänglig använder SDK komprimerat format för syntetiserad ljudöverföring och avkodar den. Du kan ställa in den här egenskapen på "false" för att använda raw pcm-format för överföring på kabel. Har lagts till i version 1.16.0.
SpeechServiceConnection_SynthBackend	Strängen för att ange TTS-serverdelen. giltiga alternativ är online och offline. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället EmbeddedSpeechConfig::FromPath eller EmbeddedSpeechConfig::FromPaths för att ställa in syntesens serverdel till offline. Har lagts till i version 1.19.0.
SpeechServiceConnection_SynthOfflineDataPath	Datafilens sökvägar för offlinesyntesmotorn. endast giltigt när syntesserverdelen är offline. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället EmbeddedSpeechConfig::FromPath eller EmbeddedSpeechConfig::FromPaths. Har lagts till i version 1.19.0.
SpeechServiceConnection_SynthOfflineVoice	Namnet på den offline-TTS-röst som ska användas för talsyntes Under normala omständigheter bör du inte använda den här egenskapen direkt. Använd i stället EmbeddedSpeechConfig::SetSpeechSynthesisVoice och EmbeddedSpeechConfig::GetSpeechSynthesisVoiceName. Har lagts till i version 1.19.0.
SpeechServiceConnection_SynthModelKey	Den här egenskapen är inaktuell.
SpeechServiceConnection_VoicesListEndpoint	Röstlistan api-slutpunkt (URL) för Cognitive Services Speech Service-röster. Under normala omständigheter behöver du inte ange den här egenskapen. SDK skapar den baserat på region/värd/slutpunkt för SpeechConfig. Har lagts till i version 1.16.0.
SpeechServiceConnection_InitialSilenceTimeoutMs	Det initiala tidsgränsvärdet för tystnad (i millisekunder) som används av tjänsten. Har lagts till i version 1.5.0.
SpeechServiceConnection_EndSilenceTimeoutMs	Den här egenskapen är inaktuell. Aktuell information om timeout för tystnad finns på https://aka.ms/csspeech/timeouts.
SpeechServiceConnection_EnableAudioLogging	Ett booleskt värde som anger om ljudloggning är aktiverat i tjänsten eller inte. Ljud- och innehållsloggar lagras antingen i Microsoft-ägd lagring eller i ditt eget lagringskonto som är länkat till din Cognitive Services-prenumeration (BYOS)-aktiverad Speech-resurs (Bring Your Own Storage). Har lagts till i version 1.5.0.
SpeechServiceConnection_LanguageIdMode	ID-läget för taltjänstens anslutningsspråk. Kan vara "AtStart" (standard) eller "Kontinuerlig". Se dokumentet Language Identification. Lades till i 1.25.0.
SpeechServiceConnection_TranslationCategoryId	Översättningskategori-ID för taltjänstens anslutning.
SpeechServiceConnection_AutoDetectSourceLanguages	Automatiskt identifiera källspråk som lagts till i version 1.8.0.
SpeechServiceConnection_AutoDetectSourceLanguageResult	Resultatet för automatisk identifiering av källspråket har lagts till i version 1.8.0.
SpeechServiceResponse_RequestDetailedResultTrueFalse	Det begärda utdataformatet för Cognitive Services Speech Service-svar (enkelt eller detaljerat). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::SetOutputFormat.
SpeechServiceResponse_RequestProfanityFilterTrueFalse	Den begärda svarsnivån för Cognitive Services Speech Service utdata för svordomar. Används för närvarande inte.
SpeechServiceResponse_ProfanityOption	Den begärda inställningen för Cognitive Services Speech Service-svar ger ut svordomar. Tillåtna värden är "maskerade", "borttagna" och "råa". Har lagts till i version 1.5.0.
SpeechServiceResponse_PostProcessingOption	Ett strängvärde som anger vilket alternativ efter bearbetning som ska användas av tjänsten. Tillåtna värden är "TrueText". Har lagts till i version 1.5.0.
SpeechServiceResponse_RequestWordLevelTimestamps	Ett booleskt värde som anger om tidsstämplar på ordnivå ska inkluderas i svarsresultatet. Har lagts till i version 1.5.0.
SpeechServiceResponse_StablePartialResultThreshold	Antalet gånger ett ord måste vara i partiella resultat för att returneras. Har lagts till i version 1.5.0.
SpeechServiceResponse_OutputFormatOption	Ett strängvärde som anger alternativet utdataformat i svarsresultatet. Endast intern användning. Har lagts till i version 1.5.0.
SpeechServiceResponse_RequestSnr	Ett booleskt värde som anger om SNR (signal till brus-förhållande) ska inkluderas i svarsresultatet. Har lagts till i version 1.18.0.
SpeechServiceResponse_TranslationRequestStablePartialResult	Ett booleskt värde att begära för att stabilisera partiella översättningsresultat genom att utelämna ord i slutet. Har lagts till i version 1.5.0.
SpeechServiceResponse_RequestWordBoundary	Ett booleskt värde som anger om WordBoundary-händelser ska begäras. Har lagts till i version 1.21.0.
SpeechServiceResponse_RequestPunctuationBoundary	Ett booleskt värde som anger om skiljetecken ska begäras i WordBoundary Events. Standardvärdet är sant. Har lagts till i version 1.21.0.
SpeechServiceResponse_RequestSentenceBoundary	Ett booleskt värde som anger om meningsgränsen ska begäras i WordBoundary Events. Standardvärdet är falskt. Har lagts till i version 1.21.0.
SpeechServiceResponse_SynthesisEventsSyncToAudio	Ett booleskt värde som anger om SDK ska synkronisera händelser med syntesmetadata (t.ex. ordgräns, viseme osv.) till ljuduppspelningen. Detta börjar gälla först när ljudet spelas upp via SDK:et. Standardvärdet är sant. Om värdet är falskt utlöser SDK:t händelserna när de kommer från tjänsten, vilket kan vara osynkroniserat med ljuduppspelningen. Har lagts till i version 1.31.0.
SpeechServiceResponse_JsonResult	Cognitive Services Speech Service-svarsutdata (i JSON-format). Den här egenskapen är endast tillgänglig för igenkänningsresultatobjekt.
SpeechServiceResponse_JsonErrorDetails	Information om Cognitive Services Speech Service-fel (i JSON-format). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället CancellationDetails::ErrorDetails.
SpeechServiceResponse_RecognitionLatencyMs	Svarstiden för igenkänning i millisekunder. Skrivskyddad, tillgänglig för slutresultat för tal/översättning/avsikt. Detta mäter svarstiden mellan när en ljudinmatning tas emot av SDK:et och det ögonblick då slutresultatet tas emot från tjänsten. SDK beräknar tidsskillnaden mellan det sista ljudfragmentet från ljudindata som bidrar till slutresultatet och den tid då slutresultatet tas emot från taltjänsten. Har lagts till i version 1.3.0.
SpeechServiceResponse_RecognitionBackend	Serverdelen för igenkänning. Skrivskyddad, tillgänglig för taligenkänningsresultat. Detta anger om molnigenkänning (online) eller inbäddad (offline) användes för att producera resultatet.
SpeechServiceResponse_SynthesisFirstByteLatencyMs	Talsyntesens första bytesvarstid i millisekunder. Skrivskyddad, tillgänglig för slutresultat för talsyntes. Detta mäter svarstiden mellan när syntesen startas för bearbetning och det ögonblick då det första byteljudet är tillgängligt. Har lagts till i version 1.17.0.
SpeechServiceResponse_SynthesisFinishLatencyMs	Talsyntesen alla bytes svarstid i millisekunder. Skrivskyddad, tillgänglig för slutresultat för talsyntes. Detta mäter svarstiden mellan när syntesen startas för att bearbetas och det ögonblick då hela ljudet syntetiseras. Har lagts till i version 1.17.0.
SpeechServiceResponse_SynthesisUnderrunTimeMs	Underkörningstiden för talsyntes i millisekunder. Skrivskyddad, tillgänglig för resultat i SynthesisCompleted-händelser. Detta mäter den totala underkörningstiden från PropertyId::AudioConfig_PlaybackBufferLengthInMs fylls i för att syntesen ska slutföras. Har lagts till i version 1.17.0.
SpeechServiceResponse_SynthesisConnectionLatencyMs	Svarstid för talsyntesanslutning i millisekunder. Skrivskyddad, tillgänglig för slutresultat för talsyntes. Detta mäter svarstiden mellan när syntesen startas för att bearbetas och när HTTP/WebSocket-anslutningen upprättas. Har lagts till i version 1.26.0.
SpeechServiceResponse_SynthesisNetworkLatencyMs	Svarstiden för talsyntesnätverket i millisekunder. Skrivskyddad, tillgänglig för slutresultat för talsyntes. Detta mäter nätverkets tur och retur-tid. Har lagts till i version 1.26.0.
SpeechServiceResponse_SynthesisServiceLatencyMs	Svarstiden för talsyntestjänsten i millisekunder. Skrivskyddad, tillgänglig för slutresultat för talsyntes. Detta mäter bearbetningstiden för tjänsten för att syntetisera det första bytet av ljud. Har lagts till i version 1.26.0.
SpeechServiceResponse_SynthesisBackend	Anger vilken serverdel som syntesen är klar med. Skrivskyddad, tillgänglig för talsyntesresultat, förutom resultatet i SynthesisStarted-händelsen Som lagts till i version 1.17.0.
SpeechServiceResponse_DiarizeIntermediateResults	Avgör om mellanliggande resultat innehåller talaridentifiering.
CancellationDetails_Reason	Avbokningsorsaken. Används för närvarande inte.
CancellationDetails_ReasonText	Annulleringstexten. Används för närvarande inte.
CancellationDetails_ReasonDetailedText	Detaljerad text om annullering. Används för närvarande inte.
LanguageUnderstandingServiceResponse_JsonResult	Language Understanding Service-svarsutdata (i JSON-format). Tillgänglig via IntentRecognitionResult.Properties.
AudioConfig_DeviceNameForCapture	Enhetsnamnet för ljudinspelning. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället AudioConfig::FromMicrophoneInput. Obs! Det här egenskaps-ID:t lades till i version 1.3.0.
AudioConfig_NumberOfChannelsForCapture	Antalet kanaler för ljudinspelning. Endast intern användning. Obs! Det här egenskaps-ID:t lades till i version 1.3.0.
AudioConfig_SampleRateForCapture	Exempelfrekvensen (i Hz) för ljudinspelning. Endast intern användning. Obs! Det här egenskaps-ID:t lades till i version 1.3.0.
AudioConfig_BitsPerSampleForCapture	Antalet bitar av varje exempel för ljudinspelning. Endast intern användning. Obs! Det här egenskaps-ID:t lades till i version 1.3.0.
AudioConfig_AudioSource	Ljudkällan. Tillåtna värden är "Mikrofoner", "Fil" och "Stream". Har lagts till i version 1.3.0.
AudioConfig_DeviceNameForRender	Enhetsnamnet för ljudåtergivning. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället AudioConfig::FromSpeakerOutput. Har lagts till i version 1.14.0.
AudioConfig_PlaybackBufferLengthInMs	Uppspelningsbuffertlängd i millisekunder, standardvärdet är 50 millisekunder.
AudioConfig_AudioProcessingOptions	Alternativ för ljudbearbetning i JSON-format.
Speech_LogFilename	Filnamnet för att skriva loggar. Har lagts till i version 1.4.0.
Speech_SegmentationSilenceTimeoutMs	En varaktighet för upptäckt tystnad, mätt i millisekunder, varefter tal till text avgör att en talad fras har avslutats och genererar ett slutligt identifierat resultat. Att konfigurera den här tidsgränsen kan vara användbart i situationer där talade indata är betydligt snabbare eller långsammare än vanligt och standardsegmenteringsbeteendet ger konsekvent resultat som är för långa eller för korta. Timeoutvärden för segmentering som är olämpligt höga eller låga kan påverka tal-till-text-noggrannhet negativt. Den här egenskapen bör konfigureras noggrant och det resulterande beteendet bör verifieras noggrant som avsett. Värdet måste ligga i intervallet [100, 5 000] millisekunder.
Speech_SegmentationMaximumTimeMs	Den maximala längden på en talad fras när du använder segmenteringsstrategin "Tid". Värdet för Speech_SegmentationSilenceTimeoutMs måste anges för att den här inställningen ska kunna användas. När längden på en talad fras närmar sig det här värdet börjar Speech_SegmentationSilenceTimeoutMs minskas tills tidsgränsen för frasens tystnad nås eller så når frasen maximal längd. Värdet måste ligga i intervallet [20000, 70000] millisekunder.
Speech_SegmentationStrategy	Den strategi som används för att avgöra när en talad fras har avslutats och ett slutligt identifierat resultat ska genereras. Tillåtna värden är "Default", "Time" och "Semantic".
Speech_StartEventSensitivity	Känsligheten för hur snart ett potentiellt tal börjar kan signaleras. Tillåtna värden är "låg" (standard), "medium" och "hög".
Conversation_ApplicationId	Identifierare som används för att ansluta till serverdelstjänsten. Har lagts till i version 1.5.0.
Conversation_DialogType	Typ av dialogruta som du vill ansluta till. Har lagts till i version 1.7.0.
Conversation_Initial_Silence_Timeout	Tidsgränsen för att lyssna har lagts till i version 1.5.0.
Conversation_From_Id	Från id som ska användas för taligenkänningsaktiviteter som lagts till i version 1.5.0.
Conversation_Conversation_Id	ConversationId för sessionen. Har lagts till i version 1.8.0.
Conversation_Custom_Voice_Deployment_Ids	Kommaavgränsad lista över anpassade röstdistributions-ID:er. Har lagts till i version 1.8.0.
Conversation_Speech_Activity_Template	Mall för talaktivitet, stämpelegenskaper i mallen för aktiviteten som genereras av tjänsten för tal. Har lagts till i version 1.10.0.
Conversation_ParticipantId	Din deltagaridentifierare i den aktuella konversationen. Har lagts till i version 1.13.0.
Conversation_Request_Bot_Status_Messages
Conversation_Connection_Id
DataBuffer_TimeStamp	Tidsstämpeln som är associerad med databufferten som skrivs av klienten när du använder Pull/Push-ljudindataströmmar. Tidsstämpeln är ett 64-bitarsvärde med en upplösning på 90 kHz. Det är samma som tidsstämpeln för presentationen i en MPEG-transportström. Se https://en.wikipedia.org/wiki/Presentation_timestamp har lagts till i version 1.5.0.
DataBuffer_UserId	Användar-ID:t som är associerat med databufferten som skrivs av klienten när du använder Pull/Push-ljudindataströmmar. Har lagts till i version 1.5.0.
PronunciationAssessment_ReferenceText	Referenstexten för ljudet för uttalsutvärdering. För detta och följande uttalsutvärderingsparametrar, se tabellen parametrar för uttalsutvärdering. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::Create or PronunciationAssessmentConfig::SetReferenceText. Har lagts till i version 1.14.0.
PronunciationAssessment_GradingSystem	Punktsystemet för uttalspoängkalibrering (FivePoint eller HundredMark). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::Create. Har lagts till i version 1.14.0.
PronunciationAssessment_Granularity	Uttalsutvärderingskornigheten (Phoneme, Word eller FullText). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::Create. Har lagts till i version 1.14.0.
PronunciationAssessment_EnableMiscue	Definierar om du aktiverar felberäkning. När detta är aktiverat jämförs de uttalade orden med referenstexten och markeras med utelämnande/infogning baserat på jämförelsen. Standardinställningen är False. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::Create. Har lagts till i version 1.14.0.
PronunciationAssessment_PhonemeAlphabet	Uttalsutvärderingens fonetikalfabet. Giltiga värden är "SAPI" (standard) och "IPA" Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::SetPhonemeAlphabet. Har lagts till i version 1.20.0.
PronunciationAssessment_NBestPhonemeCount	Uttalsutvärderingen nbest phoneme count. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::SetNBestPhonemeCount. Har lagts till i version 1.20.0.
PronunciationAssessment_EnableProsodyAssessment	Om du vill aktivera prosody-utvärdering. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::EnableProsodyAssessment. Har lagts till i version 1.33.0.
PronunciationAssessment_Json	Json-strängen med uttalsbedömningsparametrar Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::Create. Har lagts till i version 1.14.0.
PronunciationAssessment_Params	Uttalsutvärderingsparametrar. Den här egenskapen är avsedd att vara skrivskyddad. SDK:et använder det internt. Har lagts till i version 1.14.0.
SpeakerRecognition_Api_Version	Serverdels-API-version för talarigenkänning. Den här egenskapen läggs till för att tillåta testning och användning av tidigare versioner av API:er för talarigenkänning, i förekommande fall. Har lagts till i version 1.18.0.
SpeechTranslation_ModelName	Namnet på en modell som ska användas för talöversättning. Använd inte den här egenskapen direkt. För närvarande är detta endast giltigt när EmbeddedSpeechConfig används.
SpeechTranslation_ModelKey	Den här egenskapen är inaktuell.
KeywordRecognition_ModelName	Namnet på en modell som ska användas för nyckelordsigenkänning. Använd inte den här egenskapen direkt. För närvarande är detta endast giltigt när EmbeddedSpeechConfig används.
KeywordRecognition_ModelKey	Den här egenskapen är inaktuell.
EmbeddedSpeech_EnablePerformanceMetrics	Aktivera samlingen av inbäddade talprestandamått som kan användas för att utvärdera en enhets förmåga att använda inbäddat tal. Insamlade data ingår i resultat från specifika scenarier som taligenkänning. Standardinställningen är "false". Observera att mått kanske inte är tillgängliga från alla inbäddade talscenarier.
SpeechSynthesisRequest_Pitch	Tonhöjden i det syntetiserade talet.
SpeechSynthesisRequest_Rate	Frekvensen för det syntetiserade talet.
SpeechSynthesisRequest_Volume	Volymen för det syntetiserade talet.
SpeechSynthesisRequest_Style	Stilen för det syntetiserade talet.
SpeechSynthesisRequest_Temperature	Temperaturen i det syntetiserade talet. Temperaturparametern börjar bara gälla när rösten är en HD-röst.
SpeechSynthesisRequest_CustomLexiconUrl	Den anpassade lexikon-URL:en för det syntetiserade talet. Detta ger en URL till ett anpassat uttalslexikon som ska användas under syntesen.
SpeechSynthesisRequest_PreferLocales	De föredragna språken för det syntetiserade talet. Kommaavgränsad lista med språknamn i prioritetsordning.
SpeechSynthesis_FrameTimeoutInterval	Tidsgränsintervallet i millisekunder mellan syntetiserade talljudramar. Större av detta och 10 sekunder används som en tidsgräns för hård bildruta. En timeout för talsyntes inträffar om a) tiden som gått sedan den senaste ramen överskrider det här tidsgränsintervallet och Real-Time Factor (RTF) överskrider dess maximala värde, eller b) tiden som gått sedan den senaste ramen överskrider tidsgränsen för hård bildruta.
SpeechSynthesis_RtfTimeoutThreshold	Den maximala Real-Time faktorn (RTF) för talsyntes. RTF beräknas som RTF = f(d)/d där f(d) är den tid det tar att syntetisera talljud med varaktighet d.

Definierar talegenskaps-ID:t. Har ändrats i version 1.4.0.

uppräkningsformat

Värden	Beskrivningar
Enkel
Detaljerad

Utdataformat.

enum ProfanityOption

Värden	Beskrivningar
Maskerade	Ersätter bokstäver med olämpliga ord med stjärntecken.
Avlägsnad	Tar bort olämpliga ord.
Rå	Gör inget med olämpliga ord.

Tar bort svordomar (svordomar) eller ersätter bokstäver med profana ord med stjärnor. Har lagts till i version 1.5.0.

enum ResultReason

Värden	Beskrivningar
Ingen matchning	Anger att tal inte kunde identifieras. Mer information finns i nomatchdetails-objektet.
Annullerad	Anger att igenkänningen avbröts. Mer information finns med hjälp av objektet CancellationDetails.
Igenkännande tal	Anger att talresultatet innehåller hypotestext.
IgenkäntTal	Anger att talresultatet innehåller slutlig text som har identifierats. Taligenkänningen är nu klar för den här frasen.
Känna igenIntent	Anger att avsiktsresultatet innehåller hypotestext och avsikt.
Erkänd avsikt	Anger att avsiktsresultatet innehåller slutlig text och avsikt. Taligenkänning och avsiktsbestämning är nu slutförda för den här frasen.
ÖversättningSpeech	Anger att översättningsresultatet innehåller hypotestext och dess översättningar.
Översatt tal	Anger att översättningsresultatet innehåller slutlig text och motsvarande översättningar. Taligenkänning och översättning är nu klara för den här frasen.
SyntetiseraAudio	Anger att det syntetiserade ljudresultatet innehåller en mängd ljuddata som inte är noll.
SynthesizingAudioCompleted (SyntetiserandeAudioSlutförd)	Anger att det syntetiserade ljudet nu är klart för den här frasen.
Känna igen nyckelord	Anger att talresultatet innehåller (overifierad) nyckelordstext. Har lagts till i version 1.3.0.
ErkäntNyckelord	Anger att nyckelordsigenkänningen har slutförts och att det angivna nyckelordet identifieras. Har lagts till i version 1.3.0.
SynthesizingAudioStarted (SyntetiserandeAudioStarted)	Anger att talsyntesen nu har startats Tillagd i version 1.4.0.
ÖversättningParticipantSpeech	Anger att transkriptionsresultatet innehåller hypotestext och dess översättningar för andra deltagare i konversationen. Har lagts till i version 1.8.0.
TranslatedParticipantSpeech (på engelska)	Anger att transkriptionsresultatet innehåller slutlig text och motsvarande översättningar för andra deltagare i konversationen. Taligenkänning och översättning är nu klara för den här frasen. Har lagts till i version 1.8.0.
TranslatedInstantMessage (Översatt direktmeddelande)	Anger att transkriptionsresultatet innehåller snabbmeddelandet och motsvarande översättningar. Har lagts till i version 1.8.0.
TranslatedParticipantInstantMessage (på engelska)	Anger att transkriptionsresultatet innehåller snabbmeddelandet för andra deltagare i konversationen och motsvarande översättningar. Har lagts till i version 1.8.0.
RegistreraVoiceProfile	Anger att röstprofilen registreras och att kunderna behöver skicka mer ljud för att skapa en röstprofil. Har lagts till i version 1.12.0.
EnrolledVoiceProfile (RegistreradRöstprofil)	Röstprofilen har registrerats. Har lagts till i version 1.12.0.
Erkända högtalare	Anger lyckad identifiering av vissa talare. Har lagts till i version 1.12.0.
Erkänd talare	Anger att en talare har verifierats. Har lagts till i version 1.12.0.
ResetVoiceProfile	Anger att en röstprofil har återställts. Har lagts till i version 1.12.0.
DeletedVoiceProfile (BorttagenRöstProfil)	Anger att en röstprofil har tagits bort. Har lagts till i version 1.12.0.
VoicesListRetrieved (RösterListaHämtad)	Anger att röstlistan har hämtats. Har lagts till i version 1.16.0.

Anger möjliga orsaker till att ett igenkänningsresultat kan genereras.

uppräkning AnnulleringReason

Värden	Beskrivningar
Fel	Anger att ett fel uppstod under taligenkänningen.
EndOfStream (Slut på ström)	Anger att slutet på ljudströmmen har nåtts.
CancelledByUser (AvbrutenAv Användare)	Anger att begäran avbröts av användaren. Har lagts till i version 1.14.0.

Definierar möjliga orsaker till att ett igenkänningsresultat kan avbrytas.

uppräkning CancellationErrorCode

Värden	Beskrivningar
Inget fel	Inget fel. Om CancellationReason är EndOfStream är CancellationErrorCode inställt på NoError.
AuthenticationFailure (AutentiseringMisslyckande)	Anger ett autentiseringsfel. Ett autentiseringsfel uppstår om prenumerationsnyckeln eller auktoriseringstoken är ogiltig, har upphört att gälla eller inte matchar den region som används.
Felaktig Begäran	Anger att en eller flera igenkänningsparametrar är ogiltiga eller att ljudformatet inte stöds.
För många förfrågningar	Anger att antalet parallella begäranden överskred antalet tillåtna samtidiga transkriptioner för prenumerationen.
Förbjuden	Anger att den kostnadsfria prenumeration som används av begäran tog slut på kvoten.
Anslutningsfel	Anger ett anslutningsfel.
ServiceTimeout (på engelska)	Anger ett timeout-fel vid väntan på svar från tjänsten.
Tjänstefel	Anger att ett fel returneras av tjänsten.
Tjänst otillgänglig	Anger att tjänsten för närvarande inte är tillgänglig.
RuntimeError	Anger ett oväntat körningsfel.
ServiceRedirectTemporär	Anger att Speech Service tillfälligt begär en återanslutning till en annan slutpunkt.
ServiceRedirectPermanent	Anger att Speech Service permanent begär en återanslutning till en annan slutpunkt.
EmbeddedModelError (EmbeddedModelError)	Anger att modellen för inbäddat tal (SR eller TTS) inte är tillgänglig eller skadad.

Definierar felkod om AnnulleringReason är Fel. Har lagts till i version 1.1.0.

uppräkning NoMatchReason

Värden	Beskrivningar
Inte igenkänd	Anger att tal identifierades, men inte kändes igen.
InitialSilenceTimeout (InitialSilenceTimeout)	Anger att starten av ljudströmmen endast innehöll tystnad och att tjänstens tidsgräns överst i väntan på tal.
InitialBabbleTimeout (InitialBabbleTimeout)	Anger att starten av ljudströmmen endast innehöll brus, och att tjänstens tidsgräns överst i väntan på tal.
KeywordNotRecognized	Anger att det upptäckta nyckelordet har avvisats av nyckelordsverifieringstjänsten. Har lagts till i version 1.5.0.
EndSilenceTimeout	Anger att ljudströmmen endast innehöll tystnad efter den senast identifierade frasen.

Definierar möjliga orsaker till att ett igenkänningsresultat kanske inte identifieras.

enum ActivityJSONType

Värden	Beskrivningar
Noll
Objekt
Samling
Sträng
Dubbel
UInt
Int
Boolesk

Definierar möjliga typer för ett aktivitets-json-värde. Har lagts till i version 1.5.0.

enum SpeechSynthesisOutputFormat

Värden	Beskrivningar
Raw8Khz8BitMonoMULaw	rå-8khz-8bit-mono-mulaw
Riff16Khz16KbpsMonoSiren	riff-16khz-16kbps-mono-siren Stöds inte av tjänsten. Använd inte det här värdet.
Ljud16Khz16KbpsMonoSiren	audio-16khz-16kbps-mono-siren Stöds inte av tjänsten. Använd inte det här värdet.
Ljud16Khz32KBitRateMonoMp3	ljud-16khz-32kbitrate-mono-mp3
Ljud16Khz128KBitRateMonoMp3	ljud-16khz-128kbitrate-mono-mp3
Ljud16Khz64KBitRateMonoMp3	ljud-16khz-64kbitrate-mono-mp3
Ljud24Khz48KBitRateMonoMp3	ljud-24khz-48kbitrate-mono-mp3
Ljud24Khz96KBitRateMonoMp3	ljud-24khz-96kbitrate-mono-mp3
Ljud24Khz160KBitRateMonoMp3	audio-24khz-160kbit/s-mono-mp3
Raw16Khz16BitMonoTrueSilk	RAW-16kHz-16bit-mono-truesilk
Riff16Khz16BitMonoPcm	riff-16khz-16bit-mono-pcm
Riff8Khz16BitMonoPcm	riff-8khz-16bit-mono-pcm
Riff24Khz16BitMonoPcm	riff-24 kHz-16 bit-mono-PCM
Riff8Khz8BitMonoMULaw	riff-8khz-8bit-mono-mulaw
Raw16Khz16BitMonoPcm	RAW-16khz-16bit-mono-pcm
Raw24Khz16BitMonoPcm	RAW-24khz-16bit-mono-pcm
Raw8Khz16BitMonoPcm	RAW-8khz-16bit-mono-pcm
Ogg16Khz16BitMonoOpus	OGG-16khz-16bit-mono-opus
Ogg24Khz16BitMonoOpus	OGG-24khz-16bit-mono-opus
Raw48Khz16BitMonoPcm	RAW-48khz-16bit-mono-pcm
Riff48Khz16BitMonoPcm	riff-48khz-16bit-mono-pcm
Ljud48Khz96KBitRateMonoMp3	ljud-48khz-96kbitrate-mono-mp3
Ljud48Khz192KBitRateMonoMp3	audio - 48 kHz - 192 kbit/s - mono - mp3
Ogg48Khz16BitMonoOpus	ogg-48khz-16bit-mono-opus Tillagd i version 1.16.0
Webm16Khz16BitMonoOpus	webm-16khz-16bit-mono-opus har lagts till i version 1.16.0
Webm24Khz16BitMonoOpus	webm-24khz-16bit-mono-opus Har lagts till i version 1.16.0
Raw24Khz16BitMonoTrueSilk	raw-24khz-16bit-mono-truesilk Tillagd i version 1.17.0
Raw8Khz8BitMonoALaw	raw-8khz-8bit-mono-alaw Tillagd i version 1.17.0
Riff8Khz8BitMonoALaw	riff-8khz-8bit-mono-alaw tillagd i version 1.17.0
Webm24Khz16Bit24KbpsMonoOpus	webm-24khz-16bit-24kbps-mono-opus Audio komprimerat av OPUS codec i en WebM-container, med bithastighet på 24 kbit/s, optimerat för IoT-scenario. (Lades till i 1.19.0)
Ljud16Khz16Bit32KbpsMonoOpus	audio-16khz-16bit-32kbps-mono-opus Audio komprimerat av OPUS codec utan container, med bithastighet på 32kbps. (Lades till i 1.20.0)
Ljud24Khz16Bit48KbpsMonoOpus	audio-24khz-16bit-48kbps-mono-opus Audio komprimerat av OPUS codec utan container, med bithastighet på 48kbps. (Lades till i 1.20.0)
Ljud24Khz16Bit24KbpsMonoOpus	audio-24khz-16bit-24kbps-mono-opus Audio komprimerat av OPUS codec utan container, med bithastighet på 24kbps. (Lades till i 1.20.0)
Raw22050Hz16BitMonoPcm	raw-22050hz-16bit-mono-pcm Raw PCM-ljud vid 22050Hz samplingshastighet och 16-bitars djup. (Lades till i 1.22.0)
Riff22050Hz16BitMonoPcm	riff-22050hz-16bit-mono-pcm PCM-ljud vid 22050Hz samplingshastighet och 16-bitars djup, med RIFF-huvud. (Lades till i 1.22.0)
Raw44100Hz16BitMonoPcm	raw-44100hz-16bit-mono-pcm Raw PCM ljud vid 44100Hz samplingshastighet och 16-bitars djup. (Lades till i 1.22.0)
Riff44100Hz16BitMonoPcm	riff-44100hz-16bit-mono-pcm PCM ljud vid 44100Hz samplingshastighet och 16-bitars djup, med RIFF-huvud. (Lades till i 1.22.0)
AmrWb16000Hz	amr-wb-16000hz AMR-WB ljud vid 16kHz samplingshastighet. (Lades till i 1.24.0)
G72216Khz64Kbps	g722-16khz-64kbps G.722 ljud vid 16kHz samplingshastighet och 64kbps bithastighet. (Lades till i 1.38.0)

Definierar möjliga ljudformat för talsyntesutdata. Uppdaterad i version 1.19.0.

enum StreamStatus

Värden	Beskrivningar
Okänd	Statusen för ljuddataströmmen är okänd.
IngenData	Ljuddataströmmen innehåller inga data.
Partiella data (partialData)	Ljuddataströmmen innehåller partiella data från en talarbegäran.
AllData (på engelska)	Ljuddataströmmen innehåller alla data i en talarbegäran.
Annullerad	Ljuddataströmmen avbröts.

Definierar den möjliga statusen för ljuddataströmmen. Har lagts till i version 1.4.0.

uppräkning ServicePropertyChannel

Värden	Beskrivningar
UriQueryParameter (på engelska)	Använder URI-frågeparameter för att skicka egenskapsinställningar till tjänsten.
HttpHeader (på engelska)	Använder HttpHeader för att ange en nyckel/ett värde i ett HTTP-huvud.

Definierar kanaler som används för att skicka egenskapsinställningar till tjänsten. Har lagts till i version 1.5.0.

enum VoiceProfileType

Värden	Beskrivningar
TextIndependentIdentification (på engelska)	Textoberoende talaridentifiering.
TextDependentVerification (på engelska)	Textberoende talarverifiering.
TextIndependentVerification (på engelska)	Oberoende textverifiering.

Definierar röstprofiltyper.

enum RecognitionFactorScope

Värden	Beskrivningar
Partiell fras	En igenkänningsfaktor gäller för grammatiker som kan refereras till som enskilda partiella fraser.

Definierar omfånget som en igenkänningsfaktor tillämpas på.

enum PronunciationAssessmentGradingSystem

Värden	Beskrivningar
Fempunktsmeny	Fempunktskalibrering.
Hundrastämplar	Hundra mark.

Definierar punktsystemet för uttalspoängkalibrering; standardvärdet är FivePoint. Har lagts till i version 1.14.0.

enum PronunciationAssessmentGranularity

Värden	Beskrivningar
Fonem	Visar poängen för den fullständiga text-, ord- och fonemnivån.
Ord	Visar poängen på den fullständiga text- och ordnivån.
Fulltext	Visar endast poängen på den fullständiga textnivån.

Definierar uttalsutvärderingens kornighet; standardvärdet är Phoneme. Har lagts till i version 1.14.0.

enum SynthesisVoiceType

Värden	Beskrivningar
UppkoppladNeural	Neural röst online.
OnlineStandard (på engelska)	Standardröst online.
OfflineNeural (OfflineNeural)	Neural röst offline.
OfflineStandard (på engelska)	Standardröst offline.

Definierar typen av syntesröster som lagts till i version 1.16.0.

uppräkning SynthesisVoiceGender

Värden	Beskrivningar
Okänd	Kön okänt.
Kvinnlig	Kvinnlig röst.
Manlig	Mansröst.
Neutral	Neutral röst.

Definierar könet för syntesröster som lagts till i version 1.17.0.

enum SynthesisVoiceStatus

Värden	Beskrivningar
Okänd	Röststatus okänd.
AllmäntTillgänglighet	Röst är allmänt tillgängligt.
Förhandsvisning	Röst är i förhandsversion.
Avrådes från användning	Röst är inaktuell, använd inte.

Definierar status för syntesröster.

uppräkning SpeechSynthesisBoundaryType

Värden	Beskrivningar
Ord	Ordgräns.
Interpunktion	Skiljeteckengräns.
Mening	Meningsgräns.

Definierar gränstypen för talsyntesgränshändelsen Som lagts till i version 1.21.0.

Strategi för uppräkning av segmentering

Värden	Beskrivningar
Standard	Använd standardstrategin och inställningarna som bestäms av Speech Service. Används i de flesta situationer.
Tid	Använder en tidsbaserad strategi där mängden tystnad mellan tal används för att avgöra när ett slutligt resultat ska genereras.
Semantisk	Använder en AI-modell för att avskräcka från slutet av en talad fras baserat på frasens innehåll.

Den strategi som används för att avgöra när en talad fras har avslutats och ett slutligt identifierat resultat ska genereras. Tillåtna värden är "Default", "Time" och "Semantic".

Dela via