Anteckning
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Sammanfattning
| Medlemmar | Beskrivningar |
|---|---|
| uppräkning PropertyId | Definierar talegenskaps-ID:t. Har ändrats i version 1.4.0. |
| uppräkning | Utdataformat. |
| uppräkning ProfanityOption | Tar bort svordomar (svordomar) eller ersätter bokstäver med profana ord med stjärnor. Har lagts till i version 1.5.0. |
| uppräkning ResultReason | Anger möjliga orsaker till att ett igenkänningsresultat kan genereras. |
| uppräkning AnnulleringReason | Definierar möjliga orsaker till att ett igenkänningsresultat kan avbrytas. |
| uppräkning AnnulleringErrorCode | Definierar felkod om AnnulleringReason är Fel. Har lagts till i version 1.1.0. |
| uppräkningen NoMatchReason | Definierar möjliga orsaker till att ett igenkänningsresultat kanske inte identifieras. |
| uppräkning ActivityJSONType | Definierar möjliga typer för ett aktivitets-json-värde. Har lagts till i version 1.5.0. |
| uppräkning SpeechSynthesisOutputFormat | Definierar möjliga ljudformat för talsyntesutdata. Uppdaterad i version 1.19.0. |
| uppräkning streamstatus | Definierar den möjliga statusen för ljuddataströmmen. Har lagts till i version 1.4.0. |
| uppräkning ServicePropertyChannel | Definierar kanaler som används för att skicka egenskapsinställningar till tjänsten. Har lagts till i version 1.5.0. |
| uppräkning av VoiceProfileType | Definierar röstprofiltyper. |
| uppräkning RecognitionFactorScope | Definierar omfånget som en igenkänningsfaktor tillämpas på. |
| uppräkningspronunciationAssessmentGradingSystem | Definierar punktsystemet för uttalspoängkalibrering; standardvärdet är FivePoint. Har lagts till i version 1.14.0. |
| enum PronunciationAssessmentGranularity | Definierar uttalsutvärderingens kornighet; standardvärdet är Phoneme. Har lagts till i version 1.14.0. |
| enum SynthesisVoiceType | Definierar typen av syntesröster som lagts till i version 1.16.0. |
| enum SynthesisVoiceGender | Definierar könet för syntesröster som lagts till i version 1.17.0. |
| enum SynthesisVoiceStatus | Definierar status för syntesröster. |
| uppräkning SpeechSynthesisBoundaryType | Definierar gränstypen för talsyntesgränshändelsen Som lagts till i version 1.21.0. |
| uppräkning SegmentationStrategy | Den strategi som används för att avgöra när en talad fras har avslutats och ett slutligt identifierat resultat ska genereras. Tillåtna värden är "Default", "Time" och "Semantic". |
| klass AsyncRecognizer | AsyncRecognizer abstrakt basklass. |
| klassen AudioDataStream | Representerar ljuddataström som används för att använda ljuddata som en ström. Har lagts till i version 1.4.0. |
| klassen AutoDetectSourceLanguageConfig | Klass som definierar källkonfiguration för automatisk identifiering Uppdaterad i 1.13.0. |
| klassen AutoDetectSourceLanguageResult | Innehåller automatiskt identifierat källspråkresultat som lagts till i 1.8.0. |
| klassen BaseAsyncRecognizer | BaseAsyncRecognizer-klass. |
| klassen CancellationDetails | Innehåller detaljerad information om varför ett resultat avbröts. |
| klass ClassLanguageModel | Representerar en lista över grammatiker för dynamiska grammatikscenarier. Har lagts till i version 1.7.0. |
| klassen Anslutning | Anslutningen är en proxyklass för att hantera anslutningen till taltjänsten för den angivna identifieraren. Som standard hanterar en identifierare autonomt anslutning till tjänsten vid behov. Klassen Anslutning innehåller ytterligare metoder för användare att uttryckligen öppna eller stänga en anslutning och prenumerera på ändringar av anslutningsstatus. Det är valfritt att använda Anslutning. Den är avsedd för scenarier där finjustering av programmets beteende baserat på anslutningsstatus behövs. Användare kan också anropa Open() för att initiera en tjänstanslutning manuellt innan de påbörjar igenkänningen på den identifierare som är associerad med den här anslutningen. När du har startat en igenkänning kan det hända att det inte går att anropa Open() eller Close(). Detta påverkar inte identifieraren eller den pågående igenkänningen. Anslutningen kan ta bort av olika skäl. Identifieraren försöker alltid att återupprätta anslutningen efter behov för att garantera pågående åtgärder. I alla dessa fall anger anslutna/frånkopplade händelser ändringen av anslutningsstatusen. Uppdaterad i version 1.17.0. |
| klassen ConnectionEventArgs | Innehåller data för ConnectionEvent. Har lagts till i version 1.2.0. |
| klassen ConnectionMessage | ConnectionMessage representerar implementeringsspecifika meddelanden som skickas till och tas emot från taltjänsten. Dessa meddelanden tillhandahålls i felsökningssyfte och bör inte användas för produktionsanvändningsfall med Azure Cognitive Services Speech Service. Meddelanden som skickas till och tas emot från Taltjänsten kan komma att ändras utan föregående meddelande. Detta inkluderar meddelandeinnehåll, rubriker, nyttolaster, beställning osv. Har lagts till i version 1.10.0. |
| klassen ConnectionMessageEventArgs | Innehåller data för ConnectionMessageEvent. |
| klassen EmbeddedSpeechConfig | Klass som definierar inbäddad talkonfiguration (offline). |
| klassen EventArgs | Basklass för händelseargument. |
| klassen EventSignal | Klienter kan ansluta till händelsesignalen för att ta emot händelser eller koppla från händelsesignalen för att sluta ta emot händelser. |
| klassen EventSignalBase | Klienter kan ansluta till händelsesignalen för att ta emot händelser eller koppla från händelsesignalen för att sluta ta emot händelser. |
| klassen Grammatik | Representerar basklass grammatik för anpassning av taligenkänning. Har lagts till i version 1.5.0. |
| klassen GrammarList | Representerar en lista över grammatiker för dynamiska grammatikscenarier. Har lagts till i version 1.7.0. |
| klassen GrammarPhrase | Representerar en fras som kan talas av användaren. Har lagts till i version 1.5.0. |
| klassen HybridSpeechConfig | Klass som definierar hybridkonfigurationer (moln och inbäddade) för taligenkänning eller talsyntes. |
| klassen KeywordRecognitionEventArgs | Klass för de händelser som KeywordRecognizer. |
| klassen KeywordRecognitionModel | Representerar nyckelordsigenkänningsmodellen som används med StartKeywordRecognitionAsync-metoder. |
| klassen KeywordRecognitionResult | Klass som definierar de resultat som genereras av KeywordRecognizer. |
| klassen KeywordRecognizer | Typ av identifierare som är specialiserad på att endast hantera nyckelordsaktivering. |
| klassen NoMatchDetails | Innehåller detaljerad information för NoMatch-igenkänningsresultat. |
| klassen PersonalVoiceSynthesisRequest | Klass som definierar talsyntesbegäran för personlig röst (aka.ms/azureai/personal-voice). Den här klassen är i förhandsversion och kan komma att ändras. Har lagts till i version 1.39.0. |
| klassen PhraseListGrammar | Representerar en fraslista grammatik för dynamiska grammatikscenarier. Har lagts till i version 1.5.0. |
| klassen PronunciationAssessmentConfig | Klass som definierar uttalsutvärderingskonfiguration som lagts till i 1.14.0. |
| klassen PronunciationAssessmentResult | Klass för uttalsutvärderingsresultat. |
| klassen PropertyCollection | Klass för att hämta eller ange ett egenskapsvärde från en egenskapssamling. |
| klassen RecognitionEventArgs | Innehåller data för RecognitionEvent. |
| klassen RecognitionResult | Innehåller detaljerad information om resultatet av en igenkänningsåtgärd. |
| klassen Recognizer | Känna igen basklass. |
| klassen SessionEventArgs | Basklass för sessionshändelseargument. |
| klassen SmartHandle | Smart handtagsklass. |
| klassen SourceLanguageConfig | Klass som definierar konfiguration av källspråk, tillagd i 1.8.0. |
| klassen SourceLanguageRecognizer | Klass för källspråksidentkännare. Du kan använda den här klassen för fristående språkidentifiering. Har lagts till i version 1.17.0. |
| klassen SpeechConfig | Klass som definierar konfigurationer för tal-/avsiktsigenkänning eller talsyntes. |
| klassen SpeechRecognitionCanceledEventArgs | Klassen för taligenkänning avbröt händelseargument. |
| klassen SpeechRecognitionEventArgs | Klass för argument för taligenkänningshändelser. |
| klassen SpeechRecognitionModel | Information om taligenkänningsmodell. |
| klassen SpeechRecognitionResult | Basklass för taligenkänningsresultat. |
| klassen SpeechRecognizer | Klass för taligenkänning. |
| klassen SpeechSynthesisBookmarkEventArgs | Klass för talsyntesbokmärkeshändelseargument. Har lagts till i version 1.16.0. |
| klassen SpeechSynthesisCancellationDetails | Innehåller detaljerad information om varför ett resultat avbröts. Har lagts till i version 1.4.0. |
| klassen SpeechSynthesisEventArgs | Klass för talsynteshändelseargument. Har lagts till i version 1.4.0. |
| klassen SpeechSynthesisRequest | Klass som definierar talsyntesbegäran. Den här klassen är i förhandsversion och kan komma att ändras. Har lagts till i version 1.37.0. |
| klassen SpeechSynthesisResult | Innehåller information om resultatet från text-till-tal-syntes. Har lagts till i version 1.4.0. |
| klassen SpeechSynthesisVisemeEventArgs | Klass för talsyntes viseme-händelseargument. Har lagts till i version 1.16.0. |
| klassen SpeechSynthesisWordBoundaryEventArgs | Klass för talsyntesens ordgränshändelseargument. Har lagts till i version 1.7.0. |
| klassen SpeechSynthesizer | Klass för talsyntes. Uppdaterad i version 1.14.0. |
| klassen SpeechTranslationModel | Information om talöversättningsmodell. |
| klassen SynthesisVoicesResult | Innehåller information om resultatet från röstlistan över talsynteser. Har lagts till i version 1.16.0. |
| klassen VoiceInfo | Innehåller information om syntesröstinformation uppdaterad i version 1.17.0. |
Medlemmar
enum PropertyId
| Värden | Beskrivningar |
|---|---|
| SpeechServiceConnection_Key | Prenumerationsnyckeln för Cognitive Services Speech Service. Om du använder en avsiktsigenkänning måste du ange LUIS-slutpunktsnyckeln för din specifika LUIS-app. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::FromSubscription. |
| SpeechServiceConnection_Endpoint | Cognitive Services Speech Service-slutpunkten (url). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::FromEndpoint. Obs! Den här slutpunkten är inte samma som slutpunkten som används för att hämta en åtkomsttoken. |
| SpeechServiceConnection_Region | Cognitive Services Speech Service-regionen. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::FromSubscription, SpeechConfig::FromEndpoint, SpeechConfig::FromHost, SpeechConfig::FromAuthorizationToken. |
| SpeechServiceAuthorization_Token | Cognitive Services Speech Service-auktoriseringstoken (även kallad åtkomsttoken). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::FromAuthorizationToken, SpeechRecognizer::SetAuthorizationToken, IntentRecognizer::SetAuthorizationToken, TranslationRecognizer::SetAuthorizationToken. |
| SpeechServiceAuthorization_Type | Auktoriseringstypen För Cognitive Services Speech Service. Används för närvarande inte. |
| SpeechServiceConnection_EndpointId | Slutpunkts-ID:t för Cognitive Services Custom Speech eller Custom Voice Service. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::SetEndpointId. Obs! Slutpunkts-ID:t är tillgängligt i den anpassade talportalen, som visas under Slutpunktsinformation. |
| SpeechServiceConnection_Host | Cognitive Services Speech Service-värden (url). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::FromHost. |
| SpeechServiceConnection_ProxyHostName | Värdnamnet för proxyservern som används för att ansluta till Cognitive Services Speech Service. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::SetProxy. Obs! Det här egenskaps-ID:t lades till i version 1.1.0. |
| SpeechServiceConnection_ProxyPort | Porten för proxyservern som används för att ansluta till Cognitive Services Speech Service. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::SetProxy. Obs! Det här egenskaps-ID:t lades till i version 1.1.0. |
| SpeechServiceConnection_ProxyUserName | Användarnamnet för proxyservern som används för att ansluta till Cognitive Services Speech Service. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::SetProxy. Obs! Det här egenskaps-ID:t lades till i version 1.1.0. |
| SpeechServiceConnection_ProxyPassword | Lösenordet för proxyservern som används för att ansluta till Cognitive Services Speech Service. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::SetProxy. Obs! Det här egenskaps-ID:t lades till i version 1.1.0. |
| SpeechServiceConnection_Url | URL-strängen som skapats från talkonfigurationen. Den här egenskapen är avsedd att vara skrivskyddad. SDK:et använder det internt. OBS! Har lagts till i version 1.5.0. |
| SpeechServiceConnection_ProxyHostBypass | Anger listan över värdar för vilka proxyservrar inte ska användas. Den här inställningen åsidosätter alla andra konfigurationer. Värdnamn avgränsas med kommatecken och matchas på ett skiftlägesokänsligt sätt. Jokertecken stöds inte. |
| SpeechServiceConnection_TranslationToLanguages | Listan över kommaavgränsade språk som används som målöversättningsspråk. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechTranslationConfig::AddTargetLanguage och SpeechTranslationConfig::GetTargetLanguages. |
| SpeechServiceConnection_TranslationVoice | Namnet på cognitive service-texten till taltjänstens röst. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechTranslationConfig::SetVoiceName. Obs! Giltiga röstnamn finns här. |
| SpeechServiceConnection_TranslationFeatures | Översättningsfunktioner. För internt bruk. |
| SpeechServiceConnection_IntentRegion | Language Understanding Service-regionen. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället LanguageUnderstandingModel. |
| SpeechServiceConnection_RecoMode | Igenkänningsläget för Cognitive Services Speech Service. Kan vara "INTERACTIVE", "CONVERSATION", "DICTATION". Den här egenskapen är avsedd att vara skrivskyddad. SDK:et använder det internt. |
| SpeechServiceConnection_RecoLanguage | Det talade språket som ska kännas igen (i BCP-47-format). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::SetSpeechRecognitionLanguage. |
| Speech_SessionId | Sessions-ID: t. Det här ID:t är en universellt unik identifierare (även kallad UUID) som representerar en specifik bindning av en ljudindataström och den underliggande taligenkänningsinstansen som den är bunden till. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SessionEventArgs::SessionId. |
| SpeechServiceConnection_UserDefinedQueryParameters | Frågeparametrarna som tillhandahålls av användare. De skickas till tjänsten som URL-frågeparametrar. Har lagts till i version 1.5.0. |
| SpeechServiceConnection_RecoBackend | Strängen för att ange den serverdel som ska användas för taligenkänning. tillåtna alternativ är online och offline. Under normala omständigheter bör du inte använda den här egenskapen direkt. För närvarande är offlinealternativet endast giltigt när EmbeddedSpeechConfig används. Har lagts till i version 1.19.0. |
| SpeechServiceConnection_RecoModelName | Namnet på den modell som ska användas för taligenkänning. Under normala omständigheter bör du inte använda den här egenskapen direkt. För närvarande är detta endast giltigt när EmbeddedSpeechConfig används. Har lagts till i version 1.19.0. |
| SpeechServiceConnection_RecoModelKey | Den här egenskapen är inaktuell. |
| SpeechServiceConnection_RecoModelIniFile | Sökvägen till ini-filen för modellen som ska användas för taligenkänning. Under normala omständigheter bör du inte använda den här egenskapen direkt. För närvarande är detta endast giltigt när EmbeddedSpeechConfig används. Har lagts till i version 1.19.0. |
| SpeechServiceConnection_SynthLanguage | Det talade språket som ska syntetiseras (t.ex. en-US) har lagts till i version 1.4.0. |
| SpeechServiceConnection_SynthVoice | Namnet på TTS-rösten som ska användas för talsyntes som lagts till i version 1.4.0. |
| SpeechServiceConnection_SynthOutputFormat | Strängen för att ange TTS-utdataljudformatet Har lagts till i version 1.4.0. |
| SpeechServiceConnection_SynthEnableCompressedAudioTransmission | Anger om du använder komprimerat ljudformat för talsyntesljudöverföring. Den här egenskapen påverkar bara när SpeechServiceConnection_SynthOutputFormat är inställt på ett pcm-format. Om den här egenskapen inte har angetts och GStreamer är tillgänglig använder SDK komprimerat format för syntetiserad ljudöverföring och avkodar den. Du kan ställa in den här egenskapen på "false" för att använda raw pcm-format för överföring på kabel. Har lagts till i version 1.16.0. |
| SpeechServiceConnection_SynthBackend | Strängen för att ange TTS-serverdelen. giltiga alternativ är online och offline. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället EmbeddedSpeechConfig::FromPath eller EmbeddedSpeechConfig::FromPaths för att ställa in syntesens serverdel till offline. Har lagts till i version 1.19.0. |
| SpeechServiceConnection_SynthOfflineDataPath | Datafilens sökvägar för offlinesyntesmotorn. endast giltigt när syntesserverdelen är offline. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället EmbeddedSpeechConfig::FromPath eller EmbeddedSpeechConfig::FromPaths. Har lagts till i version 1.19.0. |
| SpeechServiceConnection_SynthOfflineVoice | Namnet på den offline-TTS-röst som ska användas för talsyntes Under normala omständigheter bör du inte använda den här egenskapen direkt. Använd i stället EmbeddedSpeechConfig::SetSpeechSynthesisVoice och EmbeddedSpeechConfig::GetSpeechSynthesisVoiceName. Har lagts till i version 1.19.0. |
| SpeechServiceConnection_SynthModelKey | Den här egenskapen är inaktuell. |
| SpeechServiceConnection_VoicesListEndpoint | Röstlistan api-slutpunkt (URL) för Cognitive Services Speech Service-röster. Under normala omständigheter behöver du inte ange den här egenskapen. SDK skapar den baserat på region/värd/slutpunkt för SpeechConfig. Har lagts till i version 1.16.0. |
| SpeechServiceConnection_InitialSilenceTimeoutMs | Det initiala tidsgränsvärdet för tystnad (i millisekunder) som används av tjänsten. Har lagts till i version 1.5.0. |
| SpeechServiceConnection_EndSilenceTimeoutMs | Den här egenskapen är inaktuell. Aktuell information om timeout för tystnad finns på https://aka.ms/csspeech/timeouts. |
| SpeechServiceConnection_EnableAudioLogging | Ett booleskt värde som anger om ljudloggning är aktiverat i tjänsten eller inte. Ljud- och innehållsloggar lagras antingen i Microsoft-ägd lagring eller i ditt eget lagringskonto som är länkat till din Cognitive Services-prenumeration (BYOS)-aktiverad Speech-resurs (Bring Your Own Storage). Har lagts till i version 1.5.0. |
| SpeechServiceConnection_LanguageIdMode | ID-läget för taltjänstens anslutningsspråk. Kan vara "AtStart" (standard) eller "Kontinuerlig". Se dokumentet Language Identification. Lades till i 1.25.0. |
| SpeechServiceConnection_TranslationCategoryId | Översättningskategori-ID för taltjänstens anslutning. |
| SpeechServiceConnection_AutoDetectSourceLanguages | Automatiskt identifiera källspråk som lagts till i version 1.8.0. |
| SpeechServiceConnection_AutoDetectSourceLanguageResult | Resultatet för automatisk identifiering av källspråket har lagts till i version 1.8.0. |
| SpeechServiceResponse_RequestDetailedResultTrueFalse | Det begärda utdataformatet för Cognitive Services Speech Service-svar (enkelt eller detaljerat). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället SpeechConfig::SetOutputFormat. |
| SpeechServiceResponse_RequestProfanityFilterTrueFalse | Den begärda svarsnivån för Cognitive Services Speech Service utdata för svordomar. Används för närvarande inte. |
| SpeechServiceResponse_ProfanityOption | Den begärda inställningen för Cognitive Services Speech Service-svar ger ut svordomar. Tillåtna värden är "maskerade", "borttagna" och "råa". Har lagts till i version 1.5.0. |
| SpeechServiceResponse_PostProcessingOption | Ett strängvärde som anger vilket alternativ efter bearbetning som ska användas av tjänsten. Tillåtna värden är "TrueText". Har lagts till i version 1.5.0. |
| SpeechServiceResponse_RequestWordLevelTimestamps | Ett booleskt värde som anger om tidsstämplar på ordnivå ska inkluderas i svarsresultatet. Har lagts till i version 1.5.0. |
| SpeechServiceResponse_StablePartialResultThreshold | Antalet gånger ett ord måste vara i partiella resultat för att returneras. Har lagts till i version 1.5.0. |
| SpeechServiceResponse_OutputFormatOption | Ett strängvärde som anger alternativet utdataformat i svarsresultatet. Endast intern användning. Har lagts till i version 1.5.0. |
| SpeechServiceResponse_RequestSnr | Ett booleskt värde som anger om SNR (signal till brus-förhållande) ska inkluderas i svarsresultatet. Har lagts till i version 1.18.0. |
| SpeechServiceResponse_TranslationRequestStablePartialResult | Ett booleskt värde att begära för att stabilisera partiella översättningsresultat genom att utelämna ord i slutet. Har lagts till i version 1.5.0. |
| SpeechServiceResponse_RequestWordBoundary | Ett booleskt värde som anger om WordBoundary-händelser ska begäras. Har lagts till i version 1.21.0. |
| SpeechServiceResponse_RequestPunctuationBoundary | Ett booleskt värde som anger om skiljetecken ska begäras i WordBoundary Events. Standardvärdet är sant. Har lagts till i version 1.21.0. |
| SpeechServiceResponse_RequestSentenceBoundary | Ett booleskt värde som anger om meningsgränsen ska begäras i WordBoundary Events. Standardvärdet är falskt. Har lagts till i version 1.21.0. |
| SpeechServiceResponse_SynthesisEventsSyncToAudio | Ett booleskt värde som anger om SDK ska synkronisera händelser med syntesmetadata (t.ex. ordgräns, viseme osv.) till ljuduppspelningen. Detta börjar gälla först när ljudet spelas upp via SDK:et. Standardvärdet är sant. Om värdet är falskt utlöser SDK:t händelserna när de kommer från tjänsten, vilket kan vara osynkroniserat med ljuduppspelningen. Har lagts till i version 1.31.0. |
| SpeechServiceResponse_JsonResult | Cognitive Services Speech Service-svarsutdata (i JSON-format). Den här egenskapen är endast tillgänglig för igenkänningsresultatobjekt. |
| SpeechServiceResponse_JsonErrorDetails | Information om Cognitive Services Speech Service-fel (i JSON-format). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället CancellationDetails::ErrorDetails. |
| SpeechServiceResponse_RecognitionLatencyMs | Svarstiden för igenkänning i millisekunder. Skrivskyddad, tillgänglig för slutresultat för tal/översättning/avsikt. Detta mäter svarstiden mellan när en ljudinmatning tas emot av SDK:et och det ögonblick då slutresultatet tas emot från tjänsten. SDK beräknar tidsskillnaden mellan det sista ljudfragmentet från ljudindata som bidrar till slutresultatet och den tid då slutresultatet tas emot från taltjänsten. Har lagts till i version 1.3.0. |
| SpeechServiceResponse_RecognitionBackend | Serverdelen för igenkänning. Skrivskyddad, tillgänglig för taligenkänningsresultat. Detta anger om molnigenkänning (online) eller inbäddad (offline) användes för att producera resultatet. |
| SpeechServiceResponse_SynthesisFirstByteLatencyMs | Talsyntesens första bytesvarstid i millisekunder. Skrivskyddad, tillgänglig för slutresultat för talsyntes. Detta mäter svarstiden mellan när syntesen startas för bearbetning och det ögonblick då det första byteljudet är tillgängligt. Har lagts till i version 1.17.0. |
| SpeechServiceResponse_SynthesisFinishLatencyMs | Talsyntesen alla bytes svarstid i millisekunder. Skrivskyddad, tillgänglig för slutresultat för talsyntes. Detta mäter svarstiden mellan när syntesen startas för att bearbetas och det ögonblick då hela ljudet syntetiseras. Har lagts till i version 1.17.0. |
| SpeechServiceResponse_SynthesisUnderrunTimeMs | Underkörningstiden för talsyntes i millisekunder. Skrivskyddad, tillgänglig för resultat i SynthesisCompleted-händelser. Detta mäter den totala underkörningstiden från PropertyId::AudioConfig_PlaybackBufferLengthInMs fylls i för att syntesen ska slutföras. Har lagts till i version 1.17.0. |
| SpeechServiceResponse_SynthesisConnectionLatencyMs | Svarstid för talsyntesanslutning i millisekunder. Skrivskyddad, tillgänglig för slutresultat för talsyntes. Detta mäter svarstiden mellan när syntesen startas för att bearbetas och när HTTP/WebSocket-anslutningen upprättas. Har lagts till i version 1.26.0. |
| SpeechServiceResponse_SynthesisNetworkLatencyMs | Svarstiden för talsyntesnätverket i millisekunder. Skrivskyddad, tillgänglig för slutresultat för talsyntes. Detta mäter nätverkets tur och retur-tid. Har lagts till i version 1.26.0. |
| SpeechServiceResponse_SynthesisServiceLatencyMs | Svarstiden för talsyntestjänsten i millisekunder. Skrivskyddad, tillgänglig för slutresultat för talsyntes. Detta mäter bearbetningstiden för tjänsten för att syntetisera det första bytet av ljud. Har lagts till i version 1.26.0. |
| SpeechServiceResponse_SynthesisBackend | Anger vilken serverdel som syntesen är klar med. Skrivskyddad, tillgänglig för talsyntesresultat, förutom resultatet i SynthesisStarted-händelsen Som lagts till i version 1.17.0. |
| SpeechServiceResponse_DiarizeIntermediateResults | Avgör om mellanliggande resultat innehåller talaridentifiering. |
| CancellationDetails_Reason | Avbokningsorsaken. Används för närvarande inte. |
| CancellationDetails_ReasonText | Annulleringstexten. Används för närvarande inte. |
| CancellationDetails_ReasonDetailedText | Detaljerad text om annullering. Används för närvarande inte. |
| LanguageUnderstandingServiceResponse_JsonResult | Language Understanding Service-svarsutdata (i JSON-format). Tillgänglig via IntentRecognitionResult.Properties. |
| AudioConfig_DeviceNameForCapture | Enhetsnamnet för ljudinspelning. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället AudioConfig::FromMicrophoneInput. Obs! Det här egenskaps-ID:t lades till i version 1.3.0. |
| AudioConfig_NumberOfChannelsForCapture | Antalet kanaler för ljudinspelning. Endast intern användning. Obs! Det här egenskaps-ID:t lades till i version 1.3.0. |
| AudioConfig_SampleRateForCapture | Exempelfrekvensen (i Hz) för ljudinspelning. Endast intern användning. Obs! Det här egenskaps-ID:t lades till i version 1.3.0. |
| AudioConfig_BitsPerSampleForCapture | Antalet bitar av varje exempel för ljudinspelning. Endast intern användning. Obs! Det här egenskaps-ID:t lades till i version 1.3.0. |
| AudioConfig_AudioSource | Ljudkällan. Tillåtna värden är "Mikrofoner", "Fil" och "Stream". Har lagts till i version 1.3.0. |
| AudioConfig_DeviceNameForRender | Enhetsnamnet för ljudåtergivning. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället AudioConfig::FromSpeakerOutput. Har lagts till i version 1.14.0. |
| AudioConfig_PlaybackBufferLengthInMs | Uppspelningsbuffertlängd i millisekunder, standardvärdet är 50 millisekunder. |
| AudioConfig_AudioProcessingOptions | Alternativ för ljudbearbetning i JSON-format. |
| Speech_LogFilename | Filnamnet för att skriva loggar. Har lagts till i version 1.4.0. |
| Speech_SegmentationSilenceTimeoutMs | En varaktighet för upptäckt tystnad, mätt i millisekunder, varefter tal till text avgör att en talad fras har avslutats och genererar ett slutligt identifierat resultat. Att konfigurera den här tidsgränsen kan vara användbart i situationer där talade indata är betydligt snabbare eller långsammare än vanligt och standardsegmenteringsbeteendet ger konsekvent resultat som är för långa eller för korta. Timeoutvärden för segmentering som är olämpligt höga eller låga kan påverka tal-till-text-noggrannhet negativt. Den här egenskapen bör konfigureras noggrant och det resulterande beteendet bör verifieras noggrant som avsett. Värdet måste ligga i intervallet [100, 5 000] millisekunder. |
| Speech_SegmentationMaximumTimeMs | Den maximala längden på en talad fras när du använder segmenteringsstrategin "Tid". Värdet för Speech_SegmentationSilenceTimeoutMs måste anges för att den här inställningen ska kunna användas. När längden på en talad fras närmar sig det här värdet börjar Speech_SegmentationSilenceTimeoutMs minskas tills tidsgränsen för frasens tystnad nås eller så når frasen maximal längd. Värdet måste ligga i intervallet [20000, 70000] millisekunder. |
| Speech_SegmentationStrategy | Den strategi som används för att avgöra när en talad fras har avslutats och ett slutligt identifierat resultat ska genereras. Tillåtna värden är "Default", "Time" och "Semantic". |
| Speech_StartEventSensitivity | Känsligheten för hur snart ett potentiellt tal börjar kan signaleras. Tillåtna värden är "låg" (standard), "medium" och "hög". |
| Conversation_ApplicationId | Identifierare som används för att ansluta till serverdelstjänsten. Har lagts till i version 1.5.0. |
| Conversation_DialogType | Typ av dialogruta som du vill ansluta till. Har lagts till i version 1.7.0. |
| Conversation_Initial_Silence_Timeout | Tidsgränsen för att lyssna har lagts till i version 1.5.0. |
| Conversation_From_Id | Från id som ska användas för taligenkänningsaktiviteter som lagts till i version 1.5.0. |
| Conversation_Conversation_Id | ConversationId för sessionen. Har lagts till i version 1.8.0. |
| Conversation_Custom_Voice_Deployment_Ids | Kommaavgränsad lista över anpassade röstdistributions-ID:er. Har lagts till i version 1.8.0. |
| Conversation_Speech_Activity_Template | Mall för talaktivitet, stämpelegenskaper i mallen för aktiviteten som genereras av tjänsten för tal. Har lagts till i version 1.10.0. |
| Conversation_ParticipantId | Din deltagaridentifierare i den aktuella konversationen. Har lagts till i version 1.13.0. |
| Conversation_Request_Bot_Status_Messages | |
| Conversation_Connection_Id | |
| DataBuffer_TimeStamp | Tidsstämpeln som är associerad med databufferten som skrivs av klienten när du använder Pull/Push-ljudindataströmmar. Tidsstämpeln är ett 64-bitarsvärde med en upplösning på 90 kHz. Det är samma som tidsstämpeln för presentationen i en MPEG-transportström. Se https://en.wikipedia.org/wiki/Presentation_timestamp har lagts till i version 1.5.0. |
| DataBuffer_UserId | Användar-ID:t som är associerat med databufferten som skrivs av klienten när du använder Pull/Push-ljudindataströmmar. Har lagts till i version 1.5.0. |
| PronunciationAssessment_ReferenceText | Referenstexten för ljudet för uttalsutvärdering. För detta och följande uttalsutvärderingsparametrar, se tabellen parametrar för uttalsutvärdering. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::Create or PronunciationAssessmentConfig::SetReferenceText. Har lagts till i version 1.14.0. |
| PronunciationAssessment_GradingSystem | Punktsystemet för uttalspoängkalibrering (FivePoint eller HundredMark). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::Create. Har lagts till i version 1.14.0. |
| PronunciationAssessment_Granularity | Uttalsutvärderingskornigheten (Phoneme, Word eller FullText). Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::Create. Har lagts till i version 1.14.0. |
| PronunciationAssessment_EnableMiscue | Definierar om du aktiverar felberäkning. När detta är aktiverat jämförs de uttalade orden med referenstexten och markeras med utelämnande/infogning baserat på jämförelsen. Standardinställningen är False. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::Create. Har lagts till i version 1.14.0. |
| PronunciationAssessment_PhonemeAlphabet | Uttalsutvärderingens fonetikalfabet. Giltiga värden är "SAPI" (standard) och "IPA" Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::SetPhonemeAlphabet. Har lagts till i version 1.20.0. |
| PronunciationAssessment_NBestPhonemeCount | Uttalsutvärderingen nbest phoneme count. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::SetNBestPhonemeCount. Har lagts till i version 1.20.0. |
| PronunciationAssessment_EnableProsodyAssessment | Om du vill aktivera prosody-utvärdering. Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::EnableProsodyAssessment. Har lagts till i version 1.33.0. |
| PronunciationAssessment_Json | Json-strängen med uttalsbedömningsparametrar Under normala omständigheter bör du inte behöva använda den här egenskapen direkt. Använd i stället PronunciationAssessmentConfig::Create. Har lagts till i version 1.14.0. |
| PronunciationAssessment_Params | Uttalsutvärderingsparametrar. Den här egenskapen är avsedd att vara skrivskyddad. SDK:et använder det internt. Har lagts till i version 1.14.0. |
| SpeakerRecognition_Api_Version | Serverdels-API-version för talarigenkänning. Den här egenskapen läggs till för att tillåta testning och användning av tidigare versioner av API:er för talarigenkänning, i förekommande fall. Har lagts till i version 1.18.0. |
| SpeechTranslation_ModelName | Namnet på en modell som ska användas för talöversättning. Använd inte den här egenskapen direkt. För närvarande är detta endast giltigt när EmbeddedSpeechConfig används. |
| SpeechTranslation_ModelKey | Den här egenskapen är inaktuell. |
| KeywordRecognition_ModelName | Namnet på en modell som ska användas för nyckelordsigenkänning. Använd inte den här egenskapen direkt. För närvarande är detta endast giltigt när EmbeddedSpeechConfig används. |
| KeywordRecognition_ModelKey | Den här egenskapen är inaktuell. |
| EmbeddedSpeech_EnablePerformanceMetrics | Aktivera samlingen av inbäddade talprestandamått som kan användas för att utvärdera en enhets förmåga att använda inbäddat tal. Insamlade data ingår i resultat från specifika scenarier som taligenkänning. Standardinställningen är "false". Observera att mått kanske inte är tillgängliga från alla inbäddade talscenarier. |
| SpeechSynthesisRequest_Pitch | Tonhöjden i det syntetiserade talet. |
| SpeechSynthesisRequest_Rate | Frekvensen för det syntetiserade talet. |
| SpeechSynthesisRequest_Volume | Volymen för det syntetiserade talet. |
| SpeechSynthesisRequest_Style | Stilen för det syntetiserade talet. |
| SpeechSynthesisRequest_Temperature | Temperaturen i det syntetiserade talet. Temperaturparametern börjar bara gälla när rösten är en HD-röst. |
| SpeechSynthesisRequest_CustomLexiconUrl | Den anpassade lexikon-URL:en för det syntetiserade talet. Detta ger en URL till ett anpassat uttalslexikon som ska användas under syntesen. |
| SpeechSynthesisRequest_PreferLocales | De föredragna språken för det syntetiserade talet. Kommaavgränsad lista med språknamn i prioritetsordning. |
| SpeechSynthesis_FrameTimeoutInterval | Tidsgränsintervallet i millisekunder mellan syntetiserade talljudramar. Större av detta och 10 sekunder används som en tidsgräns för hård bildruta. En timeout för talsyntes inträffar om a) tiden som gått sedan den senaste ramen överskrider det här tidsgränsintervallet och Real-Time Factor (RTF) överskrider dess maximala värde, eller b) tiden som gått sedan den senaste ramen överskrider tidsgränsen för hård bildruta. |
| SpeechSynthesis_RtfTimeoutThreshold | Den maximala Real-Time faktorn (RTF) för talsyntes. RTF beräknas som RTF = f(d)/d där f(d) är den tid det tar att syntetisera talljud med varaktighet d. |
Definierar talegenskaps-ID:t. Har ändrats i version 1.4.0.
uppräkningsformat
| Värden | Beskrivningar |
|---|---|
| Enkel | |
| Detaljerad |
Utdataformat.
enum ProfanityOption
| Värden | Beskrivningar |
|---|---|
| Maskerade | Ersätter bokstäver med olämpliga ord med stjärntecken. |
| Avlägsnad | Tar bort olämpliga ord. |
| Rå | Gör inget med olämpliga ord. |
Tar bort svordomar (svordomar) eller ersätter bokstäver med profana ord med stjärnor. Har lagts till i version 1.5.0.
enum ResultReason
| Värden | Beskrivningar |
|---|---|
| Ingen matchning | Anger att tal inte kunde identifieras. Mer information finns i nomatchdetails-objektet. |
| Annullerad | Anger att igenkänningen avbröts. Mer information finns med hjälp av objektet CancellationDetails. |
| Igenkännande tal | Anger att talresultatet innehåller hypotestext. |
| IgenkäntTal | Anger att talresultatet innehåller slutlig text som har identifierats. Taligenkänningen är nu klar för den här frasen. |
| Känna igenIntent | Anger att avsiktsresultatet innehåller hypotestext och avsikt. |
| Erkänd avsikt | Anger att avsiktsresultatet innehåller slutlig text och avsikt. Taligenkänning och avsiktsbestämning är nu slutförda för den här frasen. |
| ÖversättningSpeech | Anger att översättningsresultatet innehåller hypotestext och dess översättningar. |
| Översatt tal | Anger att översättningsresultatet innehåller slutlig text och motsvarande översättningar. Taligenkänning och översättning är nu klara för den här frasen. |
| SyntetiseraAudio | Anger att det syntetiserade ljudresultatet innehåller en mängd ljuddata som inte är noll. |
| SynthesizingAudioCompleted (SyntetiserandeAudioSlutförd) | Anger att det syntetiserade ljudet nu är klart för den här frasen. |
| Känna igen nyckelord | Anger att talresultatet innehåller (overifierad) nyckelordstext. Har lagts till i version 1.3.0. |
| ErkäntNyckelord | Anger att nyckelordsigenkänningen har slutförts och att det angivna nyckelordet identifieras. Har lagts till i version 1.3.0. |
| SynthesizingAudioStarted (SyntetiserandeAudioStarted) | Anger att talsyntesen nu har startats Tillagd i version 1.4.0. |
| ÖversättningParticipantSpeech | Anger att transkriptionsresultatet innehåller hypotestext och dess översättningar för andra deltagare i konversationen. Har lagts till i version 1.8.0. |
| TranslatedParticipantSpeech (på engelska) | Anger att transkriptionsresultatet innehåller slutlig text och motsvarande översättningar för andra deltagare i konversationen. Taligenkänning och översättning är nu klara för den här frasen. Har lagts till i version 1.8.0. |
| TranslatedInstantMessage (Översatt direktmeddelande) | Anger att transkriptionsresultatet innehåller snabbmeddelandet och motsvarande översättningar. Har lagts till i version 1.8.0. |
| TranslatedParticipantInstantMessage (på engelska) | Anger att transkriptionsresultatet innehåller snabbmeddelandet för andra deltagare i konversationen och motsvarande översättningar. Har lagts till i version 1.8.0. |
| RegistreraVoiceProfile | Anger att röstprofilen registreras och att kunderna behöver skicka mer ljud för att skapa en röstprofil. Har lagts till i version 1.12.0. |
| EnrolledVoiceProfile (RegistreradRöstprofil) | Röstprofilen har registrerats. Har lagts till i version 1.12.0. |
| Erkända högtalare | Anger lyckad identifiering av vissa talare. Har lagts till i version 1.12.0. |
| Erkänd talare | Anger att en talare har verifierats. Har lagts till i version 1.12.0. |
| ResetVoiceProfile | Anger att en röstprofil har återställts. Har lagts till i version 1.12.0. |
| DeletedVoiceProfile (BorttagenRöstProfil) | Anger att en röstprofil har tagits bort. Har lagts till i version 1.12.0. |
| VoicesListRetrieved (RösterListaHämtad) | Anger att röstlistan har hämtats. Har lagts till i version 1.16.0. |
Anger möjliga orsaker till att ett igenkänningsresultat kan genereras.
uppräkning AnnulleringReason
| Värden | Beskrivningar |
|---|---|
| Fel | Anger att ett fel uppstod under taligenkänningen. |
| EndOfStream (Slut på ström) | Anger att slutet på ljudströmmen har nåtts. |
| CancelledByUser (AvbrutenAv Användare) | Anger att begäran avbröts av användaren. Har lagts till i version 1.14.0. |
Definierar möjliga orsaker till att ett igenkänningsresultat kan avbrytas.
uppräkning CancellationErrorCode
| Värden | Beskrivningar |
|---|---|
| Inget fel | Inget fel. Om CancellationReason är EndOfStream är CancellationErrorCode inställt på NoError. |
| AuthenticationFailure (AutentiseringMisslyckande) | Anger ett autentiseringsfel. Ett autentiseringsfel uppstår om prenumerationsnyckeln eller auktoriseringstoken är ogiltig, har upphört att gälla eller inte matchar den region som används. |
| Felaktig Begäran | Anger att en eller flera igenkänningsparametrar är ogiltiga eller att ljudformatet inte stöds. |
| För många förfrågningar | Anger att antalet parallella begäranden överskred antalet tillåtna samtidiga transkriptioner för prenumerationen. |
| Förbjuden | Anger att den kostnadsfria prenumeration som används av begäran tog slut på kvoten. |
| Anslutningsfel | Anger ett anslutningsfel. |
| ServiceTimeout (på engelska) | Anger ett timeout-fel vid väntan på svar från tjänsten. |
| Tjänstefel | Anger att ett fel returneras av tjänsten. |
| Tjänst otillgänglig | Anger att tjänsten för närvarande inte är tillgänglig. |
| RuntimeError | Anger ett oväntat körningsfel. |
| ServiceRedirectTemporär | Anger att Speech Service tillfälligt begär en återanslutning till en annan slutpunkt. |
| ServiceRedirectPermanent | Anger att Speech Service permanent begär en återanslutning till en annan slutpunkt. |
| EmbeddedModelError (EmbeddedModelError) | Anger att modellen för inbäddat tal (SR eller TTS) inte är tillgänglig eller skadad. |
Definierar felkod om AnnulleringReason är Fel. Har lagts till i version 1.1.0.
uppräkning NoMatchReason
| Värden | Beskrivningar |
|---|---|
| Inte igenkänd | Anger att tal identifierades, men inte kändes igen. |
| InitialSilenceTimeout (InitialSilenceTimeout) | Anger att starten av ljudströmmen endast innehöll tystnad och att tjänstens tidsgräns överst i väntan på tal. |
| InitialBabbleTimeout (InitialBabbleTimeout) | Anger att starten av ljudströmmen endast innehöll brus, och att tjänstens tidsgräns överst i väntan på tal. |
| KeywordNotRecognized | Anger att det upptäckta nyckelordet har avvisats av nyckelordsverifieringstjänsten. Har lagts till i version 1.5.0. |
| EndSilenceTimeout | Anger att ljudströmmen endast innehöll tystnad efter den senast identifierade frasen. |
Definierar möjliga orsaker till att ett igenkänningsresultat kanske inte identifieras.
enum ActivityJSONType
| Värden | Beskrivningar |
|---|---|
| Noll | |
| Objekt | |
| Samling | |
| Sträng | |
| Dubbel | |
| UInt | |
| Int | |
| Boolesk |
Definierar möjliga typer för ett aktivitets-json-värde. Har lagts till i version 1.5.0.
enum SpeechSynthesisOutputFormat
| Värden | Beskrivningar |
|---|---|
| Raw8Khz8BitMonoMULaw | rå-8khz-8bit-mono-mulaw |
| Riff16Khz16KbpsMonoSiren | riff-16khz-16kbps-mono-siren Stöds inte av tjänsten. Använd inte det här värdet. |
| Ljud16Khz16KbpsMonoSiren | audio-16khz-16kbps-mono-siren Stöds inte av tjänsten. Använd inte det här värdet. |
| Ljud16Khz32KBitRateMonoMp3 | ljud-16khz-32kbitrate-mono-mp3 |
| Ljud16Khz128KBitRateMonoMp3 | ljud-16khz-128kbitrate-mono-mp3 |
| Ljud16Khz64KBitRateMonoMp3 | ljud-16khz-64kbitrate-mono-mp3 |
| Ljud24Khz48KBitRateMonoMp3 | ljud-24khz-48kbitrate-mono-mp3 |
| Ljud24Khz96KBitRateMonoMp3 | ljud-24khz-96kbitrate-mono-mp3 |
| Ljud24Khz160KBitRateMonoMp3 | audio-24khz-160kbit/s-mono-mp3 |
| Raw16Khz16BitMonoTrueSilk | RAW-16kHz-16bit-mono-truesilk |
| Riff16Khz16BitMonoPcm | riff-16khz-16bit-mono-pcm |
| Riff8Khz16BitMonoPcm | riff-8khz-16bit-mono-pcm |
| Riff24Khz16BitMonoPcm | riff-24 kHz-16 bit-mono-PCM |
| Riff8Khz8BitMonoMULaw | riff-8khz-8bit-mono-mulaw |
| Raw16Khz16BitMonoPcm | RAW-16khz-16bit-mono-pcm |
| Raw24Khz16BitMonoPcm | RAW-24khz-16bit-mono-pcm |
| Raw8Khz16BitMonoPcm | RAW-8khz-16bit-mono-pcm |
| Ogg16Khz16BitMonoOpus | OGG-16khz-16bit-mono-opus |
| Ogg24Khz16BitMonoOpus | OGG-24khz-16bit-mono-opus |
| Raw48Khz16BitMonoPcm | RAW-48khz-16bit-mono-pcm |
| Riff48Khz16BitMonoPcm | riff-48khz-16bit-mono-pcm |
| Ljud48Khz96KBitRateMonoMp3 | ljud-48khz-96kbitrate-mono-mp3 |
| Ljud48Khz192KBitRateMonoMp3 | audio - 48 kHz - 192 kbit/s - mono - mp3 |
| Ogg48Khz16BitMonoOpus | ogg-48khz-16bit-mono-opus Tillagd i version 1.16.0 |
| Webm16Khz16BitMonoOpus | webm-16khz-16bit-mono-opus har lagts till i version 1.16.0 |
| Webm24Khz16BitMonoOpus | webm-24khz-16bit-mono-opus Har lagts till i version 1.16.0 |
| Raw24Khz16BitMonoTrueSilk | raw-24khz-16bit-mono-truesilk Tillagd i version 1.17.0 |
| Raw8Khz8BitMonoALaw | raw-8khz-8bit-mono-alaw Tillagd i version 1.17.0 |
| Riff8Khz8BitMonoALaw | riff-8khz-8bit-mono-alaw tillagd i version 1.17.0 |
| Webm24Khz16Bit24KbpsMonoOpus | webm-24khz-16bit-24kbps-mono-opus Audio komprimerat av OPUS codec i en WebM-container, med bithastighet på 24 kbit/s, optimerat för IoT-scenario. (Lades till i 1.19.0) |
| Ljud16Khz16Bit32KbpsMonoOpus | audio-16khz-16bit-32kbps-mono-opus Audio komprimerat av OPUS codec utan container, med bithastighet på 32kbps. (Lades till i 1.20.0) |
| Ljud24Khz16Bit48KbpsMonoOpus | audio-24khz-16bit-48kbps-mono-opus Audio komprimerat av OPUS codec utan container, med bithastighet på 48kbps. (Lades till i 1.20.0) |
| Ljud24Khz16Bit24KbpsMonoOpus | audio-24khz-16bit-24kbps-mono-opus Audio komprimerat av OPUS codec utan container, med bithastighet på 24kbps. (Lades till i 1.20.0) |
| Raw22050Hz16BitMonoPcm | raw-22050hz-16bit-mono-pcm Raw PCM-ljud vid 22050Hz samplingshastighet och 16-bitars djup. (Lades till i 1.22.0) |
| Riff22050Hz16BitMonoPcm | riff-22050hz-16bit-mono-pcm PCM-ljud vid 22050Hz samplingshastighet och 16-bitars djup, med RIFF-huvud. (Lades till i 1.22.0) |
| Raw44100Hz16BitMonoPcm | raw-44100hz-16bit-mono-pcm Raw PCM ljud vid 44100Hz samplingshastighet och 16-bitars djup. (Lades till i 1.22.0) |
| Riff44100Hz16BitMonoPcm | riff-44100hz-16bit-mono-pcm PCM ljud vid 44100Hz samplingshastighet och 16-bitars djup, med RIFF-huvud. (Lades till i 1.22.0) |
| AmrWb16000Hz | amr-wb-16000hz AMR-WB ljud vid 16kHz samplingshastighet. (Lades till i 1.24.0) |
| G72216Khz64Kbps | g722-16khz-64kbps G.722 ljud vid 16kHz samplingshastighet och 64kbps bithastighet. (Lades till i 1.38.0) |
Definierar möjliga ljudformat för talsyntesutdata. Uppdaterad i version 1.19.0.
enum StreamStatus
| Värden | Beskrivningar |
|---|---|
| Okänd | Statusen för ljuddataströmmen är okänd. |
| IngenData | Ljuddataströmmen innehåller inga data. |
| Partiella data (partialData) | Ljuddataströmmen innehåller partiella data från en talarbegäran. |
| AllData (på engelska) | Ljuddataströmmen innehåller alla data i en talarbegäran. |
| Annullerad | Ljuddataströmmen avbröts. |
Definierar den möjliga statusen för ljuddataströmmen. Har lagts till i version 1.4.0.
uppräkning ServicePropertyChannel
| Värden | Beskrivningar |
|---|---|
| UriQueryParameter (på engelska) | Använder URI-frågeparameter för att skicka egenskapsinställningar till tjänsten. |
| HttpHeader (på engelska) | Använder HttpHeader för att ange en nyckel/ett värde i ett HTTP-huvud. |
Definierar kanaler som används för att skicka egenskapsinställningar till tjänsten. Har lagts till i version 1.5.0.
enum VoiceProfileType
| Värden | Beskrivningar |
|---|---|
| TextIndependentIdentification (på engelska) | Textoberoende talaridentifiering. |
| TextDependentVerification (på engelska) | Textberoende talarverifiering. |
| TextIndependentVerification (på engelska) | Oberoende textverifiering. |
Definierar röstprofiltyper.
enum RecognitionFactorScope
| Värden | Beskrivningar |
|---|---|
| Partiell fras | En igenkänningsfaktor gäller för grammatiker som kan refereras till som enskilda partiella fraser. |
Definierar omfånget som en igenkänningsfaktor tillämpas på.
enum PronunciationAssessmentGradingSystem
| Värden | Beskrivningar |
|---|---|
| Fempunktsmeny | Fempunktskalibrering. |
| Hundrastämplar | Hundra mark. |
Definierar punktsystemet för uttalspoängkalibrering; standardvärdet är FivePoint. Har lagts till i version 1.14.0.
enum PronunciationAssessmentGranularity
| Värden | Beskrivningar |
|---|---|
| Fonem | Visar poängen för den fullständiga text-, ord- och fonemnivån. |
| Ord | Visar poängen på den fullständiga text- och ordnivån. |
| Fulltext | Visar endast poängen på den fullständiga textnivån. |
Definierar uttalsutvärderingens kornighet; standardvärdet är Phoneme. Har lagts till i version 1.14.0.
enum SynthesisVoiceType
| Värden | Beskrivningar |
|---|---|
| UppkoppladNeural | Neural röst online. |
| OnlineStandard (på engelska) | Standardröst online. |
| OfflineNeural (OfflineNeural) | Neural röst offline. |
| OfflineStandard (på engelska) | Standardröst offline. |
Definierar typen av syntesröster som lagts till i version 1.16.0.
uppräkning SynthesisVoiceGender
| Värden | Beskrivningar |
|---|---|
| Okänd | Kön okänt. |
| Kvinnlig | Kvinnlig röst. |
| Manlig | Mansröst. |
| Neutral | Neutral röst. |
Definierar könet för syntesröster som lagts till i version 1.17.0.
enum SynthesisVoiceStatus
| Värden | Beskrivningar |
|---|---|
| Okänd | Röststatus okänd. |
| AllmäntTillgänglighet | Röst är allmänt tillgängligt. |
| Förhandsvisning | Röst är i förhandsversion. |
| Avrådes från användning | Röst är inaktuell, använd inte. |
Definierar status för syntesröster.
uppräkning SpeechSynthesisBoundaryType
| Värden | Beskrivningar |
|---|---|
| Ord | Ordgräns. |
| Interpunktion | Skiljeteckengräns. |
| Mening | Meningsgräns. |
Definierar gränstypen för talsyntesgränshändelsen Som lagts till i version 1.21.0.
Strategi för uppräkning av segmentering
| Värden | Beskrivningar |
|---|---|
| Standard | Använd standardstrategin och inställningarna som bestäms av Speech Service. Används i de flesta situationer. |
| Tid | Använder en tidsbaserad strategi där mängden tystnad mellan tal används för att avgöra när ett slutligt resultat ska genereras. |
| Semantisk | Använder en AI-modell för att avskräcka från slutet av en talad fras baserat på frasens innehåll. |
Den strategi som används för att avgöra när en talad fras har avslutats och ett slutligt identifierat resultat ska genereras. Tillåtna värden är "Default", "Time" och "Semantic".