Dela via


Mått som stöds för Microsoft.CognitiveServices/accounts/projects

I följande tabell visas de mått som är tillgängliga för resurstypen Microsoft.CognitiveServices/accounts/projects.

Tabellrubriker

Metrik – Det är namnet på metrikdisplayen som visas i Azure-portalen.
Namn i REST API - Metrikens namn som det refereras till i REST API.
Enhet – måttenhet.
Sammansättning – standardaggregeringstypen. Giltiga värden: Genomsnitt, Minimum, Maximum, Totalt, Antal.
Mått - Tillgängliga dimensioner för måttet.
Tidspann - Tidsintervall då mätvärden samplas. Till exempel, PT1M indikerar att metriska provtagningar sker varje minut, PT30M varje 30 minuter, PT1H varje timme, och så vidare.
DS Export - Om metriken kan exporteras till Azure Monitor Logs via diagnostikinställningar.

För information om hur du exporterar mätvärden, se - Exportera mätvärden med hjälp av datainsamlingsregler och Skapa diagnostikinställningar i Azure Monitor.

För information om lagring av metrik, se Azure Monitor Metrics-översikten.

Kategori: AI-agenter

Mätvärde Namn i REST API Enhet Aggregation Mått Tidkornen DSExport
Agenthändelser (förhandsversion)

Antal händelser för AI-agenter i det här projektet.
AgentEvents Räkna Count, Total (Sum), Average, Maximum, Minimum EventType PT1M Nej
Indatatoken för agent (förhandsversion)

Antal indatatoken för AI-agenter i det här projektet.
AgentInputTokens Räkna Totalt (summa), genomsnitt, max, minimum AgentId, ModelNameTokenType PT1M Nej
Agentanvändarmeddelanden (förhandsversion)

Antal händelser för AI Agent-användarmeddelanden i det här projektet.
AgentMessages Räkna Count, Total (Sum), Average, Maximum, Minimum EventType, ThreadId PT1M Nej
Agentutdatatoken (förhandsversion)

Antal utdatatoken för AI-agenter i det här projektet.
AgentOutputTokens Räkna Totalt (summa), genomsnitt, max, minimum AgentId, ModelNameTokenType PT1M Nej
Agentsvar (förhandsversion)

Antal svar från AI-agenter i det här projektet.
AgentResponses Räkna Count, Total (Sum), Average, Maximum, Minimum AgentId, ModelNameResponseStatus PT1M Nej
Agentkörningar (förhandsversion)

Antal körningar av AI-agenter i det här projektet.
AgentRuns Räkna Count, Total (Sum), Average, Maximum, Minimum AgentId, ModelName, RunStatus, StatusCode, ThreadIdStreamType PT1M Nej
Agenttrådar (förhandsversion)

Antal händelser för AI Agent-trådar i det här projektet.
AgentThreads Räkna Count, Total (Sum), Average, Maximum, Minimum EventType PT1M Nej
Agentverktygsanrop (förhandsversion)

Antal verktygsanrop som görs av AI-agenter i det här projektet.
AgentToolCalls Räkna Count, Total (Sum), Average, Maximum, Minimum AgentId, ModelNameToolName PT1M Nej
Indexerade filer för agentanvändning (förhandsversion)

Antal filer som indexerats för AI Agent-användning, t.ex. hämtning i det här projektet.
AgentUsageIndexedFiles Räkna Count, Total (Sum), Average, Maximum, Minimum ErrorCode, StatusVectorStoreId PT1M Nej

Kategori: Modeller – HTTP-begäranden

Mätvärde Namn i REST API Enhet Aggregation Mått Tidkornen DSExport
Tillgänglighetsfrekvens för modell

Tillgänglighetsprocent med följande beräkning: (Totalt antal anrop – serverfel)/Totalt antal anrop. Serverfel omfattar alla HTTP-svar >=500.
ModelAvailabilityRate Procent Minimi, Maximi, Genomsnitt Region, ModelDeploymentName, , ModelNameModelVersion PT1M Nej
Modellbegäranden

Antal anrop till modell-API:et under en viss tidsperiod. Gäller för PTU, PTU-hanterade och betala-vid-användning-installationer.
ModelRequests Räkna Totalt (Summa) ApiName, OperationName, Region, StreamType, ModelDeploymentName, , ModelName, , ModelVersionStatusCode PT1M Yes

Kategori: Modeller – svarstid

Mätvärde Namn i REST API Enhet Aggregation Mått Tidkornen DSExport
Tid mellan token

För strömningsbegäranden; Modelltokens genereringshastighet, mätt i millisekunder. Gäller för PTU- och PTU-hanterade distributioner.
NormalizedTimeBetweenTokens Millisekunder Maximalt, Minsta, Genomsnitt ApiName, OperationName, Region, StreamType, ModelDeploymentName, , , ModelNameModelVersion PT1M Yes
Normaliserad tid till första byte

För begäranden om direkt- och indirekt uppspelning; tiden det tar att ta emot den första byten av svarsdata efter att begäran har gjorts av modellen, normaliserad per token. Gäller för PTU-, PTU-hanterade och "Pay-as-you-go"-distributioner.
NormalizedTimeToFirstToken Millisekunder Maximalt, Minsta, Genomsnitt ApiName, OperationName, Region, StreamType, ModelDeploymentName, , , ModelNameModelVersion PT1M Yes
Tid till sista byte

För begäranden om direktuppspelning och icke-direktuppspelning; tiden det tar för det sista bytet av svarsinformation att tas emot efter att begäran har gjorts av modellen. Gäller för PTU-, PTU-hanterade och "Pay-as-you-go"-distributioner.
TimeToLastByte Millisekunder Maximalt, Minsta, Genomsnitt ApiName, OperationName, Region, StreamType, ModelDeploymentName, , , ModelNameModelVersion PT1M Yes
Tid till svar

Rekommenderat svarstidsmått (svarstid) för strömningsbegäranden. Gäller för PTU- och PTU-hanterade distributioner. Beräknas som den tid det tar för det första svaret att visas när en användare skickar en uppmaning, mätt med API-gatewayen. Det här antalet ökar när promptens storlek ökar och/eller cacheträffens storlek minskar. Om du vill dela upp tid för svarsmått kan du lägga till ett filter eller tillämpa delning med följande dimensioner: ModelDeploymentName, ModelName och ModelVersion.

Obs! Det här måttet är en uppskattning eftersom den uppmätta svarstiden är starkt beroende av flera faktorer, inklusive samtidiga anrop och övergripande arbetsbelastningsmönster. Dessutom tar den inte hänsyn till några svarstider på klientsidan som kan finnas mellan klienten och API-slutpunkten. Se din egen loggning för optimal svarstidsspårning.
TimeToResponse Millisekunder Minimi, Maximi, Genomsnitt ApiName, OperationName, Region, StreamType, ModelDeploymentName, , ModelName, , ModelVersionStatusCode PT1M Yes
Token per sekund

Räknar upp generationshastigheten för ett visst modellsvar. Det totala antalet token som genereras divideras med tiden för att generera token i sekunder. Gäller för PTU- och PTU-hanterade distributioner.
TokensPerSecond Räkna Maximalt, Minsta, Genomsnitt ApiName, OperationName, Region, StreamType, ModelDeploymentName, , , ModelNameModelVersion PT1M Yes

Kategori: Modeller – Användning

Mätvärde Namn i REST API Enhet Aggregation Mått Tidkornen DSExport
Ljudindatatoken

Antal token för ljudprompt som bearbetas (indata) på en OpenAI-modell. Gäller för PTU-hanterade modelldistributioner.
AudioInputTokens Räkna Totalt (Summa) ModelDeploymentName, ModelName, , ModelVersionRegion PT1M Yes
Ljudutdatatoken

Antal ljudprompttoken som genererats (utdata) på en OpenAI-modell. Gäller för PTU-hanterade modelldistributioner.
AudioOutputTokens Räkna Totalt (Summa) ModelDeploymentName, ModelName, , ModelVersionRegion PT1M Yes
Indatatokenerna

Antal bearbetade prompttoken (indata) för en modell. Gäller för PTU, PTU-hanterade och betala-vid-användning-installationer.
InputTokens Räkna Totalt (Summa) ApiName, Region, ModelDeploymentName, , , ModelNameModelVersion PT1M Yes
Utdatatoken

Antal token som genererats (utdata) från en OpenAI-modell. Gäller för PTU, PTU-hanterade och betala-vid-användning-installationer.
OutputTokens Räkna Totalt (Summa) ApiName, Region, ModelDeploymentName, , , ModelNameModelVersion PT1M Yes
Etablerad användning

Användningsprocent för en provisionerat hanterad distribution, beräknad som (PTU:er förbrukade/PTU:er distribuerade) x 100. När användningen är större än eller lika med 100 % begränsas anropen och felkoden 429 returneras.
ProvisionedUtilization Procent Minimi, Maximi, Genomsnitt Region, ModelDeploymentName, , ModelNameModelVersion PT1M Nej
Totalt antal token

Antal slutsatsdragningstoken som bearbetas på en modell. Beräknas som prompt-token (inmatningsdata) plus genererade token (utmatningsdata). Gäller för PTU, PTU-hanterade och betala-vid-användning-installationer.
TotalTokens Räkna Totalt (Summa) ApiName, Region, ModelDeploymentName, , , ModelNameModelVersion PT1M Yes

Nästa steg