Mått som stöds för Microsoft.CognitiveServices/accounts/projects

2025-10-31

I följande tabell visas de mått som är tillgängliga för resurstypen Microsoft.CognitiveServices/accounts/projects.

Tabellrubriker

Metrik – Det är namnet på metrikdisplayen som visas i Azure-portalen.
Namn i REST API - Metrikens namn som det refereras till i REST API.
Enhet – måttenhet.
Sammansättning – standardaggregeringstypen. Giltiga värden: Genomsnitt, Minimum, Maximum, Totalt, Antal.
Mått - Tillgängliga dimensioner för måttet.
Tidspann - Tidsintervall då mätvärden samplas. Till exempel, PT1M indikerar att metriska provtagningar sker varje minut, PT30M varje 30 minuter, PT1H varje timme, och så vidare.
DS Export - Om metriken kan exporteras till Azure Monitor Logs via diagnostikinställningar.

För information om hur du exporterar mätvärden, se - Exportera mätvärden med hjälp av datainsamlingsregler och Skapa diagnostikinställningar i Azure Monitor.

För information om lagring av metrik, se Azure Monitor Metrics-översikten.

Kategori: AI-agenter

Mätvärde	Namn i REST API	Enhet	Aggregation	Mått	Tidkornen	DSExport
Agenthändelser (förhandsversion) Antal händelser för AI-agenter i det här projektet.	`AgentEvents`	Räkna	Count, Total (Sum), Average, Maximum, Minimum	`EventType`	PT1M	Nej
Indatatoken för agent (förhandsversion) Antal indatatoken för AI-agenter i det här projektet.	`AgentInputTokens`	Räkna	Totalt (summa), genomsnitt, max, minimum	`AgentId`, `ModelNameTokenType`	PT1M	Nej
Agentanvändarmeddelanden (förhandsversion) Antal händelser för AI Agent-användarmeddelanden i det här projektet.	`AgentMessages`	Räkna	Count, Total (Sum), Average, Maximum, Minimum	`EventType`, `ThreadId`	PT1M	Nej
Agentutdatatoken (förhandsversion) Antal utdatatoken för AI-agenter i det här projektet.	`AgentOutputTokens`	Räkna	Totalt (summa), genomsnitt, max, minimum	`AgentId`, `ModelNameTokenType`	PT1M	Nej
Agentsvar (förhandsversion) Antal svar från AI-agenter i det här projektet.	`AgentResponses`	Räkna	Count, Total (Sum), Average, Maximum, Minimum	`AgentId`, `ModelNameResponseStatus`	PT1M	Nej
Agentkörningar (förhandsversion) Antal körningar av AI-agenter i det här projektet.	`AgentRuns`	Räkna	Count, Total (Sum), Average, Maximum, Minimum	`AgentId`, `ModelName`, `RunStatus`, `StatusCode`, `ThreadIdStreamType`	PT1M	Nej
Agenttrådar (förhandsversion) Antal händelser för AI Agent-trådar i det här projektet.	`AgentThreads`	Räkna	Count, Total (Sum), Average, Maximum, Minimum	`EventType`	PT1M	Nej
Agentverktygsanrop (förhandsversion) Antal verktygsanrop som görs av AI-agenter i det här projektet.	`AgentToolCalls`	Räkna	Count, Total (Sum), Average, Maximum, Minimum	`AgentId`, `ModelNameToolName`	PT1M	Nej
Indexerade filer för agentanvändning (förhandsversion) Antal filer som indexerats för AI Agent-användning, t.ex. hämtning i det här projektet.	`AgentUsageIndexedFiles`	Räkna	Count, Total (Sum), Average, Maximum, Minimum	`ErrorCode`, `StatusVectorStoreId`	PT1M	Nej

Kategori: Modeller – HTTP-begäranden

Mätvärde	Namn i REST API	Enhet	Aggregation	Mått	Tidkornen	DSExport
Tillgänglighetsfrekvens för modell Tillgänglighetsprocent med följande beräkning: (Totalt antal anrop – serverfel)/Totalt antal anrop. Serverfel omfattar alla HTTP-svar >=500.	`ModelAvailabilityRate`	Procent	Minimi, Maximi, Genomsnitt	`Region`, `ModelDeploymentName`, , `ModelNameModelVersion`	PT1M	Nej
Modellbegäranden Antal anrop till modell-API:et under en viss tidsperiod. Gäller för PTU, PTU-hanterade och betala-vid-användning-installationer.	`ModelRequests`	Räkna	Totalt (Summa)	`ApiName`, `OperationName`, `Region`, `StreamType`, `ModelDeploymentName`, , `ModelName`, , `ModelVersionStatusCode`	PT1M	Yes

Kategori: Modeller – svarstid

Mätvärde	Namn i REST API	Enhet	Aggregation	Mått	Tidkornen	DSExport
Tid mellan token För strömningsbegäranden; Modelltokens genereringshastighet, mätt i millisekunder. Gäller för PTU- och PTU-hanterade distributioner.	`NormalizedTimeBetweenTokens`	Millisekunder	Maximalt, Minsta, Genomsnitt	`ApiName`, `OperationName`, `Region`, `StreamType`, `ModelDeploymentName`, , , `ModelNameModelVersion`	PT1M	Yes
Normaliserad tid till första byte För begäranden om direkt- och indirekt uppspelning; tiden det tar att ta emot den första byten av svarsdata efter att begäran har gjorts av modellen, normaliserad per token. Gäller för PTU-, PTU-hanterade och "Pay-as-you-go"-distributioner.	`NormalizedTimeToFirstToken`	Millisekunder	Maximalt, Minsta, Genomsnitt	`ApiName`, `OperationName`, `Region`, `StreamType`, `ModelDeploymentName`, , , `ModelNameModelVersion`	PT1M	Yes
Tid till sista byte För begäranden om direktuppspelning och icke-direktuppspelning; tiden det tar för det sista bytet av svarsinformation att tas emot efter att begäran har gjorts av modellen. Gäller för PTU-, PTU-hanterade och "Pay-as-you-go"-distributioner.	`TimeToLastByte`	Millisekunder	Maximalt, Minsta, Genomsnitt	`ApiName`, `OperationName`, `Region`, `StreamType`, `ModelDeploymentName`, , , `ModelNameModelVersion`	PT1M	Yes
Tid till svar Rekommenderat svarstidsmått (svarstid) för strömningsbegäranden. Gäller för PTU- och PTU-hanterade distributioner. Beräknas som den tid det tar för det första svaret att visas när en användare skickar en uppmaning, mätt med API-gatewayen. Det här antalet ökar när promptens storlek ökar och/eller cacheträffens storlek minskar. Om du vill dela upp tid för svarsmått kan du lägga till ett filter eller tillämpa delning med följande dimensioner: ModelDeploymentName, ModelName och ModelVersion. Obs! Det här måttet är en uppskattning eftersom den uppmätta svarstiden är starkt beroende av flera faktorer, inklusive samtidiga anrop och övergripande arbetsbelastningsmönster. Dessutom tar den inte hänsyn till några svarstider på klientsidan som kan finnas mellan klienten och API-slutpunkten. Se din egen loggning för optimal svarstidsspårning.	`TimeToResponse`	Millisekunder	Minimi, Maximi, Genomsnitt	`ApiName`, `OperationName`, `Region`, `StreamType`, `ModelDeploymentName`, , `ModelName`, , `ModelVersionStatusCode`	PT1M	Yes
Token per sekund Räknar upp generationshastigheten för ett visst modellsvar. Det totala antalet token som genereras divideras med tiden för att generera token i sekunder. Gäller för PTU- och PTU-hanterade distributioner.	`TokensPerSecond`	Räkna	Maximalt, Minsta, Genomsnitt	`ApiName`, `OperationName`, `Region`, `StreamType`, `ModelDeploymentName`, , , `ModelNameModelVersion`	PT1M	Yes

Kategori: Modeller – Användning

Mätvärde	Namn i REST API	Enhet	Aggregation	Mått	Tidkornen	DSExport
Ljudindatatoken Antal token för ljudprompt som bearbetas (indata) på en OpenAI-modell. Gäller för PTU-hanterade modelldistributioner.	`AudioInputTokens`	Räkna	Totalt (Summa)	`ModelDeploymentName`, `ModelName`, , `ModelVersionRegion`	PT1M	Yes
Ljudutdatatoken Antal ljudprompttoken som genererats (utdata) på en OpenAI-modell. Gäller för PTU-hanterade modelldistributioner.	`AudioOutputTokens`	Räkna	Totalt (Summa)	`ModelDeploymentName`, `ModelName`, , `ModelVersionRegion`	PT1M	Yes
Indatatokenerna Antal bearbetade prompttoken (indata) för en modell. Gäller för PTU, PTU-hanterade och betala-vid-användning-installationer.	`InputTokens`	Räkna	Totalt (Summa)	`ApiName`, `Region`, `ModelDeploymentName`, , , `ModelNameModelVersion`	PT1M	Yes
Utdatatoken Antal token som genererats (utdata) från en OpenAI-modell. Gäller för PTU, PTU-hanterade och betala-vid-användning-installationer.	`OutputTokens`	Räkna	Totalt (Summa)	`ApiName`, `Region`, `ModelDeploymentName`, , , `ModelNameModelVersion`	PT1M	Yes
Etablerad användning Användningsprocent för en provisionerat hanterad distribution, beräknad som (PTU:er förbrukade/PTU:er distribuerade) x 100. När användningen är större än eller lika med 100 % begränsas anropen och felkoden 429 returneras.	`ProvisionedUtilization`	Procent	Minimi, Maximi, Genomsnitt	`Region`, `ModelDeploymentName`, , `ModelNameModelVersion`	PT1M	Nej
Totalt antal token Antal slutsatsdragningstoken som bearbetas på en modell. Beräknas som prompt-token (inmatningsdata) plus genererade token (utmatningsdata). Gäller för PTU, PTU-hanterade och betala-vid-användning-installationer.	`TotalTokens`	Räkna	Totalt (Summa)	`ApiName`, `Region`, `ModelDeploymentName`, , , `ModelNameModelVersion`	PT1M	Yes

Nästa steg

Feedback

Var den här sidan till hjälp?