Anteckning
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
I följande tabell visas de mått som är tillgängliga för resurstypen Microsoft.CognitiveServices/accounts/projects.
Tabellrubriker
Metrik – Det är namnet på metrikdisplayen som visas i Azure-portalen.
Namn i REST API - Metrikens namn som det refereras till i REST API.
Enhet – måttenhet.
Sammansättning – standardaggregeringstypen. Giltiga värden: Genomsnitt, Minimum, Maximum, Totalt, Antal.
Mått - Tillgängliga dimensioner för måttet.
Tidspann - Tidsintervall då mätvärden samplas. Till exempel, PT1M indikerar att metriska provtagningar sker varje minut, PT30M varje 30 minuter, PT1H varje timme, och så vidare.
DS Export - Om metriken kan exporteras till Azure Monitor Logs via diagnostikinställningar.
För information om hur du exporterar mätvärden, se - Exportera mätvärden med hjälp av datainsamlingsregler och Skapa diagnostikinställningar i Azure Monitor.
För information om lagring av metrik, se Azure Monitor Metrics-översikten.
Kategori: AI-agenter
| Mätvärde | Namn i REST API | Enhet | Aggregation | Mått | Tidkornen | DSExport |
|---|---|---|---|---|---|---|
|
Agenthändelser (förhandsversion) Antal händelser för AI-agenter i det här projektet. |
AgentEvents |
Räkna | Count, Total (Sum), Average, Maximum, Minimum | EventType |
PT1M | Nej |
|
Indatatoken för agent (förhandsversion) Antal indatatoken för AI-agenter i det här projektet. |
AgentInputTokens |
Räkna | Totalt (summa), genomsnitt, max, minimum |
AgentId, ModelNameTokenType |
PT1M | Nej |
|
Agentanvändarmeddelanden (förhandsversion) Antal händelser för AI Agent-användarmeddelanden i det här projektet. |
AgentMessages |
Räkna | Count, Total (Sum), Average, Maximum, Minimum |
EventType, ThreadId |
PT1M | Nej |
|
Agentutdatatoken (förhandsversion) Antal utdatatoken för AI-agenter i det här projektet. |
AgentOutputTokens |
Räkna | Totalt (summa), genomsnitt, max, minimum |
AgentId, ModelNameTokenType |
PT1M | Nej |
|
Agentsvar (förhandsversion) Antal svar från AI-agenter i det här projektet. |
AgentResponses |
Räkna | Count, Total (Sum), Average, Maximum, Minimum |
AgentId, ModelNameResponseStatus |
PT1M | Nej |
|
Agentkörningar (förhandsversion) Antal körningar av AI-agenter i det här projektet. |
AgentRuns |
Räkna | Count, Total (Sum), Average, Maximum, Minimum |
AgentId, ModelName, RunStatus, StatusCode, ThreadIdStreamType |
PT1M | Nej |
|
Agenttrådar (förhandsversion) Antal händelser för AI Agent-trådar i det här projektet. |
AgentThreads |
Räkna | Count, Total (Sum), Average, Maximum, Minimum | EventType |
PT1M | Nej |
|
Agentverktygsanrop (förhandsversion) Antal verktygsanrop som görs av AI-agenter i det här projektet. |
AgentToolCalls |
Räkna | Count, Total (Sum), Average, Maximum, Minimum |
AgentId, ModelNameToolName |
PT1M | Nej |
|
Indexerade filer för agentanvändning (förhandsversion) Antal filer som indexerats för AI Agent-användning, t.ex. hämtning i det här projektet. |
AgentUsageIndexedFiles |
Räkna | Count, Total (Sum), Average, Maximum, Minimum |
ErrorCode, StatusVectorStoreId |
PT1M | Nej |
Kategori: Modeller – HTTP-begäranden
| Mätvärde | Namn i REST API | Enhet | Aggregation | Mått | Tidkornen | DSExport |
|---|---|---|---|---|---|---|
|
Tillgänglighetsfrekvens för modell Tillgänglighetsprocent med följande beräkning: (Totalt antal anrop – serverfel)/Totalt antal anrop. Serverfel omfattar alla HTTP-svar >=500. |
ModelAvailabilityRate |
Procent | Minimi, Maximi, Genomsnitt |
Region, ModelDeploymentName, , ModelNameModelVersion |
PT1M | Nej |
|
Modellbegäranden Antal anrop till modell-API:et under en viss tidsperiod. Gäller för PTU, PTU-hanterade och betala-vid-användning-installationer. |
ModelRequests |
Räkna | Totalt (Summa) |
ApiName, OperationName, Region, StreamType, ModelDeploymentName, , ModelName, , ModelVersionStatusCode |
PT1M | Yes |
Kategori: Modeller – svarstid
| Mätvärde | Namn i REST API | Enhet | Aggregation | Mått | Tidkornen | DSExport |
|---|---|---|---|---|---|---|
|
Tid mellan token För strömningsbegäranden; Modelltokens genereringshastighet, mätt i millisekunder. Gäller för PTU- och PTU-hanterade distributioner. |
NormalizedTimeBetweenTokens |
Millisekunder | Maximalt, Minsta, Genomsnitt |
ApiName, OperationName, Region, StreamType, ModelDeploymentName, , , ModelNameModelVersion |
PT1M | Yes |
|
Normaliserad tid till första byte För begäranden om direkt- och indirekt uppspelning; tiden det tar att ta emot den första byten av svarsdata efter att begäran har gjorts av modellen, normaliserad per token. Gäller för PTU-, PTU-hanterade och "Pay-as-you-go"-distributioner. |
NormalizedTimeToFirstToken |
Millisekunder | Maximalt, Minsta, Genomsnitt |
ApiName, OperationName, Region, StreamType, ModelDeploymentName, , , ModelNameModelVersion |
PT1M | Yes |
|
Tid till sista byte För begäranden om direktuppspelning och icke-direktuppspelning; tiden det tar för det sista bytet av svarsinformation att tas emot efter att begäran har gjorts av modellen. Gäller för PTU-, PTU-hanterade och "Pay-as-you-go"-distributioner. |
TimeToLastByte |
Millisekunder | Maximalt, Minsta, Genomsnitt |
ApiName, OperationName, Region, StreamType, ModelDeploymentName, , , ModelNameModelVersion |
PT1M | Yes |
|
Tid till svar Rekommenderat svarstidsmått (svarstid) för strömningsbegäranden. Gäller för PTU- och PTU-hanterade distributioner. Beräknas som den tid det tar för det första svaret att visas när en användare skickar en uppmaning, mätt med API-gatewayen. Det här antalet ökar när promptens storlek ökar och/eller cacheträffens storlek minskar. Om du vill dela upp tid för svarsmått kan du lägga till ett filter eller tillämpa delning med följande dimensioner: ModelDeploymentName, ModelName och ModelVersion. Obs! Det här måttet är en uppskattning eftersom den uppmätta svarstiden är starkt beroende av flera faktorer, inklusive samtidiga anrop och övergripande arbetsbelastningsmönster. Dessutom tar den inte hänsyn till några svarstider på klientsidan som kan finnas mellan klienten och API-slutpunkten. Se din egen loggning för optimal svarstidsspårning. |
TimeToResponse |
Millisekunder | Minimi, Maximi, Genomsnitt |
ApiName, OperationName, Region, StreamType, ModelDeploymentName, , ModelName, , ModelVersionStatusCode |
PT1M | Yes |
|
Token per sekund Räknar upp generationshastigheten för ett visst modellsvar. Det totala antalet token som genereras divideras med tiden för att generera token i sekunder. Gäller för PTU- och PTU-hanterade distributioner. |
TokensPerSecond |
Räkna | Maximalt, Minsta, Genomsnitt |
ApiName, OperationName, Region, StreamType, ModelDeploymentName, , , ModelNameModelVersion |
PT1M | Yes |
Kategori: Modeller – Användning
| Mätvärde | Namn i REST API | Enhet | Aggregation | Mått | Tidkornen | DSExport |
|---|---|---|---|---|---|---|
|
Ljudindatatoken Antal token för ljudprompt som bearbetas (indata) på en OpenAI-modell. Gäller för PTU-hanterade modelldistributioner. |
AudioInputTokens |
Räkna | Totalt (Summa) |
ModelDeploymentName, ModelName, , ModelVersionRegion |
PT1M | Yes |
|
Ljudutdatatoken Antal ljudprompttoken som genererats (utdata) på en OpenAI-modell. Gäller för PTU-hanterade modelldistributioner. |
AudioOutputTokens |
Räkna | Totalt (Summa) |
ModelDeploymentName, ModelName, , ModelVersionRegion |
PT1M | Yes |
|
Indatatokenerna Antal bearbetade prompttoken (indata) för en modell. Gäller för PTU, PTU-hanterade och betala-vid-användning-installationer. |
InputTokens |
Räkna | Totalt (Summa) |
ApiName, Region, ModelDeploymentName, , , ModelNameModelVersion |
PT1M | Yes |
|
Utdatatoken Antal token som genererats (utdata) från en OpenAI-modell. Gäller för PTU, PTU-hanterade och betala-vid-användning-installationer. |
OutputTokens |
Räkna | Totalt (Summa) |
ApiName, Region, ModelDeploymentName, , , ModelNameModelVersion |
PT1M | Yes |
|
Etablerad användning Användningsprocent för en provisionerat hanterad distribution, beräknad som (PTU:er förbrukade/PTU:er distribuerade) x 100. När användningen är större än eller lika med 100 % begränsas anropen och felkoden 429 returneras. |
ProvisionedUtilization |
Procent | Minimi, Maximi, Genomsnitt |
Region, ModelDeploymentName, , ModelNameModelVersion |
PT1M | Nej |
|
Totalt antal token Antal slutsatsdragningstoken som bearbetas på en modell. Beräknas som prompt-token (inmatningsdata) plus genererade token (utmatningsdata). Gäller för PTU, PTU-hanterade och betala-vid-användning-installationer. |
TotalTokens |
Räkna | Totalt (Summa) |
ApiName, Region, ModelDeploymentName, , , ModelNameModelVersion |
PT1M | Yes |