Foundry Agent Token consuption

alejandro piccardo 60 Reputation points
2025-10-03T19:18:15.83+00:00

Analizando el alto consumo de mi agente:

User's image entre otros problemas...
vimos que luego de una conversación. (la cual ya consumió más tokens de los que deberia)
y la continuamos con un saludo "hola"
la conversación consume 17mil tokens algo inviable.

mi system prompt pesa aprox. 3mil tokens junto con las tools descriptions

debe haber un problema en la gestión del historial (interno de foundry agents)
en donde por cada msg pasado se envie mil datos mas...
se debe estar enviando , por cada mensaje del historial:

  • input/ outputs
  • tool outputs generadas

el problema es que en cada run step del agent loop deben estar subiendo todo

dado que modelos como 4.1 actualmente tienen el rate limiter en 50k tokens per minute con que 3 users envien msg de este estilo . Saltaria un error.

pd:csv son cargados directamente a code interpreter, no son procesados por el llm

Azure OpenAI Service
Azure OpenAI Service
An Azure service that provides access to OpenAI’s GPT-3 models with enterprise capabilities.
{count} votes

Your answer

Answers can be marked as 'Accepted' by the question author and 'Recommended' by moderators, which helps users know the answer solved the author's problem.