Estatísticas e Monitoramento do Gateway de IA
O gateway de IA registra todas as requisições que passam por ele e apresenta informações de uso, custos e status operacional nas páginas de Visão Geral (Overview), Estatísticas (Statistics) e Monitoramento (Monitoring). Este artigo apresenta o conteúdo e o uso dessas três páginas.
Visão Geral (Overview)
A página de visão geral oferece um panorama do status global do gateway de IA:
- Cartões de KPIs — Número de canais ativos, número de chaves virtuais, requisições do dia, custo do dia (e uso de tokens).
- Saúde dos Canais — Status em tempo real de cada canal (normal / degradado / indisponível).
- Eventos Recentes — Fluxo dos eventos de roteamento mais recentes (tipo de evento, modelo, canal, latência, horário).
Esta página é ideal para verificar rapidamente se o gateway está operando normalmente, monitorar os gastos do dia e o volume de requisições.
Estatísticas (Statistics)
A página de estatísticas serve para análise detalhada de uso e custos.
Resumo dos KPIs
No topo da página, são exibidos os principais indicadores: total de requisições, total de tokens usados, custos (USD), latência média (ms).
Resumos e Agrupamentos
- Resumo geral — Total de requisições (com separação em bem-sucedidas e falhas), tokens de entrada / saída / total, média de tokens por requisição, custo total, além da distribuição por tipo de evento (roteamento normal routed, failover, falha failed, nenhum canal disponível no_channel).
- Agrupamentos por dimensões — É possível selecionar diferentes modos de agrupamento:
- Por modelo — Requisições, tokens, custos e latência por modelo.
- Por chave — Consumo de cada chave virtual.
- Por data — Tendência de uso por dia.
- Por tipo de requisição — Agrupando por tipo de solicitação.
Uso Multimodal
Além do chat de texto, a página de estatísticas exibe separadamente o uso multimodal: número de imagens geradas, unidades de entrada de voz e unidades de saída de voz, facilitando o cálculo dos custos relacionados a chamadas de imagem e voz.
Gráfico de Tendências
Apresentação do volume de requisições agregadas por dia em um gráfico de linhas, permitindo acompanhar a evolução do uso ao longo do tempo.
Gerenciamento de Orçamento (VIP)
- Exibe o valor usado e o percentual de cada orçamento em formato de gauge, com alertas ao se aproximar do limite.
- O gerenciamento de orçamento é um recurso pago; sem assinatura, a área fica bloqueada e exibe sugestão de upgrade.
Monitoramento (Monitoring)
A página de monitoramento oferece uma visão operacional em tempo real:
- Log de eventos em tempo real — Exibe os eventos de roteamento um a um (ID da requisição, modelo, canal, latência etc.).
- Contagem por tipo de evento — Número de roteamentos normais, falhas, failovers e casos sem canal disponível, facilitando a identificação rápida de anomalias.
Pré-requisitos
- Estar logado em uma conta ServBay e ter canais e chaves virtuais configuradas.
- Ter tráfego real passando pelo gateway (caso contrário, não há estatísticas).
Recomendações de Uso
- Controle de custos — Use os agrupamentos por modelo/chave para identificar as maiores fontes de consumo e, se necessário, defina limites de velocidade para a chave virtual correspondente ou limites de orçamento para o canal.
- Diagnóstico de anomalias — Se a taxa de sucesso cair, verifique o percentual de failed/no_channel na distribuição de tipos de eventos e combine com o status de saúde dos canais para localizar canais problemáticos.
- Otimização de latência — Observe o KPI de latência média e a latência por modelo para avaliar o tempo de resposta de diferentes provedores ou localizações de endpoint.
Perguntas Frequentes (FAQ)
- P: Não aparecem dados na página de estatísticas?
- R: As estatísticas são baseadas em requisições reais que passaram pelo gateway. Verifique se alguma aplicação ou ferramenta sob gerenciamento já enviou requisições via gateway.
- P: A área de gerenciamento de orçamento está bloqueada?
- R: O gerenciamento de orçamento é um recurso pago. Para liberar, adquira o plano correspondente.
- P: Como os custos são calculados?
- R: O gateway estima os custos conforme a precificação de cada canal (incluindo o fator de multiplicação que você definir) e o uso real de tokens/chamadas. É possível ajustar os parâmetros de precificação na configuração avançada do canal.
Resumo
As páginas de visão geral, estatísticas e monitoramento tornam cada chamada do gateway de IA completamente rastreável: da consulta rápida dos gastos do dia, à análise detalhada por modelo/chave/data, até o fluxo de eventos em tempo real e o controle orçamentário. Aproveitando esses recursos, é possível otimizar continuamente os custos e a estabilidade no desenvolvimento de IA.
