Estatísticas e Monitoramento do Gateway de IA

O gateway de IA registra todas as requisições que passam por ele e apresenta informações de uso, custos e status operacional nas páginas de Visão Geral (Overview), Estatísticas (Statistics) e Monitoramento (Monitoring). Este artigo apresenta o conteúdo e o uso dessas três páginas.

Visão Geral (Overview)

A página de visão geral oferece um panorama do status global do gateway de IA:

Cartões de KPIs — Número de canais ativos, número de chaves virtuais, requisições do dia, custo do dia (e uso de tokens).
Saúde dos Canais — Status em tempo real de cada canal (normal / degradado / indisponível).
Eventos Recentes — Fluxo dos eventos de roteamento mais recentes (tipo de evento, modelo, canal, latência, horário).

Esta página é ideal para verificar rapidamente se o gateway está operando normalmente, monitorar os gastos do dia e o volume de requisições.

Estatísticas (Statistics)

A página de estatísticas serve para análise detalhada de uso e custos.

Resumo dos KPIs

No topo da página, são exibidos os principais indicadores: total de requisições, total de tokens usados, custos (USD), latência média (ms).

Resumos e Agrupamentos

Resumo geral — Total de requisições (com separação em bem-sucedidas e falhas), tokens de entrada / saída / total, média de tokens por requisição, custo total, além da distribuição por tipo de evento (roteamento normal routed, failover, falha failed, nenhum canal disponível no_channel).
Agrupamentos por dimensões — É possível selecionar diferentes modos de agrupamento:
- Por modelo — Requisições, tokens, custos e latência por modelo.
- Por chave — Consumo de cada chave virtual.
- Por data — Tendência de uso por dia.
- Por tipo de requisição — Agrupando por tipo de solicitação.

Uso Multimodal

Além do chat de texto, a página de estatísticas exibe separadamente o uso multimodal: número de imagens geradas, unidades de entrada de voz e unidades de saída de voz, facilitando o cálculo dos custos relacionados a chamadas de imagem e voz.

Gráfico de Tendências

Apresentação do volume de requisições agregadas por dia em um gráfico de linhas, permitindo acompanhar a evolução do uso ao longo do tempo.

Gerenciamento de Orçamento (VIP)

Exibe o valor usado e o percentual de cada orçamento em formato de gauge, com alertas ao se aproximar do limite.
O gerenciamento de orçamento é um recurso pago; sem assinatura, a área fica bloqueada e exibe sugestão de upgrade.

Monitoramento (Monitoring)

A página de monitoramento oferece uma visão operacional em tempo real:

Log de eventos em tempo real — Exibe os eventos de roteamento um a um (ID da requisição, modelo, canal, latência etc.).
Contagem por tipo de evento — Número de roteamentos normais, falhas, failovers e casos sem canal disponível, facilitando a identificação rápida de anomalias.

Pré-requisitos

Estar logado em uma conta ServBay e ter canais e chaves virtuais configuradas.
Ter tráfego real passando pelo gateway (caso contrário, não há estatísticas).

Recomendações de Uso

Controle de custos — Use os agrupamentos por modelo/chave para identificar as maiores fontes de consumo e, se necessário, defina limites de velocidade para a chave virtual correspondente ou limites de orçamento para o canal.
Diagnóstico de anomalias — Se a taxa de sucesso cair, verifique o percentual de failed/no_channel na distribuição de tipos de eventos e combine com o status de saúde dos canais para localizar canais problemáticos.
Otimização de latência — Observe o KPI de latência média e a latência por modelo para avaliar o tempo de resposta de diferentes provedores ou localizações de endpoint.

Perguntas Frequentes (FAQ)

P: Não aparecem dados na página de estatísticas?
- R: As estatísticas são baseadas em requisições reais que passaram pelo gateway. Verifique se alguma aplicação ou ferramenta sob gerenciamento já enviou requisições via gateway.
P: A área de gerenciamento de orçamento está bloqueada?
- R: O gerenciamento de orçamento é um recurso pago. Para liberar, adquira o plano correspondente.
P: Como os custos são calculados?
- R: O gateway estima os custos conforme a precificação de cada canal (incluindo o fator de multiplicação que você definir) e o uso real de tokens/chamadas. É possível ajustar os parâmetros de precificação na configuração avançada do canal.

Resumo

As páginas de visão geral, estatísticas e monitoramento tornam cada chamada do gateway de IA completamente rastreável: da consulta rápida dos gastos do dia, à análise detalhada por modelo/chave/data, até o fluxo de eventos em tempo real e o controle orçamentário. Aproveitando esses recursos, é possível otimizar continuamente os custos e a estabilidade no desenvolvimento de IA.

Estatísticas e Monitoramento do Gateway de IA ​

Visão Geral (Overview) ​

Estatísticas (Statistics) ​

Resumo dos KPIs ​

Resumos e Agrupamentos ​

Uso Multimodal ​

Gráfico de Tendências ​

Gerenciamento de Orçamento (VIP) ​

Monitoramento (Monitoring) ​

Pré-requisitos ​

Recomendações de Uso ​

Perguntas Frequentes (FAQ) ​

Resumo ​