Estadísticas y Monitoreo del AI Gateway
El AI Gateway registra todas las solicitudes que lo atraviesan y presenta el uso, los costos y el estado operativo en tres páginas: Resumen (Overview), Estadísticas (Statistics) y Monitoreo (Monitoring). En este documento se explican los contenidos y el uso de estas tres secciones.
Resumen (Overview)
La sección de resumen ofrece una visión general del estado del AI Gateway:
- Tarjetas KPI — Número de canales activos, cantidad de claves virtuales, solicitudes de hoy, costo de hoy (y consumo de Tokens).
- Salud de los canales — Estado de salud en tiempo real de cada canal (normal / degradado / no disponible).
- Eventos recientes — Flujo de los últimos eventos de enrutamiento (tipo de evento, modelo, canal, retardo, hora).
La sección de resumen es ideal para revisar rápidamente el funcionamiento del Gateway, los gastos y el volumen de solicitudes del día.
Estadísticas (Statistics)
La página de estadísticas está diseñada para un análisis en profundidad del uso y los costos.
Resumen de KPI
En la parte superior se muestran los indicadores clave: total de solicitudes, total de Tokens utilizados, costo (USD) y retardo promedio (ms).
Resúmenes y Agrupaciones
- Resumen general — Cantidad total / exitosas / fallidas de solicitudes, número de Tokens de entrada / salida / total, promedio de Tokens por solicitud, costos totales y distribución por tipo de evento (enrutamiento normal routed, failover, fallos failed, sin canales disponibles no_channel).
- Agrupación por dimensión — Puedes cambiar la vista de agrupación:
- Por modelo — Solicitudes, consumo de Tokens, costos y retardo por modelo.
- Por clave — Detalle del consumo por clave virtual.
- Por fecha — Tendencia de uso diaria.
- Por tipo de solicitud — Agrupación por tipo de petición.
Uso Multimodal
Además de los chats de texto, la sección de estadísticas muestra el uso multimodal de manera independiente: cantidad de imágenes generadas, unidades de entrada de voz, unidades de salida de voz, facilitando el cálculo de los costos de llamadas de imágenes y voz.
Gráficos de Tendencias
Se muestran tendencias de volumen de solicitudes agregadas por día mediante gráficos de líneas, ayudándote a observar patrones y cambios en el uso.
Gestión de Presupuestos (VIP)
- Presenta el monto y porcentaje utilizado de cada presupuesto mediante un panel tipo gauge, avisando al acercarse al límite.
- La gestión de presupuestos es una función de pago; si no tienes suscripción, esta sección estará bloqueada con una invitación para actualizar.
Monitoreo (Monitoring)
La página de monitoreo ofrece una visualización más en tiempo real del funcionamiento:
- Registro de eventos en tiempo real — Muestra cada evento de enrutamiento (ID de solicitud, modelo, canal, retardo, etc.) de forma individual.
- Conteo por tipo de evento — Estadísticas instantáneas sobre enrutamiento normal, fallos, failover y sin canales disponibles, para una detección rápida de anomalías.
Requisitos Previos
- Haber iniciado sesión en tu cuenta de ServBay y haber configurado canales y claves virtuales.
- Tener solicitudes reales pasando por el Gateway (de lo contrario, las estadísticas estarán vacías).
Recomendaciones de Uso
- Controla los costos — Utiliza la agrupación “por modelo/por clave” para identificar las fuentes de mayor consumo y, si es necesario, limita la tasa para la clave virtual correspondiente o configura un presupuesto para el canal.
- Detecta anomalías — Si la tasa de éxito disminuye, revisa la proporción de failed / no_channel en los tipos de eventos y combínalo con el estado de salud de los canales para identificar canales con problemas.
- Optimiza la latencia — Presta atención al KPI de retardo promedio y demoras por modelo para evaluar la velocidad de respuesta según proveedor o zona geográfica.
Preguntas Frecuentes (FAQ)
- P: ¿No aparece información en la página de estadísticas?
- R: Las estadísticas se basan en solicitudes reales que pasan por el Gateway. Verifica que alguna app o herramienta bajo gestión haya enviado solicitudes a través del Gateway.
- P: ¿La sección de gestión de presupuesto está bloqueada?
- R: Es una función de pago; se habilita con la suscripción correspondiente.
- P: ¿Cómo se calculan los costos?
- R: El Gateway estima los costos a partir de la tarifa de cada canal (incluyendo el multiplicador que configures) y la cantidad real de Tokens o llamadas. Puedes ajustar estos parámetros en la Configuración avanzada de canales.
Resumen
Las secciones de Resumen, Estadísticas y Monitoreo hacen observable cada interacción a través del AI Gateway: desde un vistazo rápido a costos diarios, hasta análisis detallados por modelo, clave o fecha, y el seguimiento en tiempo real de eventos y presupuestos. Aprovecha estas vistas para optimizar de manera continua el costo y la estabilidad de tus desarrollos de IA.
