Statistiques et surveillance de la passerelle AI
La passerelle AI enregistre toutes les requêtes qui la traversent et vous présente l’utilisation, les coûts et l’état de fonctionnement sur trois pages distinctes : Aperçu (Overview), Statistiques (Statistics) et Surveillance (Monitoring). Cet article présente le contenu et l’utilisation de ces trois pages.
Aperçu (Overview)
La page d’aperçu fournit une vision globale du statut de la passerelle AI :
- Cartes KPI — Nombre de canaux actifs, nombre de clés virtuelles, requêtes du jour, coût du jour (et tokens consommés).
- Santé des canaux — État de santé en temps réel de chaque canal (Normal / Dégradé / Indisponible).
- Événements récents — Les derniers événements de routage (type d’événement, modèle, canal, latence, heure).
La page d’aperçu est idéale pour vérifier rapidement le bon fonctionnement, la consommation et le coût du jour.
Statistiques (Statistics)
La page Statistiques permet d’analyser en profondeur l’utilisation et les coûts.
Résumé des KPIs
En haut de la page, retrouvez les indicateurs clés : nombre total de requêtes, total de tokens consommés, coût (USD), latence moyenne (ms).
Synthèse et regroupement
- Synthèse générale — Nombre total/de requêtes réussies/échouées, tokens d’entrée/sortie/total, tokens moyens par requête, coût global et répartition par type d’événement (routed normal, failover, failed, no_channel).
- Regroupement par dimension — Changez la vue pour regrouper selon :
- Par modèle — Nombre de requêtes, tokens, coûts et latence par modèle.
- Par clé — Consommation par clé virtuelle.
- Par date — Évolution journalière de l’utilisation.
- Par type de requête — Regroupement selon le type de requête.
Utilisation multimodale
En plus des dialogues texte, la page Statistiques présente séparément la consommation multimodale : nombre d’images générées, unités d’entrée vocale, unités de sortie vocale, facilitant le suivi des coûts pour l’appel image et voix.
Graphiques de tendances
Des graphiques linéaires visualisent l’évolution quotidienne des requêtes, vous aidant à observer les changements d’utilisation.
Gestion des budgets (VIP)
- Sous forme de jauge, affiche le montant utilisé et le pourcentage pour chaque budget, avec alertes à l’approche du seuil.
- La gestion des budgets est une fonctionnalité payante ; en l’absence d’abonnement, cette section est verrouillée avec une invitation à souscrire.
Surveillance (Monitoring)
La page Surveillance offre une vue d’exploitation temps réel :
- Journal d'événements en temps réel — Affiche chaque événement de routage (ID de requête, modèle, canal, latence, etc.).
- Décompte par type d’événement — Statistiques séparées pour routage normal, échec, failover, absence de canal ; utile pour détecter rapidement les anomalies.
Prérequis
- Avoir un compte ServBay connecté et avoir configuré au moins un canal et une clé virtuelle.
- Avoir des requêtes réellement passées via la passerelle (sinon, il n’y aura pas de données statistiques).
Recommandations d’utilisation
- Contrôler les coûts — Utilisez les regroupements « par modèle / par clé » pour repérer les plus gros consommateurs ; limitez le débit par clé virtuelle ou le plafond par canal si nécessaire.
- Investigation des anomalies — Si le taux de réussite baisse, vérifiez la proportion failed / no_channel dans la distribution par type d’événement, et croisez avec l’état de santé des canaux pour identifier le canal défaillant.
- Optimiser la latence — Surveillez le KPI de latence moyenne et la latence par modèle pour évaluer la réactivité des différents fournisseurs/zones géographiques.
Foire aux questions (FAQ)
- Q : Pourquoi la page Statistiques est-elle vide ?
- R : Les statistiques sont basées sur les requêtes réelles passant par la passerelle. Assurez-vous qu’une application ou un outil connecté ait bien envoyé des requêtes via la passerelle.
- Q : Pourquoi la section budget est-elle verrouillée ?
- R : La gestion des budgets est une option payante, accessible après la souscription du forfait adapté.
- Q : Comment sont calculés les coûts ?
- R : Les coûts sont estimés d’après la tarification de chaque canal (incluant le coefficient personnalisé) et le nombre réel de tokens/appels. Rendez-vous dans la configuration avancée du canal pour ajuster les paramètres.
Résumé
En réunissant Aperçu, Statistiques et Surveillance, chaque appel depuis la passerelle AI peut être tracé : depuis le résumé quotidien des coûts, en passant par l’analyse détaillée par modèle, clé ou date, jusqu’au flux d’événements en temps réel et au contrôle budgétaire. En exploitant ces vues, vous optimisez durablement les coûts et la stabilité du développement AI.
