Statistieken en Monitoring van de AI-gateway
De AI-gateway registreert alle verzoeken die erdoorheen gaan en toont gebruik, kosten en operationele status op drie pagina's: Overzicht, Statistieken en Monitoring. Dit document legt de inhoud en het gebruik van deze drie pagina's uit.
Overzicht
De overzichtspagina geeft een totaalbeeld van de status van de AI-gateway:
- KPI-kaarten — Aantal actieve kanalen, virtuele sleutels, verzoeken vandaag, kosten vandaag (en tokenverbruik).
- Kanaalgezondheidsoverzicht — Toont realtime de gezondheid van elk kanaal (normaal / gedegradeerd / niet beschikbaar).
- Recente gebeurtenissen — Laat recent gedane routeringsgebeurtenissen zien (type gebeurtenis, model, kanaal, latency, tijd).
De overzichtspagina is ideaal voor een snelle dagelijkse check van de gatewaystatus, uitgaven en verkeersvolume.
Statistieken
De statistiekenpagina is bedoeld voor diepgaande analyse van gebruik en kosten.
KPI-samenvatting
Bovenaan de pagina staan de kernstatistieken: Totaal aantal verzoeken, totaal tokenverbruik, kosten (USD), gemiddelde latency (ms).
Overzicht en Groepering
- Totaaloverzicht — Totaal, succesvolle en mislukte verzoeken, input/output/totaal tokens, gemiddelde tokens per verzoek, totale kosten en distributie per gebeurtenistype (normale routing, failover, mislukt, geen beschikbaar kanaal).
- Gegroepeerd per dimensie — Wissel eenvoudig van weergave:
- Per model — Verzoeken, tokens, kosten en latency per model.
- Per sleutel — Verbruik per virtuele sleutel.
- Per datum — Dagelijkse gebruikstrends.
- Per verzoektype — Statistieken per aanvraagtype.
Multimodaal gebruik
Naast tekstuele interactie toont deze pagina ook multimodaal gebruik zoals: aantal beeldgeneraties, eenheden voor spraakinvoer en spraakuitvoer. Dit maakt het eenvoudiger om kosten van beeld- en spraakintegraties te berekenen.
Trendgrafiek
Met een lijngrafiek zie je het dagelijks samengevoegde gebruikspatroon, zodat je trends kunt monitoren.
Budgetbeheer (VIP)
- Toon verbruikt budget en percentage in een dashboard (gauge). Waarschuw wanneer een limiet nadert.
- Budgetbeheer is een betaalde feature. Indien niet geactiveerd, wordt dit gedeelte vergrendeld en verschijnt er een upgrade-melding.
Monitoring
De monitoringpagina geeft een nog directer inzicht in de operationele status:
- Realtime gebeurtenislog — Toont elke routeringsgebeurtenis (verzoek-ID, model, kanaal, latency enz.).
- Aantal per gebeurtenistype — Aantal per categorie: normale routing, mislukt, failover, geen beschikbaar kanaal. Zo spoor je afwijkingen direct op.
Vereisten
- Je bent ingelogd met een ServBay-account en hebt kanalen en virtuele sleutels geconfigureerd.
- Er zijn daadwerkelijk verzoeken via de gateway verlopen (anders zijn er geen statistieken beschikbaar).
Tips voor gebruik
- Kosten onder controle houden — Gebruik de groepering 'per model' of 'per sleutel' om grootverbruikers te identificeren. Stel indien nodig limieten per virtuele sleutel of plaffonds per kanaal in.
- Problemen opsporen — Daalt het slagingspercentage, check dan de verdeling naar gebeurtenistype (failed/no_channel) en gebruik de kanaalgezondheid om storingen op te sporen.
- Latency optimaliseren — Volg het KPI voor gemiddelde latency en latency per model. Vergelijk verschillende providers en endpoints voor de snelste responstijd.
Veelgestelde vragen (FAQ)
- Vraag: Heb ik geen data in de statistiekenpagina?
- Antwoord: Statistieken zijn gebaseerd op echte verzoeken via de gateway. Controleer of je apps of gekoppelde tools al verzoeken via de gateway versturen.
- Vraag: Waarom is het budgetgedeelte vergrendeld?
- Antwoord: Budgetbeheer is een betaalde optie. Activeer een betaald abonnement om deze functie te gebruiken.
- Vraag: Hoe worden de kosten berekend?
- Antwoord: De gateway berekent de kosten op basis van tariefstelling van elk kanaal (inclusief je eigen multiplicators) en het daadwerkelijke token- of call-verbruik. Je kunt de prijsparameters aanpassen in de geavanceerde kanaalinstellingen.
Samenvatting
Met de pagina's Overzicht, Statistieken en Monitoring breng je elk AI-gateway verzoek volledig in kaart: van snelle dagelijkse kostenchecks tot diepgaande analyses per model/sleutel/dag, realtime gebeurtenisstromen en effectief budgetbeheer. Zo optimaliseer je voortdurend de kosten en stabiliteit van je AI-ontwikkeling.
