Статистика та моніторинг AI шлюзу
AI шлюз фіксує всі запити, що проходять через нього, та відображає їх використання, вартість і робочий стан на трьох сторінках: Огляд (Overview), Статистика (Statistics), Моніторинг (Monitoring). Ця стаття розповідає про зміст і можливості кожної зі сторінок.
Огляд (Overview)
Сторінка Огляду надає загальну картину стану AI шлюзу:
- KPI-картки — кількість активних каналів, віртуальних ключів, кількість запитів і вартість за сьогодні (а також використання токенів).
- Огляд стану каналів — поточний стан кожного каналу (нормальний / деградований / недоступний).
- Останні події — останні кілька маршрутних подій (тип події, модель, канал, затримка, час).
Огляд зручний для швидкої перевірки поточного стану шлюзу, витрат і кількості запитів за день.
Статистика (Statistics)
Сторінка Статистики призначена для глибокого аналізу використання і витрат.
KPI-зведення
У верхній частині сторінки відображаються ключові показники: загальна кількість запитів, використані токени, вартість (USD), середня затримка (мс).
Загальна і групова статистика
- Зведена статистика — всього/успішних/невдалих запитів, введених/виведених/загальна кількість токенів, середня кількість токенів на запит, загальна вартість, а також розподіл за типами подій (нормальний маршрут routed, аварійний перехід failover, помилка failed, недоступний канал no_channel).
- Групування за ознакою — можна перемикати варіанти групування:
- За моделлю — кількість запитів, токенів, витрати та затримка для кожної моделі.
- За ключем — використання кожного віртуального ключа.
- За датою — добова динаміка використання.
- За типом запиту — групування за типом запиту.
Мультимодальне використання
Окрім текстових діалогів, на сторінці також окремо виділені показники мультимодального використання: кількість згенерованих зображень, одиниці голосового введення, одиниці голосового виведення — це допомагає зручно оцінювати витрати на графіку і голос.
Графік тенденцій
Лінійна діаграма ілюструє щоденну динаміку кількості запитів, що допомагає відслідковувати зміну обсягів використання.
Управління бюджетом (VIP)
- Кожен бюджет буде показано у вигляді індикатора (графіка), яка відображає використання і відсотковий залишок; коли ліміт наближається до межі, відобразиться попередження.
- Управління бюджетом — платна функція, і без підписки ця область буде заблокована з пропозицією оновити тариф.
Моніторинг (Monitoring)
На сторінці Моніторингу доступна більш оперативна картина стану:
- Журнал подій у реальному часі — покроково показує маршрутні події (ID запиту, модель, канал, затримка тощо).
- Підрахунок за типом подій — класифікація і підрахунок подій типу нормальний маршрут, помилка, аварійний перехід, недоступний канал; це дозволяє швидко виявляти аномалії.
Передумови
- Ви увійшли до акаунта ServBay і вже налаштували канали та віртуальні ключі.
- Через шлюз вже були реальні запити (інакше статистика буде порожньою).
Рекомендації щодо використання
- Контроль витрат — використовуйте групування «за моделлю / за ключем», щоб знайти точки найбільшого споживання; за потреби обмежте швидкість для відповідного ключа або ліміт для каналу.
- Виявлення аномалій — якщо показник успішності знижується, перегляньте розподіл за типами подій (failed / no_channel) і співвіднесіть із поточним станом каналів для ідентифікації проблемних каналів.
- Оптимізація затримки — слідкуйте за KPI середньої затримки і затримкою по кожній моделі для оцінки швидкості відповіді різних провайдерів/регіонів.
Поширені запитання (FAQ)
- Q: На сторінці статистики немає даних?
- A: Статистика базується на реальних запитах через шлюз. Перевірте, чи були вже запити із додатків або інтегрованих інструментів через цей шлюз.
- Q: Область управління бюджетом заблокована?
- A: Управління бюджетом — платна опція. Ви зможете використовувати її після оформлення відповідної підписки.
- Q: Як розраховується вартість?
- A: Вартість обчислюється за тарифом кожного каналу (з урахуванням налаштованого коефіцієнта) і реальною кількістю токенів/запитів. Змінити параметри можна у розширених налаштуваннях каналу.
Висновок
Три сторінки — Огляд, Статистика та Моніторинг — роблять кожне звернення через AI шлюз прозоро контрольованим: від швидкого перегляду добових витрат до деталізації за моделлю, ключем, датою, а також до поточної стрічки подій і контролю бюджету. Використовуйте ці інструменти комплексно — і ви зможете постійно вдосконалювати вартість та надійність AI-інфраструктури.
