AIゲートウェイ 統計と監視
AIゲートウェイは、すべてのリクエストを記録し、概要(Overview)、統計(Statistics)、**監視(Monitoring)**の3つのページで利用状況・コスト・稼働状況を表示します。本記事ではそれぞれのページの内容と使い方を解説します。
概要(Overview)
概要ページはAIゲートウェイ全体のステータスを俯瞰できます:
- KPIカード — アクティブチャネル数、仮想キー数、本日のリクエスト数、本日のコスト(およびトークン消費量)。
- チャネルのヘルスチェック — 各チャネルのリアルタイム状態(正常 / 降格 / 利用不可)。
- 最近のイベント — 直近のルーティングイベント(イベントタイプ、モデル、チャネル、遅延、タイムスタンプ)。
日々のゲートウェイの稼働状況、当日の消費・リクエスト数の素早い把握に役立ちます。
統計(Statistics)
統計ページは、利用・コストの詳細な分析に利用します。
KPIサマリー
ページ冒頭に主要指標を掲示:総リクエスト数、トークン総消費量、コスト(USD)、平均レイテンシ(ms)。
集計とグルーピング
- 全体集計 — 全体 / 成功 / 失敗リクエスト数、入力 / 出力 / 合計トークン数、平均トークン消費(1リクエストあたり)、総コスト、イベントタイプ別分布(正常ルート routed, フェイルオーバー failover, 失敗 failed, 利用可能チャネル無し no_channel)。
- 多次元グループ化 — 視点を切り替えてデータを見られます:
- モデル別 — 各モデルのリクエスト数、トークン、コスト、レイテンシ。
- キー別 — 仮想キーごとの消費状況。
- 日別 — 日単位の利用推移。
- リクエストタイプ別 — 種類ごとのグルーピング。
マルチモーダル利用量
テキスト会話以外にも、画像生成件数、音声入力単位、音声出力単位などマルチモーダルAI利用量も個別で集計。画像・音声系APIの費用管理に役立ちます。
トレンドグラフ
日ごとのリクエスト数推移を折れ線グラフで視覚化。利用動向・変化をひと目で確認可能です。
予算管理(VIP機能)
- ゲージ形式で各予算の消化額と割合を表示し、しきい値付近で警告を通知。
- 予算管理は有料機能です。未契約時はロックされ、アップグレードを案内します。
監視(Monitoring)
監視ページでは、運用状況をリアルタイムで把握できます:
- リアルタイムイベントログ — 各ルーティングイベント(リクエストID、モデル、チャネル、レイテンシなど)をタイムリーに表示。
- イベントタイプ別カウント — 正常ルーティング、失敗、フェイルオーバー、利用可能チャネル無しなど、分類別カウントで異常の迅速検知をサポート。
利用前提
- ServBayアカウントへログイン・チャネルおよび仮想キーの設定済みであること。
- ゲートウェイ経由のリクエストが既に送信されていること(未利用の場合は統計表示なし)。
利用アドバイス
- コスト管理 — 「モデル別/キー別」分析で高コスト要因を特定し、必要に応じて関連仮想キーにレート制限やチャネルの利用額制限を設定しましょう。
- 異常調査 — 成功率が低下した際はイベントタイプ分布の failed / no_channel比率やチャネルの健康状態をチェックし、不調なチャネルを特定。
- レイテンシの最適化 — 平均レイテンシKPIやモデル別レイテンシを活用し、ベンダーやリージョンごとの応答速度を評価しましょう。
よくある質問(FAQ)
- Q:統計ページにデータが無い場合?
- A:統計は実際にゲートウェイを通過したリクエストのみ集計されます。アプリやサービスがゲートウェイ経由でリクエストしているかご確認ください。
- Q:予算管理エリアがロックされている場合?
- A:予算管理は有料機能です。プラン契約後にご利用いただけます。
- Q:コストはどのように計算されますか?
- A:各チャネルの料金体系(ご自身で設定した倍率を含む)・実際のトークン/利用量に応じてコストが試算されます。チャネル高度な設定で料金設定の調整が可能です。
まとめ
概要・統計・監視の各ページでAIゲートウェイの全イベントを可視化:当日の消費を素早くチェックし、モデル・キー・日付ごとに深く分析し、リアルタイムでイベントや予算を制御。これらを活用すれば、AI開発のコスト・安定性を継続的に最適化できます。
