AI 閘道統計與監控
AI 閘道會記錄所有經過的請求,並透過概覽(Overview)、統計(Statistics)、**監控(Monitoring)**三個頁面,為你呈現用量、成本與運行狀況。本文將介紹這三個頁面的內容與用法。
概覽(Overview)
概覽頁提供 AI 閘道的整體狀態摘要:
- KPI 卡片 — 活躍通道數、虛擬金鑰數、今日請求數、今日成本(以及 Token 用量)。
- 通道健康一覽 — 各通道的即時健康狀態(正常 / 降級 / 不可用)。
- 最近事件 — 近期路由事件流(事件類型、模型、通道、延遲、時間)。
概覽頁適合日常快速查閱閘道是否運作正常、今日花費與請求量。
統計(Statistics)
統計頁用於深入分析用量和成本。
KPI 摘要
頁首展示核心指標:請求總數、Token 總用量、成本(USD)、平均延遲(毫秒)。
匯總與分組
- 整體匯總 — 總 / 成功 / 失敗請求數,輸入 / 輸出 / 總 Token 數,平均每請求 Token 數,總成本,以及依事件類型分布(正常路由 routed、故障轉移 failover、失敗 failed、無可用通道 no_channel)。
- 按維度分組 — 可切換多種分組視角:
- 按模型 — 各模型的請求數、Token、成本、延遲。
- 按金鑰 — 各虛擬金鑰的消費狀況。
- 按日期 — 按天觀察用量趨勢。
- 按請求類型 — 依請求類型分組檢視。
多模態用量
除文字對話外,統計頁還獨立顯示多模態用量:圖片生成數量、語音輸入單位、語音輸出單位,方便核算圖像及語音處理的費用。
趨勢圖
以折線圖展示每日聚合的請求量走勢,協助你掌握用量變化。
預算管理(VIP)
- 以儀表板(gauge)形式展示各項預算的已用額度及百分比,接近臨界值時自動提醒。
- 預算管理為付費功能,未訂閱時該區塊會鎖定並提示升級。
監控(Monitoring)
監控頁提供更即時的運作視圖:
- 即時事件日誌 — 逐筆顯示路由事件(請求 ID、模型、通道、延遲等)。
- 依事件類型計數 — 正常路由、失敗、故障轉移、無可用通道等分類計數,方便快速定位異常情況。
前提條件
- 已登入 ServBay 帳號並完成通道及虛擬金鑰配置。
- 已有實際請求經過閘道(否則統計頁為空)。
使用建議
- 控管成本 — 藉由「按模型 / 按金鑰」分組找出高消耗來源,必要時為指定的虛擬金鑰設定速率限制,或是為通道設置額度。
- 排查異常 — 若成功率下降,檢查事件類型分布中的 failed / no_channel 佔比,並搭配通道健康狀態鎖定可能失效的通道。
- 優化延遲 — 關注平均延遲 KPI 及按模型延遲,評估不同服務商 / 區域端點的響應速度。
常見問題(FAQ)
- Q:統計頁沒有數據?
- A:統計以真實經過閘道的請求為基礎。請確認應用或已接管的工具已透過閘道發送請求。
- Q:預算管理區塊被鎖定?
- A:預算管理為付費功能,訂閱對應方案即可解鎖使用。
- Q:成本如何計算?
- A:閘道會依各通道的計價(含自訂倍率)及實際 Token / 調用量估算成本,你可於通道進階設定調整相關參數。
總結
概覽、統計與監控三大頁面讓 AI 閘道的每一次調用都可被觀測:從今日花費的快速瀏覽,到依模型 / 金鑰 / 日期的深度解析,再到即時事件流及預算控管。善加運用這些視圖,將有助於你持續優化 AI 開發的成本與穩定度。
