AI 网关统计与监控
AI 网关会记录所有经过它的请求,并在概览(Overview)、统计(Statistics)、**监控(Monitoring)**三个页面为你呈现用量、成本与运行状况。本文介绍这三个页面的内容与用法。
概览(Overview)
概览页给出 AI 网关的整体状态一览:
- KPI 卡片 — 活跃渠道数、虚拟密钥数、今日请求数、今日成本(以及 Token 用量)。
- 渠道健康一览 — 各渠道的实时健康状态(正常 / 降级 / 不可用)。
- 最近事件 — 最近若干条路由事件流(事件类型、模型、渠道、延迟、时间)。
概览页适合日常快速查看网关是否正常、今日花费与请求量。
统计(Statistics)
统计页用于深入分析用量与成本。
KPI 摘要
页面顶部展示核心指标:请求总数、Token 总用量、成本(USD)、平均延迟(毫秒)。
汇总与分组
- 总体汇总 — 总 / 成功 / 失败请求数,输入 / 输出 / 总 Token 数,平均每请求 Token 数,总成本,以及按事件类型的分布(正常路由 routed、故障转移 failover、失败 failed、无可用渠道 no_channel)。
- 按维度分组 — 可切换分组视角:
- 按模型 — 各模型的请求数、Token、成本、延迟。
- 按密钥 — 各虚拟密钥的消费情况。
- 按日期 — 按天的用量趋势。
- 按请求类型 — 按请求类型分组。
多模态用量
除文本对话外,统计页还单独展示多模态用量:图像生成数量、语音输入单位、语音输出单位,便于核算图像与语音类调用的花费。
趋势图
以折线图展示按天聚合的请求量走势,帮助你观察用量变化。
预算管理(VIP)
- 以仪表盘(gauge)形式展示各预算的已用额度与百分比,接近阈值时给出提示。
- 预算管理属于付费能力,未订阅时该区域会锁定并提示升级。
监控(Monitoring)
监控页提供更实时的运行视图:
- 实时事件日志 — 逐条展示路由事件(请求 ID、模型、渠道、延迟等)。
- 按事件类型计数 — 正常路由、失败、故障转移、无可用渠道等分类计数,便于快速定位异常。
前提条件
- 已登录 ServBay 账号并配置了渠道与虚拟密钥。
- 已有实际请求经过网关(否则统计为空)。
使用建议
- 控制成本 — 用「按模型 / 按密钥」分组找出高消耗来源,必要时为对应虚拟密钥设置速率限制或为渠道设置额度。
- 排查异常 — 若成功率下降,查看事件类型分布中的 failed / no_channel 占比,并结合渠道健康状态定位失效渠道。
- 优化延迟 — 关注平均延迟 KPI 与按模型延迟,评估不同供应商 / 区域端点的响应速度。
常见问题(FAQ)
- Q:统计页没有数据?
- A:统计基于经过网关的真实请求。请确认已有应用或被接管的工具通过网关发起过请求。
- Q:预算管理区域被锁定?
- A:预算管理是付费能力,订阅相应套餐后即可使用。
- Q:成本是如何计算的?
- A:网关按各渠道的计价(含你设置的计价倍率)与实际 Token / 调用量估算成本,可在 渠道高级配置 中调整计价参数。
总结
概览、统计与监控三页让 AI 网关的每一次调用都可观测:从今日花费的快速一览,到按模型 / 密钥 / 日期的深度拆解,再到实时事件流与预算管控。善用这些视图,你可以持续优化 AI 开发的成本与稳定性。
