Statistik dan Monitoring AI Gateway
AI Gateway mencatat semua permintaan yang melaluinya dan menampilkannya di tiga halaman: Overview, Statistics, dan Monitoring, untuk memantau penggunaan, biaya, serta status operasional AI Anda. Dokumen ini membahas isi dan cara penggunaan ketiga halaman tersebut.
Overview
Pada halaman Overview, Anda dapat melihat ringkasan status keseluruhan AI Gateway:
- Kartu KPI — Jumlah kanal aktif, jumlah kunci virtual, jumlah permintaan hari ini, biaya hari ini (dan penggunaan Token).
- Ringkasan Kesehatan Kanal — Status kesehatan real-time setiap kanal (Normal / Degraded / Tidak Tersedia).
- Event Terbaru — Daftar aliran event routing terakhir (tipe event, model, kanal, latensi, waktu).
Halaman Overview cocok untuk pemantauan cepat, apakah gateway berjalan normal serta memantau biaya dan jumlah permintaan hari ini.
Statistik
Halaman Statistik digunakan untuk analisis mendalam mengenai penggunaan dan biaya.
Ringkasan KPI
Bagian atas halaman menampilkan indikator utama: Total Permintaan, Total Penggunaan Token, Biaya (USD), Rata-rata Latensi (ms).
Ringkasan dan Pengelompokan
- Ringkasan Total — Jumlah total/berhasil/gagal permintaan, jumlah Token input/output/total, rata-rata Token per permintaan, total biaya, dan distribusi berdasarkan tipe event (routing normal, failover, gagal, tidak ada kanal tersedia/no_channel).
- Pengelompokan Berdasarkan Dimensi — Anda dapat mengubah mode pengelompokan:
- Berdasarkan Model — Jumlah permintaan, Token, biaya, dan latensi per model.
- Berdasarkan Kunci — Statistik konsumsi setiap kunci virtual.
- Berdasarkan Tanggal — Tren penggunaan harian.
- Berdasarkan Jenis Permintaan — Pengelompokan berdasarkan tipe permintaan.
Penggunaan Multimodal
Selain percakapan teks, halaman Statistik juga menampilkan penggunaan multimodal secara terpisah: jumlah generasi gambar, satuan input suara, dan satuan output suara, untuk memudahkan perhitungan biaya panggilan AI berbasis gambar dan suara.
Grafik Tren
Tren jumlah permintaan yang diakumulasi per hari ditampilkan dalam grafik garis, membantu Anda memantau perubahan penggunaan.
Manajemen Anggaran (VIP)
- Ditampilkan dalam bentuk gauge dashboard yang memperlihatkan nilai dan persentase penggunaan anggaran, dengan peringatan jika mendekati batas yang ditetapkan.
- Fitur manajemen anggaran hanya tersedia bagi pengguna berbayar. Jika belum berlangganan, area ini akan terkunci dan menampilkan peringatan untuk upgrade.
Monitoring
Halaman Monitoring menawarkan tampilan operasional yang lebih real-time:
- Log Event Real-time — Menampilkan detail event routing satu per satu (Request ID, model, kanal, latensi, dsb).
- Penghitungan Berdasarkan Jenis Event — Jumlah routing normal, gagal, failover, dan tidak ada kanal tersedia, untuk memudahkan pelacakan gangguan.
Prasyarat
- Telah login ke akun ServBay dan mengonfigurasi kanal serta kunci virtual.
- Sudah terdapat permintaan nyata melewati gateway (jika tidak, statistik akan kosong).
Saran Penggunaan
- Kendalikan Biaya — Gunakan pengelompokan berdasarkan model atau kunci untuk mengidentifikasi sumber konsumsi tinggi, dan atur batas laju pada kunci virtual atau kuota kanal jika diperlukan.
- Deteksi Gangguan — Jika tingkat keberhasilan turun, cek proporsi failed/no_channel pada distribusi tipe event dan crosscheck dengan status kesehatan kanal untuk menemukan kanal bermasalah.
- Optimasi Latensi — Pantau KPI rata-rata latensi dan latensi berdasarkan model untuk menilai kecepatan respons dari penyedia atau endpoint yang berbeda.
Pertanyaan yang Sering Diajukan (FAQ)
- Q: Kenapa tidak ada data di halaman Statistik?
- A: Statistik hanya berisi permintaan nyata yang melewati gateway. Pastikan aplikasi atau alat terkait sudah melakukan permintaan melalui gateway.
- Q: Mengapa area manajemen anggaran terkunci?
- A: Manajemen anggaran hanya untuk pengguna berbayar. Fitur ini akan terbuka setelah Anda berlangganan paket terkait.
- Q: Bagaimana perhitungan biaya dilakukan?
- A: Gateway memperkirakan biaya berdasarkan tarif setiap kanal (termasuk rasio yang Anda atur) dan jumlah Token/pemakaian aktual. Parameter biaya dapat diubah di Pengaturan Lanjutan Kanal.
Kesimpulan
Tiga halaman — Overview, Statistik, dan Monitoring — memungkinkan setiap panggilan AI di Gateway dapat dimonitor: mulai dari ringkasan biaya hari ini, analisis mendalam berdasarkan model/kunci/tanggal, hingga log event real-time dan pengelolaan anggaran. Dengan memanfaatkan fitur ini, Anda dapat secara berkelanjutan mengoptimalkan biaya dan stabilitas pengembangan AI Anda.
