AI गेटवे सांख्यिकी और निगरानी
AI गेटवे आपके सभी अनुरोधों का रिकॉर्ड रखता है और ओवरव्यू (Overview), सांख्यिकी (Statistics) तथा निगरानी (Monitoring) तीन पृष्ठों पर उपयोग, लागत और सिस्टम की स्थिति को प्रदर्शित करता है। इस लेख में इन तीन पृष्ठों की सामग्री और उपयोगिता का परिचय दिया गया है।
ओवरव्यू (Overview)
ओवरव्यू पृष्ठ, AI गेटवे की समग्र स्थिति का संक्षिप्त अवलोकन प्रदान करता है:
- KPI कार्ड — सक्रिय चैनलों की संख्या, वर्चुअल कुंजी की संख्या, आज के अनुरोध, आज की लागत (साथ ही टोकन उपयोग)।
- चैनल स्वास्थ्य अवलोकन — प्रत्येक चैनल की लाइव स्वास्थ्य स्थिति (सामान्य / डिग्रेडेड / अनुपलब्ध)।
- हालिया घटनाएँ — हाल की कुछ राउटिंग इवेंट्स (इवेंट प्रकार, मॉडल, चैनल, विलंब, समय)।
ओवरव्यू पृष्ठ त्वरित रूप से यह जांचने के लिए उपयुक्त है कि गेटवे सामान्य रूप से काम कर रहा है या नहीं, और आज के खर्च व अनुरोध मात्रा को जानने के लिए।
सांख्यिकी (Statistics)
सांख्यिकी पृष्ठ उपयोग और लागत का गहरा विश्लेषण करने के लिए है।
KPI सारांश
पृष्ठ के शीर्ष पर मुख्य संकेतक दिखते हैं: कुल अनुरोध, कुल टोकन उपयोग, लागत (USD में), औसत विलंब (मिलीसेकंड में)।
समरी और ग्रुपिंग
- कुल संक्षेप — कुल / सफल / असफल अनुरोधों की संख्या, इनपुट / आउटपुट / कुल टोकन की संख्या, प्रति अनुरोध औसत टोकन, कुल लागत, और इवेंट प्रकार के अनुसार वितरण (सामान्य रूट routed, फेलओवर failover, असफल failed, चैनल अनुपलब्ध no_channel)।
- आयाम के अनुसार समूह — ग्रुपिंग पर्सपेक्टिव बदल सकते हैं:
- मॉडल के अनुसार — प्रत्येक मॉडल के अनुरोध, टोकन, लागत, विलंब।
- कुंजी के अनुसार — प्रत्येक वर्चुअल कुंजी का उपभोग डेटा।
- तिथि के अनुसार — प्रतिदिन के उपयोग का ट्रेंड।
- अनुरोध प्रकार के अनुसार — अनुरोध के प्रकार से समूह।
मल्टीमॉडल उपयोग
पाठ संवाद के अलावा, सांख्यिकी पृष्ठ पर मल्टीमॉडल उपयोग भी पृथक रूप से दिखाया जाता है: इमेज जेनरेशन काउंट, वॉइस इनपुट यूनिट्स, वॉइस आउटपुट यूनिट्स, जिससे इमेज और वॉइस आधारित कॉल्स की लागत का आकलन आसान होता है।
ट्रेंड चार्ट
आवश्यकताओं में उतार-चढ़ाव देखने के लिए, प्रतिदिन के एकीकृत अनुरोधों की प्रवृत्ति को लाइन चार्ट के रूप में दिखाया जाता है।
बजट प्रबंधन (VIP)
- प्रत्येक बजट की उपयोग की गई राशि और प्रतिशत गेज डैशबोर्ड के रूप में दिखती है, और सीमा के पास पहुंचने पर अलर्ट मिलता है।
- बजट मैनेजमेंट प्रीमियम फीचर है; यदि आपने सब्सक्रिप्शन नहीं लिया है तो यह खंड लॉक रहेगा और अपग्रेड का सुझाव देगा।
निगरानी (Monitoring)
निगरानी पृष्ठ अधिक रीयल-टाइम ऑपरेशनल दृश्य प्रदान करता है:
- रीयल-टाइम इवेंट लॉग — राउटिंग इवेंट्स की डिटेल (रोज़गार ID, मॉडल, चैनल, विलंब आदि)।
- इवेंट प्रकार के अनुसार गिनती — सामान्य रूटिंग, असफल, फेलओवर, चैनल अनुपलब्ध आदि की गिनती, अनियमितताओं की त्वरित पहचान के लिए।
पूर्वापेक्षाएँ
- आप ServBay खाते में लॉग इन कर चुके हैं तथा चैनल और वर्चुअल कुंजी की सेटिंग पूरी है।
- आपके गेटवे से वास्तविक अनुरोध किए गए हैं (अन्यथा सांख्यिकी में डाटा नहीं दिखेगा)।
उपयोग की सलाह
- लागत नियंत्रण — "मॉडल/कुंजी के अनुसार" ग्रुपिंग से उच्च उपभोग स्रोत ढूंढें, जरूरत पड़ने पर वर्चुअल कुंजी के लिए रेट लिमिट या चैनल के लिए खर्च सीमा सेट करें।
- असामान्यताओं का पता लगाना — अगर सफलता दर गिर रही हो तो failed/no_channel इवेंट्स का अनुपात देखें और चैनल स्वास्थ्य के साथ क्रॉस-चेक करें।
- विलंब अनुकूलन — औसत विलंब KPI और मॉडल-विशिष्ट विलंब पर ध्यान दें, अलग-अलग प्रदाताओं/रीजन एंडपॉइंट्स के रिस्पॉन्स टाइम का मूल्यांकन करें।
सामान्य प्रश्न (FAQ)
- प्रश्न: सांख्यिकी पृष्ठ में डाटा नहीं है?
- उत्तर: सांख्यिकी केवल गेटवे से होकर गए वास्तविक अनुरोधों पर आधारित है। कृपया पुष्टि करें कि कोई ऐप या टूल वास्तव में गेटवे के माध्यम से अनुरोध भेज चुका है।
- प्रश्न: बजट प्रबंधन क्षेत्र लॉक है?
- उत्तर: बजट प्रबंधन एक प्रीमियम क्षमता है, संबंधित प्लान सब्सक्राइब करने के बाद उपयोग कर सकते हैं।
- प्रश्न: लागत की गणना कैसे होती है?
- उत्तर: गेटवे हर चैनल की मूल्य दर (साथ ही आपकी सेट की गई मल्टीप्लायर) और वास्तविक टोकन/कॉल मात्रा के आधार पर लागत का अनुमान लगाता है। आप चैनल उन्नत विन्यास में मूल्य निर्धारण पैरामीटर समायोजित कर सकते हैं।
सारांश
ओवरव्यू, सांख्यिकी और निगरानी—ये तीन पृष्ठ AI गेटवे के प्रत्येक उपयोग को ट्रैक करने योग्य बनाते हैं: आज के खर्च का त्वरित सारांश, मॉडल/कुंजी/तिथि के अनुसार डिटेल्ड ब्रेकडाउन, और रीयल-टाइम इवेंट फ्लो से लेकर बजट प्रबंधन तक। इन टूल्स का सही उपयोग करके, आप अपने AI डेवलपमेंट की लागत और स्थिरता दोनों को लगातार बेहतर बना सकते हैं।
