Giới thiệu ServBay AI Gateway
ServBay AI Gateway là cổng AI thống nhất nội bộ được tích hợp sẵn trong ServBay. Nó vận hành một điểm proxy trên máy của bạn, tập hợp các yêu cầu gửi đến gần 20 nhà cung cấp mô hình lớn như OpenAI, Anthropic, DeepSeek, Qwen v.v. về một đầu mối duy nhất. Gateway giúp bạn quản lý tập trung khóa API, thống kê mức sử dụng, chi phí và dễ dàng điều hướng các công cụ lập trình AI như Claude Code, Codex, Gemini CLI trỏ về gateway nội bộ chỉ với một cú nhấp chuột.
Tài liệu này giải thích AI Gateway là gì, giải quyết những vấn đề nào và mô tả kiến trúc tổng thể. Hướng dẫn thao tác chi tiết, vui lòng xem:
- Quản lý kênh — Thêm và cấu hình các nhà cung cấp
- Khóa ảo — Tạo, phân quyền, luân phiên và thu hồi khóa
- Tự động điều hướng công cụ lập trình AI — Trỏ Claude Code và các CLI khác về Gateway
- Thống kê & giám sát — Quản lý sử dụng, chi phí và ngân sách
- Endpoint & biến môi trường — Tích hợp Gateway vào mã nguồn của bạn
Tổng quan
Trong phát triển AI hàng ngày, bạn có thể sở hữu nhiều API Key cho các nhà cung cấp khác nhau, mỗi KEY nằm rải rác trong các file cấu hình của dự án hay công cụ, gây khó khăn cho việc thống kê chi tiêu và chuyển đổi. ServBay AI Gateway giúp tập trung xử lý bằng các tính năng:
- Một điểm truy cập, nhiều nhà cung cấp — Sau khi cấu hình kênh, toàn bộ yêu cầu được chuyển tiếp qua địa chỉ nội bộ
http://127.0.0.1:11580, ứng dụng của bạn chỉ cần biết một endpoint duy nhất. - Khóa ảo thay cho khóa thật — Gateway phát hành "khóa ảo" cho ứng dụng, khóa API của nhà cung cấp chỉ lưu ở phía Gateway, không còn phân tán khắp nơi. Khóa ảo có thể dễ dàng phân quyền, luân phiên hoặc thu hồi bất cứ lúc nào.
- Thống kê tập trung về mức sử dụng & chi phí — Mọi yêu cầu đi qua Gateway đều được ghi nhận. Gateway cung cấp báo cáo số lượng yêu cầu, token tiêu thụ, chi phí, độ trễ, lượng dùng đa phương tiện... Hỗ trợ quản lý ngân sách.
- Điều hướng các công cụ lập trình AI phổ biến chỉ với một click — Không cần tự chỉnh sửa file cấu hình, hệ thống tự động trỏ Claude Code, Codex, Gemini CLI, Qwen Code, Kimi CLI, CodeBuddy, opencode, Crush v.v. về cổng nội bộ.
Kiến trúc và Cổng
AI Gateway bao gồm hai dịch vụ nội bộ, cả hai chỉ lắng nghe trên địa chỉ loopback (127.0.0.1):
| Cổng | Mục đích | Mô tả |
|---|---|---|
11580 | Cổng proxy | Điểm truy cập thống nhất cho ứng dụng. Mã nguồn và công cụ AI sẽ gửi yêu cầu tới đây và Gateway sẽ điều hướng đến nhà cung cấp dựa trên quyền của khóa ảo. |
11581 | Cổng quản trị | Dùng để quản lý kênh, khóa, thống kê nội bộ cho ứng dụng ServBay, người dùng không cần truy cập trực tiếp. |
Cổng proxy hỗ trợ nhiều giao diện tương thích như OpenAI, Anthropic, Gemini. Xem chi tiết tại Endpoints & biến môi trường.
Các nhà cung cấp được hỗ trợ
AI Gateway tích hợp sẵn gần 20 nhà cung cấp, được nhóm theo từng danh mục để tiện cho việc cấu hình:
- Phổ biến (Mainstream): OpenAI, Anthropic, Google Gemini, Azure OpenAI, AWS Bedrock, OpenRouter.
- Trung Quốc (China): DeepSeek, Qwen, Zhipu GLM, Kimi (Moonshot), Doubao·Volcano, BaiDu WenXin, Hunyuan, MiniMax, ZeroOne, Stepstar... Đặc biệt Qwen, Zhipu GLM, Kimi, Doubao·Volcano, Hunyuan, MiniMax, Stepstar hỗ trợ chuyển vùng endpoint Nội địa / Quốc tế.
- Nội bộ (Local): Ollama (mặc định
127.0.0.1:11434), LM Studio (mặc định127.0.0.1:1234). - Tùy chỉnh (Custom): OpenAI Compatible (bất kỳ dịch vụ tương thích OpenAI), Custom (tùy chỉnh hoàn toàn).
Xem thao tác thêm và cấu hình tại Quản lý kênh.
Yêu cầu tiên quyết
- Đã cài đặt và khởi động ServBay trên macOS hoặc Windows.
- AI Gateway là tính năng cao cấp, phải đăng nhập tài khoản ServBay trước khi thêm kênh hoặc khóa. Nếu chưa đăng nhập, hệ thống sẽ hướng dẫn bạn hoàn tất đăng nhập.
TIP
Các tính năng của AI Gateway trên ServBay cho macOS và ServBay cho Windows là giống nhau, cổng proxy (11580), cổng quản trị (11581) và đường dẫn file cấu hình cho các công cụ đều giống nhau. Nếu có sự khác biệt về nền tảng sẽ được ghi chú riêng.
Tài khoản & Gói dịch vụ
Một số chức năng của AI Gateway liên quan đến gói tài khoản ServBay:
- Giới hạn số lượng kênh / khóa — Gói miễn phí và trả phí có giới hạn khác nhau số kênh, khóa ảo tạo được. Khi đạt giới hạn, hệ thống sẽ nhắc nâng cấp.
- Quản lý hạn mức & ngân sách — Hạn mức (token/số yêu cầu/chi tiêu) và bảng điều khiển ngân sách thuộc về các gói VIP/trả phí; nếu bạn chưa đăng ký, các mục này sẽ bị khóa kèm thông báo.
Tham khảo chi tiết về các gói tại ServBay Pro và ServBay Team.
Lưu trữ dữ liệu
- Dữ liệu cấu hình kênh, khóa ảo, thống kê sử dụng... đều được Gateway lưu nội bộ trên máy của bạn.
- Khóa ảo ở dạng đầy đủ chỉ hiển thị duy nhất lúc tạo (hoặc luân phiên), về sau Gateway chỉ lưu tiền tố để nhận diện. Hãy sao lưu ngay khi tạo!
- Khi tự động điều hướng các công cụ, Gateway sẽ sao lưu file cấu hình gốc thành đuôi
.bak, rồi cập nhật file cấu hình mới trỏ về địa chỉ nội bộ, đảm bảo có thể phục hồi khi cần.
Quy trình sử dụng điển hình
- Đăng nhập tài khoản ServBay, truy cập AI Gateway.
- Thêm ít nhất một kênh nhà cung cấp (ví dụ OpenAI hoặc DeepSeek) ở trang Quản lý kênh, nhập API Key thật và kiểm tra kết nối.
- Tạo khóa ảo ở trang Khóa ảo, phân quyền mô hình/kênh và giới hạn tốc độ theo nhu cầu.
- Thêm khóa ảo này vào ứng dụng của bạn tại trang Endpoints, hoặc tự động điều hướng các công cụ AI thường dùng tại Tự động điều hướng.
- Theo dõi sử dụng, chi phí, độ trễ và thiết lập ngân sách nếu cần tại Thống kê & giám sát.
Tóm tắt
ServBay AI Gateway tập trung hóa quy trình phát triển AI phân tán "đa nhà cung cấp, đa khóa, đa công cụ" về một nơi duy nhất: một điểm truy cập nội bộ, một hệ thống khóa ảo, một bảng điều khiển thống kê. Gateway giúp bạn quản lý năng lực AI an toàn, hiệu quả, kiểm soát chính xác chi tiêu, và dễ dàng tích hợp mọi công cụ lập trình AI về một cổng thống nhất ngay trên máy của mình — đây cũng là một trong những năng lực cốt lõi mà ServBay hướng tới cho phát triển AI-native.
