Tổng quan API
RouteAPI cung cấp năng lực truy cập AI API thống nhất cho doanh nghiệp, gom các năng lực mô hình như OpenAI, Claude, Gemini, Azure, AWS Bedrock vào một hệ thống giao diện ổn định, có thể quan sát và có thể đo lường. Hệ thống nghiệp vụ chỉ cần tích hợp RouteAPI để gọi nhiều dịch vụ mô hình khác nhau dưới cơ chế xác thực, model ID và nhật ký thống nhất.
Điểm vào giao thức được hỗ trợ
Phần tiêu đề “Điểm vào giao thức được hỗ trợ”RouteAPI đồng thời hỗ trợ ba giao thức phổ biến: OpenAI compatible, Claude Messages và Google Gemini. Bạn có thể tiếp tục dùng SDK hoặc client hiện có, chỉ cần chuyển Base URL và API Key sang RouteAPI.
| Giao thức | API tiêu biểu | Kịch bản phù hợp |
|---|---|---|
| OpenAI compatible | /v1/chat/completions, /v1/responses, /v1/embeddings | OpenAI SDK, Cursor, OpenCode, LangChain, LiteLLM và các client tương thích |
| Claude Messages | /v1/messages | Claude Code, Anthropic SDK, client dùng định dạng tin nhắn gốc Claude |
| Google Gemini | /v1beta/models/{model}:generateContent | Google GenAI SDK, client Gemini REST |
Các yêu cầu đi vào qua giao thức khác nhau sẽ được RouteAPI thực hiện chuyển đổi định dạng cần thiết ở bên trong. Với phía nghiệp vụ, hãy ưu tiên chọn giao thức mà client hiện tại hỗ trợ gốc.
Địa chỉ cơ sở
Phần tiêu đề “Địa chỉ cơ sở”Giao thức OpenAI compatible và Claude Messages mặc định sử dụng:
https://www.routeapi.ai/v1Giao thức Google Gemini mặc định sử dụng:
https://www.routeapi.ai/v1betaHeader chung
Phần tiêu đề “Header chung”Authorization: Bearer sk-your-routeapi-tokenContent-Type: application/jsonTất cả giao thức đều dùng cùng một loại RouteAPI Token. Hãy lưu Token ở phía máy chủ, không để lộ Token trong trình duyệt, ứng dụng di động hoặc kho mã công khai.
Phạm vi tương thích giao thức
Phần tiêu đề “Phạm vi tương thích giao thức”RouteAPI cố gắng giữ trải nghiệm gọi gốc của từng giao thức, đồng thời chuyển tiếp yêu cầu đến dịch vụ mô hình phù hợp. Năng lực thực tế phụ thuộc vào mô hình, khả năng dịch vụ và tham số yêu cầu:
| Năng lực | Mô tả |
|---|---|
| Chat Completions | API chat cơ bản được khuyến nghị, phù hợp với phần lớn client tương thích OpenAI SDK |
| Responses | Phù hợp với client và agent lập trình hỗ trợ giao thức OpenAI Responses |
| Embeddings | Dùng cho truy xuất vector, tìm kiếm ngữ nghĩa và RAG |
| Streaming | Trả nội dung tăng dần bằng SSE |
| Claude Messages | Hỗ trợ cấu trúc tin nhắn gốc Claude, phù hợp với Claude Code và Anthropic SDK |
| Google Gemini | Hỗ trợ yêu cầu kiểu Gemini generateContent |
| Tool Calling | Phụ thuộc vào việc mô hình có hỗ trợ gọi công cụ hay không |
| Structured Outputs | Phụ thuộc vào việc mô hình có hỗ trợ JSON mode hoặc JSON Schema hay không |
| Vision / Multimodal | Phụ thuộc vào việc mô hình có hỗ trợ hình ảnh hoặc đầu vào đa phương thức hay không |
Quy ước ổn định giao diện
Phần tiêu đề “Quy ước ổn định giao diện”- Tham số yêu cầu sẽ được giữ lại tối đa và chuyển tiếp theo giao thức.
- Nếu tham số scalar tùy chọn được truyền rõ ràng là
0hoặcfalse, RouteAPI sẽ xử lý như giá trị rõ ràng thay vì loại bỏ như giá trị mặc định. - Tham số mà một số mô hình không hỗ trợ có thể được chuyển đổi, bỏ qua hoặc gây lỗi, tùy theo quy tắc tương thích của mô hình.
- Trong môi trường sản xuất, nên cố định ID mô hình và chuẩn bị phương án dự phòng cho nghiệp vụ quan trọng.
- Với các năng lực tùy chọn như gọi công cụ, đầu ra có cấu trúc, đầu vào hình ảnh và thống kê usage trong streaming, nên xác minh trong môi trường kiểm thử trước khi đưa lên sản xuất.
Khuyến nghị tích hợp doanh nghiệp
Phần tiêu đề “Khuyến nghị tích hợp doanh nghiệp”- Bao bọc RouteAPI Token ở phía máy chủ, tránh để frontend nghiệp vụ trực tiếp giữ khóa.
- Dùng Token khác nhau cho các hệ thống nghiệp vụ khác nhau để dễ giới hạn độc lập, kiểm toán và định vị vấn đề.
- Cố định ID mô hình và đường dẫn giao thức, không phụ thuộc vào alias tạm thời hoặc tên hiển thị.
- Ghi lại request ID, model ID, status code, thời gian xử lý và token usage để dễ điều tra độ trễ và chi phí bất thường.
- Với nghiệp vụ lõi, bật timeout streaming, retry khi thất bại và phương án mô hình thay thế để giảm ảnh hưởng khi một dịch vụ mô hình gặp bất thường.