Bỏ qua để đến nội dung

Tổng quan API

RouteAPI cung cấp năng lực truy cập AI API thống nhất cho doanh nghiệp, gom các năng lực mô hình như OpenAI, Claude, Gemini, Azure, AWS Bedrock vào một hệ thống giao diện ổn định, có thể quan sát và có thể đo lường. Hệ thống nghiệp vụ chỉ cần tích hợp RouteAPI để gọi nhiều dịch vụ mô hình khác nhau dưới cơ chế xác thực, model ID và nhật ký thống nhất.

RouteAPI đồng thời hỗ trợ ba giao thức phổ biến: OpenAI compatible, Claude Messages và Google Gemini. Bạn có thể tiếp tục dùng SDK hoặc client hiện có, chỉ cần chuyển Base URL và API Key sang RouteAPI.

Giao thứcAPI tiêu biểuKịch bản phù hợp
OpenAI compatible/v1/chat/completions, /v1/responses, /v1/embeddingsOpenAI SDK, Cursor, OpenCode, LangChain, LiteLLM và các client tương thích
Claude Messages/v1/messagesClaude Code, Anthropic SDK, client dùng định dạng tin nhắn gốc Claude
Google Gemini/v1beta/models/{model}:generateContentGoogle GenAI SDK, client Gemini REST

Các yêu cầu đi vào qua giao thức khác nhau sẽ được RouteAPI thực hiện chuyển đổi định dạng cần thiết ở bên trong. Với phía nghiệp vụ, hãy ưu tiên chọn giao thức mà client hiện tại hỗ trợ gốc.

Giao thức OpenAI compatible và Claude Messages mặc định sử dụng:

https://www.routeapi.ai/v1

Giao thức Google Gemini mặc định sử dụng:

https://www.routeapi.ai/v1beta
Authorization: Bearer sk-your-routeapi-token
Content-Type: application/json

Tất cả giao thức đều dùng cùng một loại RouteAPI Token. Hãy lưu Token ở phía máy chủ, không để lộ Token trong trình duyệt, ứng dụng di động hoặc kho mã công khai.

RouteAPI cố gắng giữ trải nghiệm gọi gốc của từng giao thức, đồng thời chuyển tiếp yêu cầu đến dịch vụ mô hình phù hợp. Năng lực thực tế phụ thuộc vào mô hình, khả năng dịch vụ và tham số yêu cầu:

Năng lựcMô tả
Chat CompletionsAPI chat cơ bản được khuyến nghị, phù hợp với phần lớn client tương thích OpenAI SDK
ResponsesPhù hợp với client và agent lập trình hỗ trợ giao thức OpenAI Responses
EmbeddingsDùng cho truy xuất vector, tìm kiếm ngữ nghĩa và RAG
StreamingTrả nội dung tăng dần bằng SSE
Claude MessagesHỗ trợ cấu trúc tin nhắn gốc Claude, phù hợp với Claude Code và Anthropic SDK
Google GeminiHỗ trợ yêu cầu kiểu Gemini generateContent
Tool CallingPhụ thuộc vào việc mô hình có hỗ trợ gọi công cụ hay không
Structured OutputsPhụ thuộc vào việc mô hình có hỗ trợ JSON mode hoặc JSON Schema hay không
Vision / MultimodalPhụ thuộc vào việc mô hình có hỗ trợ hình ảnh hoặc đầu vào đa phương thức hay không
  • Tham số yêu cầu sẽ được giữ lại tối đa và chuyển tiếp theo giao thức.
  • Nếu tham số scalar tùy chọn được truyền rõ ràng là 0 hoặc false, RouteAPI sẽ xử lý như giá trị rõ ràng thay vì loại bỏ như giá trị mặc định.
  • Tham số mà một số mô hình không hỗ trợ có thể được chuyển đổi, bỏ qua hoặc gây lỗi, tùy theo quy tắc tương thích của mô hình.
  • Trong môi trường sản xuất, nên cố định ID mô hình và chuẩn bị phương án dự phòng cho nghiệp vụ quan trọng.
  • Với các năng lực tùy chọn như gọi công cụ, đầu ra có cấu trúc, đầu vào hình ảnh và thống kê usage trong streaming, nên xác minh trong môi trường kiểm thử trước khi đưa lên sản xuất.
  • Bao bọc RouteAPI Token ở phía máy chủ, tránh để frontend nghiệp vụ trực tiếp giữ khóa.
  • Dùng Token khác nhau cho các hệ thống nghiệp vụ khác nhau để dễ giới hạn độc lập, kiểm toán và định vị vấn đề.
  • Cố định ID mô hình và đường dẫn giao thức, không phụ thuộc vào alias tạm thời hoặc tên hiển thị.
  • Ghi lại request ID, model ID, status code, thời gian xử lý và token usage để dễ điều tra độ trễ và chi phí bất thường.
  • Với nghiệp vụ lõi, bật timeout streaming, retry khi thất bại và phương án mô hình thay thế để giảm ảnh hưởng khi một dịch vụ mô hình gặp bất thường.