API 概覽
RouteAPI 提供面向企業的統一 AI API 接入能力,把 OpenAI、Claude、Gemini、Azure、AWS Bedrock 等模型能力聚合到一套穩定、可觀測、可計量的接口體系中。業務系統只需要接入 RouteAPI,即可在統一鑑權、統一模型 ID 和統一日誌下調用不同模型服務。
支持的協議入口
Section titled “支持的協議入口”RouteAPI 同時支持 OpenAI 兼容、Claude Messages 和 Google Gemini 三套主流協議。你可以繼續使用現有 SDK 或客戶端,只需把 Base URL 和 API Key 切換到 RouteAPI。
| 協議 | 典型接口 | 適合場景 |
|---|---|---|
| OpenAI 兼容 | /v1/chat/completions、/v1/responses、/v1/embeddings | OpenAI SDK、Cursor、OpenCode、LangChain、LiteLLM 等兼容客戶端 |
| Claude Messages | /v1/messages | Claude Code、Anthropic SDK、Claude 原生消息格式客戶端 |
| Google Gemini | /v1beta/models/{model}:generateContent | Google GenAI SDK、Gemini REST 客戶端 |
不同協議進入的請求會在 RouteAPI 內部完成必要的格式適配。對業務側來說,優先選擇當前客戶端原生支持的協議即可。
OpenAI 兼容和 Claude Messages 協議默認使用:
https://www.routeapi.ai/v1Google Gemini 協議默認使用:
https://www.routeapi.ai/v1betaAuthorization: Bearer sk-your-routeapi-tokenContent-Type: application/json所有協議都使用同一類 RouteAPI Token。請在服務端保存 Token,不要把 Token 暴露到瀏覽器、移動端或公開倉庫中。
協議兼容範圍
Section titled “協議兼容範圍”RouteAPI 會盡量保持各協議的原生調用體驗,同時把請求轉發到合適的模型服務。實際支持能力取決於模型、服務能力和請求參數:
| 能力 | 說明 |
|---|---|
| Chat Completions | 推薦的基礎聊天接口,適合大多數 OpenAI SDK 兼容客戶端 |
| Responses | 適合支持 OpenAI Responses 協議的客戶端和編碼代理 |
| Embeddings | 用於向量檢索、語義搜索和 RAG |
| Streaming | 使用 SSE 返回增量內容 |
| Claude Messages | 支持 Claude 原生消息結構,適合 Claude Code 與 Anthropic SDK |
| Google Gemini | 支持 Gemini generateContent 風格請求 |
| Tool Calling | 取決於模型是否支持工具調用 |
| Structured Outputs | 取決於模型是否支持 JSON mode 或 JSON Schema |
| Vision / Multimodal | 取決於模型是否支持圖像或多模態輸入 |
接口穩定性約定
Section titled “接口穩定性約定”- 請求參數會盡量保留並按協議轉發。
- 可選標量參數如果顯式傳入
0、false,RouteAPI 應按顯式值處理,而不是當作缺省值丟棄。 - 不同模型不支持的參數可能被適配、忽略或觸發錯誤,具體以模型兼容規則為準。
- 生產環境建議固定模型 ID,併為關鍵業務準備失敗兜底策略。
- 對工具調用、結構化輸出、視覺輸入和流式用量統計等可選能力,建議先在測試環境驗證再上線。
企業接入建議
Section titled “企業接入建議”- 服務端統一封裝 RouteAPI Token,避免業務前端直接持有密鑰。
- 為不同業務系統使用不同 Token,便於獨立限額、審計和問題定位。
- 固定模型 ID 和協議路徑,不要依賴臨時別名或展示名稱。
- 記錄請求 ID、模型 ID、狀態碼、耗時和 token 用量,方便排查延遲與成本異常。
- 對核心業務啟用流式超時、失敗重試和備用模型方案,降低單一模型服務異常對業務的影響。