API 概览
RouteAPI 提供面向企业的统一 AI API 接入能力,把 OpenAI、Claude、Gemini、Azure、AWS Bedrock 等模型能力聚合到一套稳定、可观测、可计量的接口体系中。业务系统只需要接入 RouteAPI,即可在统一鉴权、统一模型 ID 和统一日志下调用不同模型服务。
支持的协议入口
Section titled “支持的协议入口”RouteAPI 同时支持 OpenAI 兼容、Claude Messages 和 Google Gemini 三套主流协议。你可以继续使用现有 SDK 或客户端,只需把 Base URL 和 API Key 切换到 RouteAPI。
| 协议 | 典型接口 | 适合场景 |
|---|---|---|
| OpenAI 兼容 | /v1/chat/completions、/v1/responses、/v1/embeddings | OpenAI SDK、Cursor、OpenCode、LangChain、LiteLLM 等兼容客户端 |
| Claude Messages | /v1/messages | Claude Code、Anthropic SDK、Claude 原生消息格式客户端 |
| Google Gemini | /v1beta/models/{model}:generateContent | Google GenAI SDK、Gemini REST 客户端 |
不同协议进入的请求会在 RouteAPI 内部完成必要的格式适配。对业务侧来说,优先选择当前客户端原生支持的协议即可。
OpenAI 兼容和 Claude Messages 协议默认使用:
https://www.routeapi.ai/v1Google Gemini 协议默认使用:
https://www.routeapi.ai/v1betaAuthorization: Bearer sk-your-routeapi-tokenContent-Type: application/json所有协议都使用同一类 RouteAPI Token。请在服务端保存 Token,不要把 Token 暴露到浏览器、移动端或公开仓库中。
协议兼容范围
Section titled “协议兼容范围”RouteAPI 会尽量保持各协议的原生调用体验,同时把请求转发到合适的模型服务。实际支持能力取决于模型、服务能力和请求参数:
| 能力 | 说明 |
|---|---|
| Chat Completions | 推荐的基础聊天接口,适合大多数 OpenAI SDK 兼容客户端 |
| Responses | 适合支持 OpenAI Responses 协议的客户端和编码代理 |
| Embeddings | 用于向量检索、语义搜索和 RAG |
| Streaming | 使用 SSE 返回增量内容 |
| Claude Messages | 支持 Claude 原生消息结构,适合 Claude Code 与 Anthropic SDK |
| Google Gemini | 支持 Gemini generateContent 风格请求 |
| Tool Calling | 取决于模型是否支持工具调用 |
| Structured Outputs | 取决于模型是否支持 JSON mode 或 JSON Schema |
| Vision / Multimodal | 取决于模型是否支持图像或多模态输入 |
接口稳定性约定
Section titled “接口稳定性约定”- 请求参数会尽量保留并按协议转发。
- 可选标量参数如果显式传入
0、false,RouteAPI 应按显式值处理,而不是当作缺省值丢弃。 - 不同模型不支持的参数可能被适配、忽略或触发错误,具体以模型兼容规则为准。
- 生产环境建议固定模型 ID,并为关键业务准备失败兜底策略。
- 对工具调用、结构化输出、视觉输入和流式用量统计等可选能力,建议先在测试环境验证再上线。
企业接入建议
Section titled “企业接入建议”- 服务端统一封装 RouteAPI Token,避免业务前端直接持有密钥。
- 为不同业务系统使用不同 Token,便于独立限额、审计和问题定位。
- 固定模型 ID 和协议路径,不要依赖临时别名或展示名称。
- 记录请求 ID、模型 ID、状态码、耗时和 token 用量,方便排查延迟与成本异常。
- 对核心业务启用流式超时、失败重试和备用模型方案,降低单一模型服务异常对业务的影响。