Skip to content

API 概览

RouteAPI 提供面向企业的统一 AI API 接入能力,把 OpenAI、Claude、Gemini、Azure、AWS Bedrock 等模型能力聚合到一套稳定、可观测、可计量的接口体系中。业务系统只需要接入 RouteAPI,即可在统一鉴权、统一模型 ID 和统一日志下调用不同模型服务。

RouteAPI 同时支持 OpenAI 兼容、Claude Messages 和 Google Gemini 三套主流协议。你可以继续使用现有 SDK 或客户端,只需把 Base URL 和 API Key 切换到 RouteAPI。

协议典型接口适合场景
OpenAI 兼容/v1/chat/completions/v1/responses/v1/embeddingsOpenAI SDK、Cursor、OpenCode、LangChain、LiteLLM 等兼容客户端
Claude Messages/v1/messagesClaude Code、Anthropic SDK、Claude 原生消息格式客户端
Google Gemini/v1beta/models/{model}:generateContentGoogle GenAI SDK、Gemini REST 客户端

不同协议进入的请求会在 RouteAPI 内部完成必要的格式适配。对业务侧来说,优先选择当前客户端原生支持的协议即可。

OpenAI 兼容和 Claude Messages 协议默认使用:

https://www.routeapi.ai/v1

Google Gemini 协议默认使用:

https://www.routeapi.ai/v1beta
Authorization: Bearer sk-your-routeapi-token
Content-Type: application/json

所有协议都使用同一类 RouteAPI Token。请在服务端保存 Token,不要把 Token 暴露到浏览器、移动端或公开仓库中。

RouteAPI 会尽量保持各协议的原生调用体验,同时把请求转发到合适的模型服务。实际支持能力取决于模型、服务能力和请求参数:

能力说明
Chat Completions推荐的基础聊天接口,适合大多数 OpenAI SDK 兼容客户端
Responses适合支持 OpenAI Responses 协议的客户端和编码代理
Embeddings用于向量检索、语义搜索和 RAG
Streaming使用 SSE 返回增量内容
Claude Messages支持 Claude 原生消息结构,适合 Claude Code 与 Anthropic SDK
Google Gemini支持 Gemini generateContent 风格请求
Tool Calling取决于模型是否支持工具调用
Structured Outputs取决于模型是否支持 JSON mode 或 JSON Schema
Vision / Multimodal取决于模型是否支持图像或多模态输入
  • 请求参数会尽量保留并按协议转发。
  • 可选标量参数如果显式传入 0false,RouteAPI 应按显式值处理,而不是当作缺省值丢弃。
  • 不同模型不支持的参数可能被适配、忽略或触发错误,具体以模型兼容规则为准。
  • 生产环境建议固定模型 ID,并为关键业务准备失败兜底策略。
  • 对工具调用、结构化输出、视觉输入和流式用量统计等可选能力,建议先在测试环境验证再上线。
  • 服务端统一封装 RouteAPI Token,避免业务前端直接持有密钥。
  • 为不同业务系统使用不同 Token,便于独立限额、审计和问题定位。
  • 固定模型 ID 和协议路径,不要依赖临时别名或展示名称。
  • 记录请求 ID、模型 ID、状态码、耗时和 token 用量,方便排查延迟与成本异常。
  • 对核心业务启用流式超时、失败重试和备用模型方案,降低单一模型服务异常对业务的影响。