Vue d'ensemble de l'API

RouteAPI fournit aux entreprises une capacité d’accès unifiée aux API d’IA. Elle agrège les capacités de modèles OpenAI, Claude, Gemini, Azure, AWS Bedrock et d’autres services dans un ensemble d’interfaces stable, observable et mesurable. Les systèmes métier n’ont qu’à se connecter à RouteAPI pour appeler différents services de modèles avec une authentification, des ID de modèle et des journaux unifiés.

Points d’entrée de protocole pris en charge

RouteAPI prend en charge les trois grands protocoles courants : OpenAI compatible, Claude Messages et Google Gemini. Vous pouvez continuer à utiliser vos SDK ou clients existants ; il suffit de remplacer la Base URL et l’API Key par celles de RouteAPI.

Protocole	Interfaces typiques	Cas adaptés
OpenAI compatible	`/v1/chat/completions`, `/v1/responses`, `/v1/embeddings`	OpenAI SDK, Cursor, OpenCode, LangChain, LiteLLM et autres clients compatibles
Claude Messages	`/v1/messages`	Claude Code, Anthropic SDK, clients au format natif Claude Messages
Google Gemini	`/v1beta/models/{model}:generateContent`	Google GenAI SDK, clients Gemini REST

Les requêtes arrivant par différents protocoles sont adaptées au format nécessaire dans RouteAPI. Côté métier, choisissez en priorité le protocole pris en charge nativement par votre client actuel.

Adresses de base

Les protocoles OpenAI compatible et Claude Messages utilisent par défaut :

https://www.routeapi.ai/v1

Le protocole Google Gemini utilise par défaut :

https://www.routeapi.ai/v1beta

En-têtes communs

Authorization: Bearer sk-your-routeapi-token
Content-Type: application/json

Tous les protocoles utilisent le même type de Token RouteAPI. Conservez le Token côté serveur et ne l’exposez pas dans le navigateur, une application mobile ou un dépôt public.

Périmètre de compatibilité des protocoles

RouteAPI conserve autant que possible l’expérience d’appel native de chaque protocole, tout en transférant la requête vers un service de modèle adapté. Les capacités réellement disponibles dépendent du modèle, des fonctions du service et des paramètres de la requête :

Capacité	Description
Chat Completions	Interface de chat de base recommandée, adaptée à la plupart des clients compatibles OpenAI SDK
Responses	Adapté aux clients et agents de codage qui prennent en charge le protocole OpenAI Responses
Embeddings	Utilisé pour la recherche vectorielle, la recherche sémantique et le RAG
Streaming	Retourne le contenu incrémental avec SSE
Claude Messages	Prend en charge la structure de messages native Claude, adaptée à Claude Code et Anthropic SDK
Google Gemini	Prend en charge les requêtes de style Gemini `generateContent`
Tool Calling	Dépend de la prise en charge des appels d’outils par le modèle
Structured Outputs	Dépend de la prise en charge du JSON mode ou de JSON Schema par le modèle
Vision / Multimodal	Dépend de la prise en charge des images ou des entrées multimodales par le modèle

Conventions de stabilité des interfaces

Les paramètres de requête sont conservés autant que possible et transférés selon le protocole.
Si des paramètres scalaires optionnels sont explicitement transmis avec 0 ou false, RouteAPI les traite comme des valeurs explicites et ne les supprime pas comme des valeurs par défaut.
Les paramètres non pris en charge par certains modèles peuvent être adaptés, ignorés ou produire une erreur selon les règles de compatibilité du modèle.
En production, il est recommandé de figer les ID de modèle et de prévoir une stratégie de secours pour les flux critiques.
Pour les capacités optionnelles comme les appels d’outils, les sorties structurées, les entrées visuelles et les statistiques d’utilisation en streaming, validez d’abord en environnement de test avant la mise en production.

Recommandations pour l’intégration entreprise

Encapsulez les RouteAPI Token côté serveur afin d’éviter que le frontend métier ne détienne directement les clés.
Utilisez des Token différents pour les différents systèmes métier afin de faciliter les limites indépendantes, l’audit et le diagnostic.
Figez les ID de modèle et les chemins de protocole ; ne dépendez pas d’alias temporaires ni de noms d’affichage.
Enregistrez l’ID de requête, l’ID de modèle, le code d’état, la durée et l’utilisation de tokens pour faciliter l’analyse des latences et des coûts anormaux.
Pour les activités critiques, activez des délais d’attente de streaming, des reprises en cas d’échec et des modèles de remplacement afin de réduire l’impact d’une anomalie d’un service de modèle unique.