Aller au contenu

Vue d'ensemble de l'API

RouteAPI fournit aux entreprises une capacité d’accès unifiée aux API d’IA. Elle agrège les capacités de modèles OpenAI, Claude, Gemini, Azure, AWS Bedrock et d’autres services dans un ensemble d’interfaces stable, observable et mesurable. Les systèmes métier n’ont qu’à se connecter à RouteAPI pour appeler différents services de modèles avec une authentification, des ID de modèle et des journaux unifiés.

RouteAPI prend en charge les trois grands protocoles courants : OpenAI compatible, Claude Messages et Google Gemini. Vous pouvez continuer à utiliser vos SDK ou clients existants ; il suffit de remplacer la Base URL et l’API Key par celles de RouteAPI.

ProtocoleInterfaces typiquesCas adaptés
OpenAI compatible/v1/chat/completions, /v1/responses, /v1/embeddingsOpenAI SDK, Cursor, OpenCode, LangChain, LiteLLM et autres clients compatibles
Claude Messages/v1/messagesClaude Code, Anthropic SDK, clients au format natif Claude Messages
Google Gemini/v1beta/models/{model}:generateContentGoogle GenAI SDK, clients Gemini REST

Les requêtes arrivant par différents protocoles sont adaptées au format nécessaire dans RouteAPI. Côté métier, choisissez en priorité le protocole pris en charge nativement par votre client actuel.

Les protocoles OpenAI compatible et Claude Messages utilisent par défaut :

https://www.routeapi.ai/v1

Le protocole Google Gemini utilise par défaut :

https://www.routeapi.ai/v1beta
Authorization: Bearer sk-your-routeapi-token
Content-Type: application/json

Tous les protocoles utilisent le même type de Token RouteAPI. Conservez le Token côté serveur et ne l’exposez pas dans le navigateur, une application mobile ou un dépôt public.

RouteAPI conserve autant que possible l’expérience d’appel native de chaque protocole, tout en transférant la requête vers un service de modèle adapté. Les capacités réellement disponibles dépendent du modèle, des fonctions du service et des paramètres de la requête :

CapacitéDescription
Chat CompletionsInterface de chat de base recommandée, adaptée à la plupart des clients compatibles OpenAI SDK
ResponsesAdapté aux clients et agents de codage qui prennent en charge le protocole OpenAI Responses
EmbeddingsUtilisé pour la recherche vectorielle, la recherche sémantique et le RAG
StreamingRetourne le contenu incrémental avec SSE
Claude MessagesPrend en charge la structure de messages native Claude, adaptée à Claude Code et Anthropic SDK
Google GeminiPrend en charge les requêtes de style Gemini generateContent
Tool CallingDépend de la prise en charge des appels d’outils par le modèle
Structured OutputsDépend de la prise en charge du JSON mode ou de JSON Schema par le modèle
Vision / MultimodalDépend de la prise en charge des images ou des entrées multimodales par le modèle
  • Les paramètres de requête sont conservés autant que possible et transférés selon le protocole.
  • Si des paramètres scalaires optionnels sont explicitement transmis avec 0 ou false, RouteAPI les traite comme des valeurs explicites et ne les supprime pas comme des valeurs par défaut.
  • Les paramètres non pris en charge par certains modèles peuvent être adaptés, ignorés ou produire une erreur selon les règles de compatibilité du modèle.
  • En production, il est recommandé de figer les ID de modèle et de prévoir une stratégie de secours pour les flux critiques.
  • Pour les capacités optionnelles comme les appels d’outils, les sorties structurées, les entrées visuelles et les statistiques d’utilisation en streaming, validez d’abord en environnement de test avant la mise en production.
  • Encapsulez les RouteAPI Token côté serveur afin d’éviter que le frontend métier ne détienne directement les clés.
  • Utilisez des Token différents pour les différents systèmes métier afin de faciliter les limites indépendantes, l’audit et le diagnostic.
  • Figez les ID de modèle et les chemins de protocole ; ne dépendez pas d’alias temporaires ni de noms d’affichage.
  • Enregistrez l’ID de requête, l’ID de modèle, le code d’état, la durée et l’utilisation de tokens pour faciliter l’analyse des latences et des coûts anormaux.
  • Pour les activités critiques, activez des délais d’attente de streaming, des reprises en cas d’échec et des modèles de remplacement afin de réduire l’impact d’une anomalie d’un service de modèle unique.