Au lieu d’inclure des Message Credits (MCs) dans les abonnements existants, vous les achetez séparément via des add-ons – ou vous connectez votre propre API IA pour bénéficier d’une utilisation illimitée. Lorsque vous utilisez votre propre clé API, une fois que tous les MCs de votre compte INNOCHAT sont épuisés, tous les coûts IA supplémentaires sont directement facturés via votre clé API.
Configurer BYOK
Pour configurer votre propre clé API, vous devez d’abord vous inscrire auprès du fournisseur IA concerné.INNOCHAT prend actuellement en charge les LLMs de OpenAI, Anthropic et Google.
À l’avenir, nous prévoyons d’intégrer d’autres modèles – y compris des modèles open-source et fine-tunés.
Instructions spécifiques par fournisseur
- OpenAI (modèles GPT) – https://platform.openai.com/account/api-keys
- Anthropic (modèles Claude) – https://console.anthropic.com/settings/keys
- Google (modèles Gemini) – https://ai.google.dev/gemini-api/docs/api-key
INNOCHAT recommande fortement :
- Utiliser une clé API différente pour chaque application
- Ne jamais partager votre clé API avec d’autres personnes

Dans la section AI API Key, sélectionnez votre fournisseur et insérez la clé API. Cliquez ensuite sur Add. Attention :
Il ne s’agit pas de la section INNOCHAT API Keys, qui sert à générer des clés API propres à INNOCHAT.

Lorsqu’une clé API est créée pour la première fois chez un fournisseur, elle peut être limitée.
Exemple (au 1er novembre 2024) :
Les nouvelles clés OpenAI ne peuvent pas utiliser les modèles GPT-4o tant qu’un solde minimum de 5 USD n’a pas été approvisionné et que la facturation n’a pas été vérifiée.
Chaque fournisseur a ses propres règles de vérification de compte et de limites.
Exemple (au 1er novembre 2024) :
Les nouvelles clés OpenAI ne peuvent pas utiliser les modèles GPT-4o tant qu’un solde minimum de 5 USD n’a pas été approvisionné et que la facturation n’a pas été vérifiée.
Chaque fournisseur a ses propres règles de vérification de compte et de limites.
Budgétisation de l’utilisation IA
Utiliser votre propre clé API est généralement plus économique que l’achat d’add-ons Message Credits. Pour estimer les coûts, nous fournissons les références suivantes :Les fournisseurs de LLM modifient régulièrement leurs tarifs.
Les prix les plus récents sont disponibles ici :
Les prix les plus récents sont disponibles ici :
- OpenAI (GPT) : https://openai.com/pricing
- Anthropic (Claude) : https://www.anthropic.com/pricing#anthropic-api
- Google (Gemini) : https://ai.google.dev/pricing#1_5flash
Coût : 0,0032 × 20 = 0,064 USD Il s’agit uniquement d’une estimation grossière.
Les coûts réels peuvent varier de ± 20 %, car les tarifs des LLM sont basés sur les tokens – et les tokens d’entrée et de sortie ont des prix différents. Une explication sur les tokens est disponible ici :
https://help.openai.com/en/articles/4936856-what-are-tokens-and-how-to-count-them Une requête LLM se compose de nombreux éléments. En gros : Entrée (Input) :
- Prompt système & métadonnées
- Prompt de base personnalisé
- Variables & définitions
- Définitions des labels de conversation
- Métadonnées & descriptions des fonctions
- Paramètres des fonctions
- Réponse des fonctions
- Contexte RAG statique
- Mémoire de conversation
- Réponse textuelle
- Métadonnées de la réponse
Ventilation des prix OpenAI
INNOCHAT prend en charge différents LLMs OpenAI ainsi que différentes limites de tokens par variante de modèle.Le tableau suivant est basé sur notre répartition standard des tokens réservés en entrée/sortie.
Il représente une limite supérieure, car tous les tokens réservés ne sont pas utilisés à chaque requête.
| Modèle | Réserve Input | Réserve Output | Coût/Input-Token | Coût/Output-Token | Coût total/Requête |
|---|---|---|---|---|---|
| GPT-3.5 | 2800 | 1200 | 0.0000005 | 0.0000015 | 0.0032 |
| GPT-3.5-16k | 13600 | 2400 | 0.0000005 | 0.0000015 | 0.0104 |
| GPT-4o-mini-1k | 800 | 200 | 0.00000015 | 0.0000006 | 0.00024 |
| GPT-4o-mini-2k | 1600 | 400 | 0.00000015 | 0.0000006 | 0.00048 |
| GPT-4o-mini-4k | 2800 | 1200 | 0.00000015 | 0.0000006 | 0.00114 |
| GPT-4o-mini-8k | 5600 | 2400 | 0.00000015 | 0.0000006 | 0.00228 |
| GPT-4o-mini-16k | 12800 | 3200 | 0.00000015 | 0.0000006 | 0.00384 |
| GPT-4o-mini-32k | 28000 | 4000 | 0.00000015 | 0.0000006 | 0.0066 |
| GPT-4o-mini-64k | 60000 | 4000 | 0.00000015 | 0.0000006 | 0.0114 |
| GPT-4o-1k | 800 | 200 | 0.0000025 | 0.00001 | 0.004 |
| GPT-4o-2k | 1600 | 400 | 0.0000025 | 0.00001 | 0.008 |
| GPT-4o-4k | 2800 | 1200 | 0.0000025 | 0.00001 | 0.019 |
| GPT-4o-8k | 5600 | 2400 | 0.0000025 | 0.00001 | 0.038 |
| GPT-4o-16k | 12800 | 3200 | 0.0000025 | 0.00001 | 0.064 |
| GPT-4o-32k | 28000 | 4000 | 0.0000025 | 0.00001 | 0.11 |
| GPT-4o-64k | 60000 | 4000 | 0.0000025 | 0.00001 | 0.19 |
| GPT-4-1106-1k | 800 | 200 | 0.00001 | 0.00003 | 0.014 |
| GPT-4-1106-2k | 1600 | 400 | 0.00001 | 0.00003 | 0.028 |
| GPT-4-1106-4k | 2800 | 1200 | 0.00001 | 0.00003 | 0.064 |
| GPT-4-0125-8k | 5600 | 2400 | 0.00001 | 0.00003 | 0.128 |
| GPT-4-1106-16k | 12800 | 3200 | 0.00001 | 0.00003 | 0.224 |
| GPT-4-1106-32k | 28000 | 4000 | 0.00001 | 0.00003 | 0.4 |
| GPT-4-1106-64k | 60000 | 4000 | 0.00001 | 0.00003 | 0.72 |
BYOK pour les partenaires White-Label
En plus des coûts liés aux MC, les partenaires White-Label doivent également prendre en charge les coûts générés par l’exécution du framework multi-agents IA.Ces coûts sont facturés même si vos utilisateurs finaux utilisent leur propre clé API. Il existe trois workflows qui sollicitent votre API :
-
Génération d’intents pour les agents IA
- Lorsque deux agents IA ou plus sont connectés
- Facturé lorsqu’un nouvel agent visible par l’utilisateur est mis en ligne ou qu’un agent existant est modifié
-
Classification de l’intention de la requête
- Lorsque deux agents visibles par l’utilisateur ou plus sont actifs
- Prix par requête
-
Extraction de variables
- Lorsqu’un agent utilise une ou plusieurs variables
- Prix par requête
| Workflow | Input | Output | Coût/Input | Coût/Output | Coût/Exécution |
|---|---|---|---|---|---|
| Intent Generation (gpt-4-1106-preview) | 600 | 450 | 0.00001 | 0.00003 | 0.0011 |
| Query Intent Classification (gpt-3.5-turbo-1106) | 1000 | 50 | 0.000001 | 0.000002 | 0.0195 |
| Variable Extraction (gpt-3.5-turbo-1106) | 1000 | 100 | 0.000001 | 0.000002 | 0.0012 |
Nous mettrons à jour la documentation en conséquence.
En règle générale, ces coûts supplémentaires restent faibles par rapport aux coûts générés par les Message Credits.