Passer au contenu principal
INNOCHAT fonctionne selon le principe “pay as you go”.
Au lieu d’inclure des Message Credits (MCs) dans les abonnements existants, vous les achetez séparément via des add-ons – ou vous connectez votre propre API IA pour bénéficier d’une utilisation illimitée.
Lorsque vous utilisez votre propre clé API, une fois que tous les MCs de votre compte INNOCHAT sont épuisés, tous les coûts IA supplémentaires sont directement facturés via votre clé API.

Configurer BYOK

Pour configurer votre propre clé API, vous devez d’abord vous inscrire auprès du fournisseur IA concerné.
INNOCHAT prend actuellement en charge les LLMs de OpenAI, Anthropic et Google.
À l’avenir, nous prévoyons d’intégrer d’autres modèles – y compris des modèles open-source et fine-tunés.

Instructions spécifiques par fournisseur

Une fois votre clé API obtenue, conservez-la dans un endroit privé et sécurisé.
INNOCHAT recommande fortement :
  • Utiliser une clé API différente pour chaque application
  • Ne jamais partager votre clé API avec d’autres personnes
Connectez-vous maintenant à INNOCHAT et cliquez sur l’icône de profil en haut à droite de l’interface.
Cliquez ensuite sur Account.
Dans la section AI API Key, sélectionnez votre fournisseur et insérez la clé API. Cliquez ensuite sur Add.
Attention :
Il ne s’agit pas de la section INNOCHAT API Keys, qui sert à générer des clés API propres à INNOCHAT.
La configuration est maintenant terminée.
Lorsqu’une clé API est créée pour la première fois chez un fournisseur, elle peut être limitée.
Exemple (au 1er novembre 2024) :
Les nouvelles clés OpenAI ne peuvent pas utiliser les modèles GPT-4o tant qu’un solde minimum de 5 USD n’a pas été approvisionné et que la facturation n’a pas été vérifiée.
Chaque fournisseur a ses propres règles de vérification de compte et de limites.

Budgétisation de l’utilisation IA

Utiliser votre propre clé API est généralement plus économique que l’achat d’add-ons Message Credits. Pour estimer les coûts, nous fournissons les références suivantes :
Les fournisseurs de LLM modifient régulièrement leurs tarifs.
Les prix les plus récents sont disponibles ici :
Règle approximative simple : Un Message Credit coûte environ 0,0032 USD Exemple : GPT-4-1106-4k consomme 20 MCs par requête.
Coût : 0,0032 × 20 = 0,064 USD
Il s’agit uniquement d’une estimation grossière.
Les coûts réels peuvent varier de ± 20 %, car les tarifs des LLM sont basés sur les tokens – et les tokens d’entrée et de sortie ont des prix différents.
Une explication sur les tokens est disponible ici :
https://help.openai.com/en/articles/4936856-what-are-tokens-and-how-to-count-them
Une requête LLM se compose de nombreux éléments. En gros : Entrée (Input) :
  • Prompt système & métadonnées
  • Prompt de base personnalisé
  • Variables & définitions
  • Définitions des labels de conversation
  • Métadonnées & descriptions des fonctions
  • Paramètres des fonctions
  • Réponse des fonctions
  • Contexte RAG statique
  • Mémoire de conversation
Sortie (Output) :
  • Réponse textuelle
  • Métadonnées de la réponse

Ventilation des prix OpenAI

INNOCHAT prend en charge différents LLMs OpenAI ainsi que différentes limites de tokens par variante de modèle.
Le tableau suivant est basé sur notre répartition standard des tokens réservés en entrée/sortie.
Il représente une limite supérieure, car tous les tokens réservés ne sont pas utilisés à chaque requête.
ModèleRéserve InputRéserve OutputCoût/Input-TokenCoût/Output-TokenCoût total/Requête
GPT-3.5280012000.00000050.00000150.0032
GPT-3.5-16k1360024000.00000050.00000150.0104
GPT-4o-mini-1k8002000.000000150.00000060.00024
GPT-4o-mini-2k16004000.000000150.00000060.00048
GPT-4o-mini-4k280012000.000000150.00000060.00114
GPT-4o-mini-8k560024000.000000150.00000060.00228
GPT-4o-mini-16k1280032000.000000150.00000060.00384
GPT-4o-mini-32k2800040000.000000150.00000060.0066
GPT-4o-mini-64k6000040000.000000150.00000060.0114
GPT-4o-1k8002000.00000250.000010.004
GPT-4o-2k16004000.00000250.000010.008
GPT-4o-4k280012000.00000250.000010.019
GPT-4o-8k560024000.00000250.000010.038
GPT-4o-16k1280032000.00000250.000010.064
GPT-4o-32k2800040000.00000250.000010.11
GPT-4o-64k6000040000.00000250.000010.19
GPT-4-1106-1k8002000.000010.000030.014
GPT-4-1106-2k16004000.000010.000030.028
GPT-4-1106-4k280012000.000010.000030.064
GPT-4-0125-8k560024000.000010.000030.128
GPT-4-1106-16k1280032000.000010.000030.224
GPT-4-1106-32k2800040000.000010.000030.4
GPT-4-1106-64k6000040000.000010.000030.72

BYOK pour les partenaires White-Label

En plus des coûts liés aux MC, les partenaires White-Label doivent également prendre en charge les coûts générés par l’exécution du framework multi-agents IA.
Ces coûts sont facturés même si vos utilisateurs finaux utilisent leur propre clé API.
Il existe trois workflows qui sollicitent votre API :
  1. Génération d’intents pour les agents IA
    • Lorsque deux agents IA ou plus sont connectés
    • Facturé lorsqu’un nouvel agent visible par l’utilisateur est mis en ligne ou qu’un agent existant est modifié
  2. Classification de l’intention de la requête
    • Lorsque deux agents visibles par l’utilisateur ou plus sont actifs
    • Prix par requête
  3. Extraction de variables
    • Lorsqu’un agent utilise une ou plusieurs variables
    • Prix par requête
Coûts approximatifs :
WorkflowInputOutputCoût/InputCoût/OutputCoût/Exécution
Intent Generation (gpt-4-1106-preview)6004500.000010.000030.0011
Query Intent Classification (gpt-3.5-turbo-1106)1000500.0000010.0000020.0195
Variable Extraction (gpt-3.5-turbo-1106)10001000.0000010.0000020.0012
Ces coûts sont toujours facturés directement sur votre clé API et ne peuvent pas être répercutés sur vos clients. Il est possible que d’autres fonctionnalités IA nécessitent votre clé API à l’avenir.
Nous mettrons à jour la documentation en conséquence.
En règle générale, ces coûts supplémentaires restent faibles par rapport aux coûts générés par les Message Credits.