Invece di includere Message Credits (MCs) negli abbonamenti esistenti, li acquisti separatamente tramite add-on – oppure colleghi la tua API IA per un utilizzo illimitato. Quando utilizzi la tua chiave API, una volta esauriti tutti i MC nel tuo account INNOCHAT, tutti i costi IA successivi vengono addebitati direttamente sulla tua chiave API.
Configurare BYOK
Per configurare la tua chiave API personale, devi prima registrarti presso il fornitore IA corrispondente.INNOCHAT supporta attualmente i modelli LLM di OpenAI, Anthropic e Google.
In futuro prevediamo di integrare altri modelli – inclusi modelli open-source e fine-tunati.
Istruzioni specifiche per fornitore
- OpenAI (modelli GPT) – https://platform.openai.com/account/api-keys
- Anthropic (modelli Claude) – https://console.anthropic.com/settings/keys
- Google (modelli Gemini) – https://ai.google.dev/gemini-api/docs/api-key
INNOCHAT raccomanda vivamente:
- Utilizzare una chiave API diversa per ogni applicazione
- Non condividere mai la tua chiave API con altre persone

Nella sezione AI API Key seleziona il tuo provider e inserisci la chiave API. Quindi clicca su Add. Attenzione:
Questa non è la sezione INNOCHAT API Keys, che serve per generare chiavi API proprie di INNOCHAT.

Quando crei per la prima volta una chiave API presso un fornitore, potrebbe essere soggetta a limitazioni.
Esempio (al 1° novembre 2024):
Le nuove chiavi OpenAI non possono utilizzare i modelli GPT-4o finché non viene depositato un saldo minimo di 5 USD e la fatturazione non è stata verificata.
Ogni fornitore ha le proprie regole di verifica account e limiti.
Esempio (al 1° novembre 2024):
Le nuove chiavi OpenAI non possono utilizzare i modelli GPT-4o finché non viene depositato un saldo minimo di 5 USD e la fatturazione non è stata verificata.
Ogni fornitore ha le proprie regole di verifica account e limiti.
Pianificazione del budget per l’utilizzo IA
Utilizzare la tua chiave API è generalmente più conveniente rispetto all’acquisto di add-on Message Credits. Per stimare i costi, forniamo i seguenti riferimenti:I fornitori di LLM aggiornano regolarmente i prezzi.
I prezzi più aggiornati sono disponibili qui:
I prezzi più aggiornati sono disponibili qui:
- OpenAI (GPT): https://openai.com/pricing
- Anthropic (Claude): https://www.anthropic.com/pricing#anthropic-api
- Google (Gemini): https://ai.google.dev/pricing#1_5flash
Costo: 0,0032 × 20 = 0,064 USD Si tratta solo di un valore indicativo.
I costi reali possono variare di ± 20 %, poiché i costi dei LLM sono basati sui token – e i token di input e output hanno prezzi diversi. Una spiegazione sui token è disponibile qui:
https://help.openai.com/en/articles/4936856-what-are-tokens-and-how-to-count-them Una query LLM è composta da molti elementi. In sintesi: Input:
- System Prompt & metadati
- Prompt base personalizzato
- Variabili & definizioni
- Definizioni dei label di conversazione
- Metadati & descrizioni delle funzioni
- Parametri delle funzioni
- Risposta delle funzioni
- Contesto RAG statico
- Memoria della conversazione
- Risposta testuale
- Metadati della risposta
Dettaglio prezzi OpenAI
INNOCHAT supporta diversi LLM OpenAI e diverse varianti con limiti di token differenti.La tabella seguente si basa sulla nostra ripartizione standard dei token riservati in input/output.
Rappresenta un limite massimo, poiché non tutti i token riservati vengono utilizzati in ogni richiesta.
| Modello | Riserva Input | Riserva Output | Costo/Input-Token | Costo/Output-Token | Costo totale/Richiesta |
|---|---|---|---|---|---|
| GPT-3.5 | 2800 | 1200 | 0.0000005 | 0.0000015 | 0.0032 |
| GPT-3.5-16k | 13600 | 2400 | 0.0000005 | 0.0000015 | 0.0104 |
| GPT-4o-mini-1k | 800 | 200 | 0.00000015 | 0.0000006 | 0.00024 |
| GPT-4o-mini-2k | 1600 | 400 | 0.00000015 | 0.0000006 | 0.00048 |
| GPT-4o-mini-4k | 2800 | 1200 | 0.00000015 | 0.0000006 | 0.00114 |
| GPT-4o-mini-8k | 5600 | 2400 | 0.00000015 | 0.0000006 | 0.00228 |
| GPT-4o-mini-16k | 12800 | 3200 | 0.00000015 | 0.0000006 | 0.00384 |
| GPT-4o-mini-32k | 28000 | 4000 | 0.00000015 | 0.0000006 | 0.0066 |
| GPT-4o-mini-64k | 60000 | 4000 | 0.00000015 | 0.0000006 | 0.0114 |
| GPT-4o-1k | 800 | 200 | 0.0000025 | 0.00001 | 0.004 |
| GPT-4o-2k | 1600 | 400 | 0.0000025 | 0.00001 | 0.008 |
| GPT-4o-4k | 2800 | 1200 | 0.0000025 | 0.00001 | 0.019 |
| GPT-4o-8k | 5600 | 2400 | 0.0000025 | 0.00001 | 0.038 |
| GPT-4o-16k | 12800 | 3200 | 0.0000025 | 0.00001 | 0.064 |
| GPT-4o-32k | 28000 | 4000 | 0.0000025 | 0.00001 | 0.11 |
| GPT-4o-64k | 60000 | 4000 | 0.0000025 | 0.00001 | 0.19 |
| GPT-4-1106-1k | 800 | 200 | 0.00001 | 0.00003 | 0.014 |
| GPT-4-1106-2k | 1600 | 400 | 0.00001 | 0.00003 | 0.028 |
| GPT-4-1106-4k | 2800 | 1200 | 0.00001 | 0.00003 | 0.064 |
| GPT-4-0125-8k | 5600 | 2400 | 0.00001 | 0.00003 | 0.128 |
| GPT-4-1106-16k | 12800 | 3200 | 0.00001 | 0.00003 | 0.224 |
| GPT-4-1106-32k | 28000 | 4000 | 0.00001 | 0.00003 | 0.4 |
| GPT-4-1106-64k | 60000 | 4000 | 0.00001 | 0.00003 | 0.72 |
BYOK per i partner White-Label
Oltre ai costi dei MC, i partner White-Label devono sostenere anche i costi generati dall’esecuzione del framework multi-agente IA.Questi costi si applicano anche se i tuoi utenti finali utilizzano la propria chiave API. Esistono tre workflow che gravano sulla tua API:
-
Generazione degli intents per gli agenti IA
- Quando sono collegati due o più agenti IA
- Addebitato quando un nuovo agente visibile all’utente viene messo online o uno esistente viene modificato
-
Classificazione dell’intento della query
- Quando sono attivi due o più agenti visibili all’utente
- Prezzo per richiesta
-
Estrazione delle variabili
- Quando un agente utilizza una o più variabili
- Prezzo per richiesta
| Workflow | Input | Output | Costo/Input | Costo/Output | Costo/Esecuzione |
|---|---|---|---|---|---|
| Intent Generation (gpt-4-1106-preview) | 600 | 450 | 0.00001 | 0.00003 | 0.0011 |
| Query Intent Classification (gpt-3.5-turbo-1106) | 1000 | 50 | 0.000001 | 0.000002 | 0.0195 |
| Variable Extraction (gpt-3.5-turbo-1106) | 1000 | 100 | 0.000001 | 0.000002 | 0.0012 |
Aggiorneremo la documentazione di conseguenza.
In generale, questi costi aggiuntivi rimangono molto inferiori rispetto a quelli generati dai Message Credits.