Google ha introdotto un limite di spesa per l'API Gemini

Google ha introdotto un limite di spesa per l’API Gemini

Google introduce Project Spend Caps per Gemini API dopo un bug di fatturazione che causò addebiti milionari. La funzione permette limiti mensili a livello progetto con upgrade automatici dei tier.

La funzione permette di stabilire un tetto mensile per evitare addebiti imprevisti come quelli segnalati.

Nell’agosto 2025, la segnalazione sul forum degli sviluppatori Google era inequivocabile: una società aveva ricevuto una fattura errata di oltre 10 milioni di JPY — più di 70.000 dollari — per utilizzo dell’API Gemini che non aveva mai sostenuto. Il dettaglio più inquietante? Anche dopo aver eliminato tutte le chiavi API correlate, gli addebiti continuavano ad accumularsi a un ritmo di circa 1,5 milioni di JPY al giorno, quasi 10.000 dollari ogni ventiquattro ore. Un bug nel sistema di fatturazione di Google Cloud aveva trasformato un’integrazione API in un disastro finanziario. Ieri, 16 marzo 2026, Google ha risposto con un annuncio che cambia strutturalmente il modo in cui gli sviluppatori possono governare i costi: stando a una copertura esterna su Project Spend Caps, il lancio era atteso da mesi.

I nuovi meccanismi di controllo sotto il cofano

Il cuore dell’annuncio è Project Spend Caps in Google AI Studio: una funzione che permette di stabilire un limite mensile in dollari sulla spesa dell’API Gemini a livello di singolo progetto. L’analogia più efficace è quella del fusibile elettrico: non impedisce il flusso di corrente in condizioni normali, ma interviene prima che un picco anomalo bruci l’impianto. Prima di questo strumento, l’unica difesa contro spese incontrollate era la vigilanza manuale — monitorare dashboard, impostare alert su Google Cloud Billing, sperare che un bug non sfuggisse inosservato per settimane.

Tecnicamente, la documentazione sui limiti di spesa di Gemini API chiarisce che il sistema opera su due livelli distinti: uno a livello di account di fatturazione e uno a livello di progetto. I Project Spend Caps configurabili direttamente da AI Studio riguardano quest’ultimo livello, il che è particolarmente utile per chi gestisce più progetti sotto lo stesso account — ad esempio un’agenzia che vuole isolare i costi per cliente, o un team di prodotto che vuole prevenire che un singolo servizio in produzione consumi l’intero budget disponibile.

Ma Google non si è fermata ai limiti di spesa. L’annuncio include anche una revisione completa degli Usage Tiers, i livelli di utilizzo che determinano la capacità disponibile — request per minuto, token per giorno, accesso a modelli specifici. Il nuovo sistema introduce upgrade automatici: man mano che l’utilizzo cresce e la cronologia dei pagamenti matura, la piattaforma promuove automaticamente l’utente al tier successivo, senza richiedere una richiesta manuale o un’attesa arbitraria. È un cambiamento che elimina un punto di frizione reale: chiunque abbia mai aspettato l’approvazione manuale di un tier upgrade in una fase critica di sviluppo sa quanto sia frustrante. A completare il quadro, Google ha introdotto un nuovo dashboard dedicato ai rate limit, che offre una visione aggregata del progresso verso i limiti di velocità per ogni progetto importato in AI Studio — uno strumento di osservabilità che mancava e che ora rende i comportamenti dell’API molto più leggibili in tempo reale.

Cosa cambia per gli sviluppatori e dove si posiziona Google rispetto ai competitor

Il contrasto con i competitor è istruttivo. I controlli di budget di OpenAI a livello di progetto erano già disponibili almeno da novembre 2024 — oltre sedici mesi fa. Gli sviluppatori che usano la piattaforma OpenAI potevano già configurare soglie di spesa per singolo progetto, con rate limits e permissioni sui modelli gestibili dalla stessa interfaccia. Anthropic, dal canto suo, utilizza per i quota tier di Claude API un sistema a quattro livelli con limiti di spesa mensili integrati: una volta raggiunto il tetto del tier attuale, il consumo si blocca fino al mese successivo o fino all’avanzamento a un livello superiore — un meccanismo più rigido, ma che ha il vantaggio di rendere i tetti di spesa strutturali e non opzionali.

Google arriva quindi a questa funzionalità con un certo ritardo rispetto ai principali concorrenti, ma l’arrivo non è privo di valore. La combinazione di spend caps configurabili, upgrade automatici dei tier e dashboard di osservabilità costruisce un’infrastruttura di controllo più coerente di quanto non fosse prima. Per chi sta valutando quale API integrare in un nuovo progetto, la capacità di limitare la spesa a livello di progetto non è una funzione secondaria: è spesso un prerequisito per ottenere l’approvazione interna in aziende che gestiscono budget separati per team o prodotti. Il fatto che ora sia gestibile direttamente da AI Studio, senza passare dalla console Google Cloud, abbassa anche la barriera tecnica per chi non ha familiarità con l’infrastruttura GCP.

Con Project Spend Caps, Google non si limita a tappare un buco lasciato aperto da un bug di fatturazione. Porta la piattaforma a un livello di maturità operativa che ci si aspetta da un servizio commerciale di questo tipo, aggiungendo trasparenza dove prima c’era ambiguità e controllo dove prima c’era speranza. Per gli sviluppatori che costruiscono su Gemini API, la domanda architettonica non è più “come mi proteggo da una spesa incontrollata?” ma “come struttura i miei progetti per sfruttare al meglio questi nuovi livelli di isolamento dei costi?” È uno spostamento sottile, ma significativo.

Facebook X Network Pinterest Instagram
🍪 Impostazioni Cookie