Amazon ha un piano per chi usa Bedrock
Amazon promuove Claude come giudice per RFT su Bedrock, creando lock-in architetturale. Sun Finance dipende da Anthropic per l'estrazione documentale.
Amazon ha investito 13 miliardi in Anthropic e promuove Claude come giudice su Bedrock
Il blog AWS su reinforcement fine-tuning con LLM-as-a-judge descrive un metodo per allineare modelli linguistici usando segnali di reward automatici. La tecnica si basa su funzioni di reward verificabili via codice (RLVR) o tramite un secondo LLM che funge da giudice (RLAIF). Il punto è che Amazon, nel suo stesso blog, consiglia esplicitamente modelli Large/Heavyweight per compiti di valutazione complessi: Claude Opus e Amazon Nova Pro sono elencati come giudici preferiti. Nessuna menzione di modelli open-source o di terze parti. La scelta architetturale, apparentemente neutrale, nasconde una strategia di lock-in: chi costruisce pipeline di allineamento su Bedrock finisce per dipendere dai modelli Anthropic, di cui Amazon è il principale finanziatore.
Il giudice è Claude: come funziona sotto il cofano
L’RFT adotta due modalità di giudizio: rubric-based, che assegna un punteggio numerico a una singola risposta in base a criteri predefiniti, e preference-based, che confronta due risposte e seleziona la migliore. Il blog AWS sottolinea che il giudice LLM fornisce feedback contestuale su correttezza, tono e sicurezza, e che l’uso di un LLM separato come giudice rende l’allineamento più flessibile in contesti dove i reward sono difficili da definire manualmente. Il problema è che il modello giudice raccomandato è proprio Claude Opus o Sonnet. In pratica, ogni volta che un team vuole allineare un modello personalizzato su Bedrock usando RFT, è incentivato a usare un modello Anthropic come arbitro. Non è solo una questione di costo: è una dipendenza architetturale.
Il caso Sun Finance: una pipeline costruita su Claude
Un esempio concreto arriva dalla collaborazione tra Sun Finance e l’AWS Generative AI Innovation Center. Il progetto, durato 32 giorni di collaborazione AWS dal kickoff (26 agosto 2025) alla presentazione finale (9 ottobre 2025), ha visto un proof of concept di 6 settimane di proof of concept con generative AI. La soluzione finale usa Claude Sonnet 4 per l’analisi visiva e la strutturazione AI dei documenti di identità. Il testo estratto viene passato ad Amazon Bedrock, che lo struttura in campi JSON standardizzati. Notate il dettaglio: la pipeline non utilizza i modelli Titan di Amazon, ma esclusivamente Claude di Anthropic. La scelta è presentata come tecnica, ma il risultato è che Sun Finance ora dipende da Claude per il cuore del suo processo di estrazione documentale. Se Anthropic modifica le API o i prezzi, l’operatività trema.
13 miliardi di ragioni per dubitare
Amazon ha investito in Anthropic ben 13 miliardi di dollari, con la possibilità di arrivare a 33 miliardi legati a traguardi commerciali. Il primo investimento, annunciato a settembre 2023, era fino a 4 miliardi. Il 20 aprile 2026, Amazon ha annunciato un investimento aggiuntivo di 5 miliardi, portando il totale a 13. Come riporta guadagni Amazon non dal commercio, la plusvalenza sulla partecipazione in Anthropic è stata enorme. Ma dal punto di vista tecnico, questi numeri dicono una cosa chiara: Amazon non ha interesse a promuovere modelli alternativi nel suo ecosistema Bedrock. RFT con LLM-as-a-judge è il cavallo di Troia. Il giudice è Claude, e chi sviluppa su Bedrock sta firmando un assegno in bianco alla coppia Amazon–Anthropic.
Per chi costruisce applicazioni AI, l’implicazione è immediata: se adottate RFT su Bedrock con un modello giudice pesante, state legando la vostra pipeline di allineamento a un fornitore specifico.
Open source e trasparenza? Non qui. La scelta architetturale – usare Claude come giudice – non è solo una convenienza temporanea: è un lock-in operativo che rende migrazioni future dolorose. Amazon ha preso 13 miliardi di ragioni per non rendere questa trappola trasparente. Sta a voi, sviluppatori, leggere il codice tra le righe del blog.