Entra nella community: ricevi ogni settimana i migliori contenuti, guide esclusive e anteprime direttamente nella tua inbox.
Luca Verdi
Developer e tech writer. Spiega la tecnologia dal punto di vista tecnico senza perdere di vista l'accessibilità. Ex software engineer, ora si dedica al giornalismo tech.
Apple ha nascosto una filigrana invisibile nelle fotoApple integra la filigrana invisibile SynthID di Google DeepMind nelle foto modificate con Apple Intelligence, garantendo tracciabilità senza compromettere l'esperienza utente.
I benchmark per agenti AI certificano se stessiServiceNow presenta EVA-Bench, un benchmark per agenti AI che usa tre modelli frontier per validare ogni scenario, garantendo robustezza e trasparenza.
OpenAI non controlla più la qualità di CodexOpenAI Codex ha 5 milioni di utenti settimanali, ma il 33% degli output soffre di degenerazione testuale. L'addestramento in due fasi riduce il problema.
Il gateway di Amazon Bedrock frena l’innovazioneAmazon Bedrock AgentCore usa un gateway centralizzato con Lambda e Cedar per controllare l'accesso agli agenti AI, garantendo sicurezza ma rischiando colli di bottiglia.
I test stanno cambiando l’infrastruttura AILe valutazioni di terze parti rivelano che l'harness e l'infrastruttura AI stanno diventando verticali, ottimizzate per compiti specifici.
Gli agenti AI scrivono il 90% del codice di WarpItbench-aa mostra che i modelli falliscono nel diagnosticare incidenti Kubernetes. Warp rivela che gli agenti co-creano il 90% delle pull request.
Utilizziamo i cookie
Questo sito utilizza cookie tecnici necessari al funzionamento. Puoi accettare o personalizzare le tue preferenze. Per maggiori informazioni consulta la nostra Cookie Policy.