Luca Verdi

Developer e tech writer. Spiega la tecnologia dal punto di vista tecnico senza perdere di vista l'accessibilità. Ex software engineer, ora si dedica al giornalismo tech.

818 ARTICLES

APPLE ·#· 12 days ago

Apple ha nascosto una filigrana invisibile nelle foto Apple integra la filigrana invisibile SynthID di Google DeepMind nelle foto modificate con Apple Intelligence, garantendo tracciabilità senza compromettere l'esperienza utente.

EDITORIALS PICK'S ·#· 12 days ago

Google tiene per sé la bacchetta del direttore d’orchestra Google introduce l'agente di contesto sufficiente nel framework agentic RAG, migliorando l'accuratezza del 34% rispetto al RAG standard.

EDITORIALS PICK'S ·#· 14 days ago

I benchmark per agenti AI certificano se stessi ServiceNow presenta EVA-Bench, un benchmark per agenti AI che usa tre modelli frontier per validare ogni scenario, garantendo robustezza e trasparenza.

EDITORIALS PICK'S ·#· 16 days ago

Gpt-rosalind ha fallito il test sulla terapia genica Il caso studio di GPT-Rosalind sulla terapia Duchenne mostra debolezze metodologiche, sollevando dubbi sulla validità clinica delle analisi AI.

EDITORIALS PICK'S ·#· 16 days ago

OpenAI non controlla più la qualità di Codex OpenAI Codex ha 5 milioni di utenti settimanali, ma il 33% degli output soffre di degenerazione testuale. L'addestramento in due fasi riduce il problema.

EDITORIALS PICK'S ·#· 18 days ago

Il gateway di Amazon Bedrock frena l’innovazione Amazon Bedrock AgentCore usa un gateway centralizzato con Lambda e Cedar per controllare l'accesso agli agenti AI, garantendo sicurezza ma rischiando colli di bottiglia.

EDITORIALS PICK'S ·#· 19 days ago

Costruire un agente AI è diventato più facile che validarlo Codex accelera la prototipazione ma la validazione su larga scala richiede budget token esponenziali, spostando il collo di bottiglia a valle.

EDITORIALS PICK'S ·#· 19 days ago

I test stanno cambiando l’infrastruttura AI Le valutazioni di terze parti rivelano che l'harness e l'infrastruttura AI stanno diventando verticali, ottimizzate per compiti specifici.

EDITORIALS PICK'S ·#· 21 days ago

I modelli AI nascondono la loro vera potenza Il playbook OpenAI rivela che harness e test-compute distortono le valutazioni dei modelli agentici, come Gemini 3.5 Flash.

EDITORIALS PICK'S ·#· 23 days ago

Gli agenti AI scrivono il 90% del codice di Warp Itbench-aa mostra che i modelli falliscono nel diagnosticare incidenti Kubernetes. Warp rivela che gli agenti co-creano il 90% delle pull request.