UN

DeepSeek OCR 2 Deep Dive: come estrarre con precisione tabelle complesse e documenti multicolonna (una guida pratica)

Il 27 gennaio, DeepSeek ha rilasciato OCR 2 come modello open source. Dopo aver analizzato il loro rapporto tecnico, ritengo che ciò rappresenti un cambiamento sistematico nel modo in cui l'intelligenza artificiale interpreta i dati visivi. Invece di limitarsi ad aumentare il numero di parametri, DeepSeek si è concentrata su modifiche architetturali fondamentali per migliorare le prestazioni oltre i limiti dei tradizionali modelli di linguaggio visivo (VLM). DeepSeek […]

Kimi K2.5 è appena uscito: il "Claude Killer" open source che ridefinisce la codifica multimodale nativa

Di recente ho condotto test approfonditi su Kimi K2.5, l'ultima versione di Moonshot AI. La mia conclusione è semplice: il valore fondamentale di questo aggiornamento non è solo un punteggio di benchmark più elevato, ma l'integrazione di codifica multimodale nativa, AgentSwarm paralleli e distribuzione end-to-end di Office in un sistema distribuibile. Il rapporto tecnico ufficiale lo definisce come […]