UN

DeepSeek OCR 2 : Analyse approfondie : Comment extraire avec précision des tableaux complexes et des documents à plusieurs colonnes (Guide pratique)

Le 27 janvier, DeepSeek a publié OCR 2 en tant que modèle open source. Après analyse de leur rapport technique, je pense que cela représente un changement systémique dans la façon dont l'IA appréhende les données visuelles. Au lieu de simplement augmenter le nombre de paramètres, DeepSeek s'est concentré sur des modifications architecturales fondamentales afin d'améliorer les performances au-delà des limites des modèles vision-langage (VLM) traditionnels. DeepSeek […]

Kimi K2.5 vient de sortir : le « tueur de Claude » open source qui redéfinit le codage multimodal natif

J'ai récemment effectué des tests approfondis sur Kimi K2.5, la dernière version de Moonshot AI. Ma conclusion est sans équivoque : la principale valeur ajoutée de cette mise à jour ne réside pas seulement dans un meilleur score de performance, mais dans l'intégration du codage multimodal natif, des AgentSwarms parallèles et de la distribution Office de bout en bout au sein d'un système déployable. Le rapport technique officiel la définit comme […]