imaginez une nia plus performante que gpt4 qui coûte 50 fois moins cher à utiliser et qui est totalement gratuite impossible c'est pourtant exactement ce que vient de réaliser une petite équipe chinoise avec seulement 5,5 millions de dollars de budget il s'agit de deepsic version 3 et ce n'est pas juste un nouveau modèle d'IA c'est une révolution dans la manière même dont l'intelligence artificiel fonctionne quand GPT 4 utilise toute sa puissance pour répondre à la moindre question dipsic active uniquement les experts dont il a besoin le résultat des performances exceptionnelles en mathématiques en programmation en traduction et des coûts d'utilisation divisés par 50 dans cette vidéo vous allez découvrir comment une start-up inconnue il y a encore quelques mois est en train de bouleverser les règles du jeu de Lia on va plonger dans les performances surprenantes de ce modèle explorer la technologie révolutionnaire qui le rend si efficace commençons par analyser les performances de dipsic face au plus grand modèle d'IA les résultats des tests sont particulièrement révélateurs en mathématiques d'abord nous avons des écarts impressionnants le test mat 500 qui évalue la capacité à résoudre des problèmes mathématiques complexes montre dipsic à 90,2 % de réussite loin devant GPT 4 à 74,6 %. mais c'est sur le concours aime 2024 que la différence est la plus spectaculaire dipsic résout 39 2 % des problèmes quand GPT 4 plafon à 9,3 %. pour mettre ces chiffres en perspective c'est comme avoir un étudiant de première année capable de résoudre quatre fois plus de problèmes de niveau doctorat que ses concurrents en programmation dipsic montre aussi sa force sur la plateforme code force où s'affronte les meilleurs programmeurs il se classe dans le top 50 et 1,6 %.
c'est plus du double des performances de GPT 4 qui atteint seulement 23 6 % le live code bench confirme cette tendance le code produit par dipsic fonctionne du premier coup dans 40,5 % des cas contre 33,4 % pour gpt4 face à Claude 3,5 la compétition est quand même plus serrée mais tout aussi intéressante Claude garde l'avantage sur certains tests d'édition de code comme header edit avec 94,2 % contre 79,7 %. mais dès qu'on passe aux tâches de compr ion approfondie comme le test drop qui évalue la compréhension fine d'un texte dipsic reprend l'avantage léger cependant avec 91,6 % contre 88,3 %. au niveau de la compréhension et la justesse des langues sur les tests de chinois dipsic montre une excellente maîtrise avec 90,9 % bon normal pour une IA chinoise cela représente un niveau comparable au meilleur modèle et sur les tests d'anglais il a atteint 89,1 % sur mmlu Redux légèrement devant Claude à 88,9 %.