deepsic R1 vient encore de franchir une nouvelle étape il a réussi à doubler sa vitesse d'exécution et ce de manière totalement autonome laissez-moi vous annoncer que nous entrons officiellement dans l'aair des IA qui s'autoaméliore et bien bonjour à tous c'est exactement ce qui précède l'explosion de l'intelligence vous vous souvenez de ce graphique je vous l'ai montré plusieurs fois et je vous ai parlé de ce concept plusieurs fois aussi c'est le fameux papier de la conscience situationnelle et bien quand lia atteint un niveau d'intelligence équivalent à celui d'un docteur et qu'elle peut réellement générer des nouvelles
connaissances c'est là que commence l'autoamélioration récursive et que donc survient l'explosion de l'intelligence et c'est exactement là où nous en sommes le modèle O1 le modèle O3 le modèle dipsic R10 ce sont des modèles avec une intelligence de niveau doctorat et maintenant voici qu'il commence à s'auto améliorer de façon récursive ce qu'il vient de se passer ces deux dernières semaines et juste T pousstouflant et comme si cela n'était pas assez et bien la deuxième découverte incroyable que je vous montrerai en fin de vidéo vient d'une autre équipe qui a réussi à reproduire le moment Eureka
le moment ahha donc à reproduire en fait dipsic pour seulement 3 dollars maintenant et oui car il y a quelques jours je vous parler d'une équipe de berkleay qui avait réussi à copier et reproduire ce moment d'apprentissage pour seulement 30 dollars et bien on a maintenant une réduction par 10 3 2 dollars pour reproduire ce moment crucial d'apprentissage du modèle dipsic R1 au passage c'était une blague de l'un de mes abonnés sous la vidéo de Berkley elle m'avait fait bien marrer on avait tous rigolé mais en fait et bien il n'avait pas tort même pas
une semaine après on a déjà un modèle à 3 dollars et comme il dit qu'est-ce qu'il dansera dans une semaine on sera à 3 centimes en fait bon on va voir ça à la fin de la vidéo aujourd'hui je vais vous montrer ces deux avancé qui sont incroyables on dirait que ça fait des mois et des mois que je vous parle d'avancé mais non depuis la sortie de dipsic ça fait quelques petites semaines de ou 3 semaines je sais plus il se passe trop de choses bon alors commençons par voir comment le dipsic R1 a
réussi à s'améliorer pour doubler sa vitesse carrément voici le blog de Simon Wilson où il parle justement de cette amélioration de vitesse par deux alors j'en avais déjà parlé très rapidement dans une autre vidéo mais après avoir analysé en détail ce qu'il s'est passé c'est beaucoup plus important que prévu je sais plus quelle était la vidéo mais j'en ai parlé comme ça et bien j'ai bien fait d'y revenir car en fait ce qu' s'est passé c'est complètement dingue alors je vais entrer dans les détails et lire ce poste pour vous mais juste avant si vous
ne me connaissez pas sur cette chaîne je vous présente tous les jours des actualités scientifique et technologique aussi en passant de l'IA jusqu'à la robotique la médecine et tout je couvre tous les domaines donc si vous voulez rester au courant des dernières actues que vous n'entendrez nul part ailleurs n'hésitez pas à vous abonner pour soutenir la chaîne et pour vous ne louper aucune des infos bon alors ce qui est fascinant ici c'est que 99 % du code dans cette pooule Quest donc dans cette demande d'écriture de code a été écrite par dipsic R1 lui-même en
gros le code ici a tout a été écrit par lia par l'intelligence artificielle elle-même la personne qui a réalisé cela et bien s'est contenté de créer des prompts pour le modèle et vous voyez le modèle a trouvé comment s'améliorer tout seul la seule chose qu'il a eu à faire était de développer des tests et d'écrire des prompts avec quelques essais quelques erreurs en fait il a même partagé l'intégralité de l'échange entre lui-même et et dipsiic il dit voici une récente transcription que j'ai utilisé pour récrire le plugim LLM tout ça c'est des termes techniques de
programmation mais en fait encore une fois c'est dipsic R1 qui a a écrit tout ce code là il continue en disant j'ai essayé la même chose avec Om mais je pense que dipsic R1 çaen est mieux sorti alors laissez-moi vous montrer quelques-uns de ces promt rapidement alors voici l'essentiel de ce qu'il s'est passé c'est assez amusant euh je vais passer vite car le but n'est pas de rentrer dans les détails techniques mais plutôt d'analyser tout cela d'un point de vue global et voir les choses intéressantes mais je pense quand même que ce petit prédud est
important alors selon cette personne chaque réponse prenait environ 3 à 5 minutes donc vous voyez ici le modèle a vraiment pris son temps pour répondre son temps pour réfléchir avant de répondre aujourd'hui si vous utilisez chat GPT et que vous lui posez une question et bien vous voyez qu'il réfléchit mais qu'il va pas passer trop de temps en fait il va peut-être passer quoi 20 30 secondes maximum et bien maintenant imaginez avoir la possibilité de faire un prompt qui dure 5 à 10 minutes voir à 30 minutes le résultat serait tellement plus précis alors au
passage c'est ce que fait depr search maintenant je open nous a annoncé cette super Ia qui prend 30 à 1 he pour réfléchir à chaque réponse et si vous avez pas vu ça je vous renvoie vers la dernière vidéo sur deep research et maintenant voici la boucle itérative que cette personne a utilisé avec depsic on y voit essentiellement la description du problème ce qu'il voulait accomplir puis voici euh la dernière tentative qui a échoué le cadre estant posé voici le premier prompt la première demande qu'il a faite à cette IA et il a dit donc
la chose suivante à liya votre tâche c'est de convertir ce code C++ armneon smid vers un was smid en gros ce que ça fait c'est améliorer la façon dont le traitement en parallèle fonctionne avec l'architecture des puces armes bon et je ne vais pas du tout rentrer dans les détails ça c'était pour information mais en gros on va lui donner un un tas de codes existant un tas de codes informatiqu existants que vous voyez ici d'ailleurs voilà c'est vraiment du code de haut niveau puis il lui donne encore une autre instruction qui lui dit voici
la fonction que tu dois convertir donc en fait c'est la fonction qui permet cette tâche là qui permettrait de d'accélérer le le modèle et une petite indication tu dois commencer le code avec bon ça peu importe il y a il lui a ensuite donné un autre prompt un deuxième prompt en fait euh mais peu importe passons la technique pourquoi est-ce que je vous montre ça et bien avec ces prompt le modèle a pu chercher des optimisations pour s'exécuter plus rapidement c'est impressionnant on voit là une machine qui après son code s'est auto amélioré et maintenant
voici qu'il est deux fois plus rapide ce qui est génial c'est qu'on peut aussi voir le cheminement de la pensée de Lia ici regardez on peut voir ok je dois implémenter le même modèle que Mistral et cetera et à la fin on a le code et ça marche maintenant imaginez une seule seconde et bien une centaine voire un millier de ces agentsl qui tournent de façon autonome cherchant constamment des moyens de s'autoaméliorer ou de s'améliorer les uns et les autres si ça ce n'est pas le point de décollage brutal dont tout le monde parle et
bien je ne sais pas ce que c'est je vous rappelle le début de la vidéo je parlais de l'explosion de l'intelligence parce que en fait à partir du moment où vous avez on va dire des milliers d'agents Ia qui vont s'autoaméliorer entre eux et bien on ne sait pas qu'est-ce qu'ils peuvent arriver à faire en fait ça peut arriver très très très vite ils peuvent s'améliorer deux fois trois fois quatre fois 5 fois 10 fois 20 fois 100 fois on ne sait pas à ce jour ce qu'il se passera le jour où nia pourra vraiment
s'autoaméliorer de façon constante et donc potentiellement peut-être passer de l'agi à l'Asie direct en fait sans étape intermédiaire qui sait ça c'est l'avenir qui nous le dira moi en tout cas je serai là pour tout courir et pour vous informer de tout donc si ce n'est pas déjà fait n'oubliez pas de vous abonner alors j'aimerais vous montrer autre chose en revenant à ce graphique donc de la conscience situationnelle voici gpt4 donc qui est équivalent à un lycéum brillant ici mais en fait on est bien au-delà maintenant avec avec O1 O3 mini O3 qui sort bientôt
et que dire de Deep research qui surpasse maintenant beaucoup de docteurs dans la découverte et surtout et surtout en fait la synthèse de nouvelles connaissances alors deep research est très très récent il l' annoncé il y a 2 jours euh donc on n pas encore de on n pas encore assez de recul pour savoir quel est son potentiel exact mais s'il fait vraiment ce qui est annoncé euh on ne va pas beaucoup attendre pour voir des découvertes en fait faites 100 % par lia qui risque d'arriver très vite la semaine prochaine peut-être dans de semaines
qui sait on verra en fait je le répète mais une fois qu'on aura la capacité de faire de la recherche à nia de façon automatisée et bien c'est là qu'on atteindra la super intelligence et franchement on a l'impression qu'on est sur le point d'y arriver du moins c'est l'impression que j'ai en fait je sais pas trop comment l'expliquer mais ça fait un petit moment déjà que je couvre les avancées à nia et encore un plus long moment que je suis dans le domaine de Lia mais franchement entre le 1er janvier 2025 donc cette année et
aujourd'hui même et bien ça a été du nonstop tout s'accélère et surtout depuis la sortie de dipsic en fait donc vous savez qu'ici j'aime bien vous donner tous les points de vue et que vous vous fassiez votre propre idée donc euh ça c'était mon point de vue maintenant il y a deux écoles parce que certains des plus grands experts à nia disent que ce décollage ne sera pas instantané du jour land même que ce sera plutôt progressif mais en même temps quand on regarde ce graphique que je viens de vous montrer et quand on regarde
tout ce qu' s'est passé dernièrement et bien on dirait qu'on va voir ce point binaire où on aura vraiment ce décollage brutal voici Yan leuken je pense que vous le connaissez tous si vous suivez la chaîne c'est un des pères fondateurs de Lia et il est français en plus et maintenant c'est le directeur de recherche à nia chez ma donc anciennement en fait c'est le groupe Instagram Facebook WhatsApp et cetera et il dit la chose suivante l'émergence de l'AG quelle que soit votre définition ne sera pas un événement mais ce sera progressif donc selon vous
est-ce que ce sera plutôt le scénario 1 ou le scénario 2 est-ce que ce sera plutôt l'explosion de l'intelligence ou est-ce que ce sera le décollage calme et il dit aussi la chose suivante je cite une fois qu'elle apparaîtra quelque part elle sera reproduite par beaucoup en relativement peu de temps maintenant siil a et toutes les innovations sont derrière les murs d'entreprise à code fermé comme par exemple Opena on n'aurait probablement pas ça mais avec l'Open Source on accélère la capacité de tous à y arriver et c'est pourquoi je le répète je l'ai déjà dit
mais c'est pourquoi la sortie de dipsic R1 a été si importante dans le dans l'industrie de Lia comme vous le voyez depuis qu'elle est sorti tout ce que ça a permis c'est juste énorme elle a permis à l'Open Source de faire un bon en avant d'environ 3 à 6 mois peut-être et donc elle a obligé les entreprises fermées comme par exemple open à accélérer leur calendrier et à tout nous donner tout ce qu'ils avaient eux dans leur laboratoire rappelez-vous dans la dernière vidéo que j'ai faite sur Sam Altman sur la le la session de questions-réponse
qu'il avait faite sur redit et en parlant du modèle dipsic il avait dit la chose suivante et bien c'est un très bon modèle nous produirons de meilleurs modèles mais nous maintiendrons donc moins d'avance que les années précédentes voilà donc maintenant nous avons une intelligence artificielle qui s'améliore toute seule et il y a quelques jours je vous parlais de ces doctorants de Berkley qui avait réussi à recréer la capacité de réflexion de psic pour seulement 30 dollars en utilisant essentiellement la même technique mais appliquer un cas d'utilisation très précis et bien accrochez-vous bien un abonné m'avait
fait la blague mais c'est la réalité maintenant nous avons un autre exemple d'une équipe qui a réussi à reproduire ce moment le moment Eureka le moment aha donc la la reproduction de dipsic pour seulement 3 dollars et ce moins d'une semaine plus tard si ça c'est pas une accélération brutale et bien je sais pas ce que c'est regardez ce poste c'est langchîn qui dit ravi de vous présenter r1v donc en fait ça utilise exactement la même technique que les doctorants de Berkley et que d' psy R1 ils utilisent l'apprentissage par renforcement avec récompense vérifiable le
fameux que vous connaissez déjà j'en suis sûr pour apprendre donc les les modèles à apprendre des capacités générales de comptage ici et c'est la clé l'apprentissage par renforcement avec des récompenses comme on avait vu alors ça fonctionne incroyablement bien quand on a une fonction de récompense bien définie ce qui signifie qu'il doit y avoir une réponse connue à la question du problème en AM mon par exemple 2+ 2 = 4 ça c'est une question bien définie mais quelle est ta couleur préférée par exemple et bien n'a pas de réponse définie c'est juste une opinion on
peut dire dans un cas on peut utiliser le RLF donc l'apprentissage par renforcement dans un autre non c'est la raison pour laquelle cette technique en fait marche si bien pour les tâches stem science technologie ingénierie mathématique quand vous avez une tâche à résoudre dans dans une de ces catégories là avec une entrée bien définie et une sortie bien définie également une question une réponse là le ce genre de modèle Excel en fait c'est pour ça que je vous dis souvent que si vous voulez écrire un poème n'utilisez pas O3 ça sert à rien utilisez plutôt
le chat GPT normal ou même cloud en fait cloudud est très bon pour ça pour pour les tâches un peu plus créatifes et au passage petite remarque tout ça je vous l'apprendre dans ma formation et bien plus encore en fait je vous apprends à utiliser plein d'outils d'IA qui vont vous servir très précisément dans votre vie ou ne serait-ce que si vous voulez rester à jour de la technologie de ce qu'il se fait et si vous voulez en apprendre plus sur cette technologie qui comme je le dis toujours et souvent c'est la plus grande technologie
que l'humanité n'est jamais inventée donc si jamais ça vous intéresse vous trouverez tous les liens sous la vidéo en commentaire épinglé bref donc voilà c'est quand vous allez entraîner le modèle à savoir quand il a raison et quand il a tort et bien c'est là qu'on obtient ce comportement émergent de réflexion ce moment herka et on peut le faire sur un tout petit modèle mod dans un cas d'utilisation très spécifique comme ici par exemple et en plus pour seulement quelques dollars maintenant et c'est complètement Open Source regardez ça modèle de 2 milliards de paramètres surpasse
le modèle de 72 milliards de paramètres avec seulement 100 étap d'entraînement pour moins de 3 dollars c'est du jamais vu ça s'accélère avant ça coûter extrêmement cher de faire un modèle D a de 72 milliards de paramètres et bien maintenant vous prenez 3 dollars et vous pouvez entraîner un modèle de 2 milliards de paramètres ement et qui sera meilleur que les gros modèles de 72 milliards de paramètres je trouve ça assez dingue à quel point on est passé vite d'une semaine à l'autre en terme de progrès mais bon ça je crois que vous l'aurez compris
j'ai l'impression de de me répéter pas mal mais en tout cas leur projet ici de de reproduction à 3 dollar ils nous disent que ce sera open source et que pour l'instant c'est spécifiquement une capacité de comptage alors vous vous dites peut-être bon c'est assez basique à quoi ça sert vraiment et bien imaginez on dirait qu'on se dirige vers une multitude de ces très très petit modèle avec une intelligence de base fondamentale et le minimum semble être autour de 1,5 milliards de paramètres ce genre de modèles vous pouvez les faire tourner sur votre téléphone vous
savez qu'aujourd'hui il est possible de faire tourner des modèles diia sur votre PC mais cela demande des cartes graphiques énormes en fait des des puces de calcul qui vont faire les calculs d'IA il faut une grosse quantité d'énergie et surtout il vous faut des puces très avancées et bien ces petits modèles là de 1,5 milliards de paramètres ils sont si petits que vous vous pourrez les faire tourner sur votre portable imaginez avoir un chat GPT local sur votre portable qui serait uniquement confiné à votre portable et bien c'est probablement l'avenir vers lequel on se dirige
à mon avis on aura plus de modèles généralistes massifs comme un chat GPT très avancé mais ce ne sera pas tout en fait il s'agit vraiment de prendre tous ces petits modèles que n'importe qui peut créer en open source chez lui avec sa base de données puis de construire dessus et de les rendre vraiment performants dans des a d'utilisation très spécifique à ce que vous voulez rien ne vous empêcherait aujourd'hui d'entraîner un petit modèle comme ça sur toutes les données de je sais pas votre entreprise par exemple une base de données de tous vos mails
ou en fait peu importe vous pouvez entraîner des IA sur à peu près tout car comme vous le voyez en S étapes ils ont fait passer le modèle de 2 milliards de paramètres de 53 % de précision sur ce problème ici de comptage à 99 %. pratiquement parfait battant donc le modèle de 72 milliards qui lui était à 94 % c'est assez incroyable et voici le projet open source juste ici si vous voulez pour ceux qui se'y connaissent vous pouvez l'essayer vous-même d'ailleurs voilà toute la communauté open source peut maintenant voir ce qui a si
bien fonctionné pour dpsic le reproduire innover dessus et même l'éteindre et c'est ça la puissance de l'Open Source quand est-ce que le progrès va ralentir et bien pas de siôt j'ai l'impression si vous avez bien écouté je pense que vous comprenez pourquoi et si vous n'êtes pas encore abonné vous pouvez le faire car une nouvelle vidéo de ce genre et bien d'autres vous attendent chaque jour sur cette chaîne d'ailleurs partagez-moi vos impressions dans les commentaires votre avis compte énormément et a mon cher abonné qui avait fait la blague sur la vidéo de Berkley si vous
le revoyez par les commentaires n'hésitez pas à lui lâcher un pouce en tout cas une chose est sûre ce voyage dans l'univers de Lia et bien nous le faisons ensemble car en ce moment même et bien lia franchement elle transforme chaque secteur chaque métier chaque aspect de notre quotidien dans 6 mois dans 1 an et bien ce ne sera plus une option ce sera une nécessité même et vous avez aujourd'hui l'opportunité de prendre une avance décisive alors pour ceux qui veulent approfondir j'ai créé une formation accessible à tous vous retrouverez le lien en commentaire épinglé
sous la vidéo merci encore pour avoir regardé et je vous dis à demain pour de nouvelles découverte passionnante si cette analyse vous a intéressé et que vous voulez aller encore plus loin dans la compréhension des enjeux géopolitiques actuels je vous invite à découvrir ma nouvelle chaîne vision actu vous y trouverez des analyses approfondies sur ce su et bien d'autres qui façonnent notre présent et notre futur n'oubliez pas de vous abonner aux deux chaînes pour ne rien manquer à très bientôt pour de nouvelles analyses