Et ça magnifique on voit on voit les nombres augmentés c'est parfait c'est bon signe le clap magnifique super bonjour tout le monde. Je suis aujourd'hui avec Jean-George Perin. C'est le l'Alsatien le plus connu aux États-Unis ou pas, je sais pas si on peut le présenter comme ça. Surtout un des data architecte Dada Dada lover leader plus Data passionné euh multi multi de de livres. Donc on va parler pas mal de de data produit, data contract de comment ça marche à l'air de Lia. J'ai j'ai hâte d'en d'en discuter avec toi parce que ça fait un
bout de temps qu'on en parle aussi. Ça fait un petit bout de temps qu'on en parle. Ouais. Merci beaucoup Johan de m'avoir invité. Ouais, c'est déjà que profiter de ton retour en France, c'est super. Euh est-ce que tu peux déjà représenter un peu qui tu es dans Bon, tu as une longue carrière donc faisons. On va faire vite. On va faire vite. Ouais. Donc je suis je suis je suis alsacien à la base et j'ai décidé il y a un peu un à peu près 10 ans de partir aux États-Unis euh où je suis devenu
j'avais j'étais entrepreneur en France avant donc j'ai une idée particulière pour les entrepreneurs. Euh et arrivé aux États-Unis euh je suis devenu consultant et puis dans des je travaill dans des grandes boîtes comme PayPal, Expedia, Advance Autoparts et euh et maintenant je travaille chez Actian. Euh j'ai commencé il y a pas longtemps, j'étais product manager et puis maintenant je vais m'occuper plus de stratégie et de toute leadership avec notre ami Oleon B que tout le monde connaît. Voilà le fameux. Et euh Oui. Puis même tu avais pas mal de de piges de IBM Champion. Il
y a Ouais. Alors ouais. Alors j'ai écrit j'ai écrit je suis à mon je suis sur mon 4e bouquin publié. Il y a des bouquins que j'ai self publié quoi. Self publ quoi euh et j'ai euh j'ai eu quelques titres d'industrie dont un lifetime IBM champion. Il y en a une trentaine dans le monde quoi. C'est comme ça que IBM définit leur tout leaders et puis voilà. Donc ouais un peu fier quand même. Cool. Et euh bah si on rentre un peu dans un vif de certains des sujets que je voulais aborder avec toi, si
tu te souviens l'année dernière, on s'est croisé au Texas, au data des Texas et tu avais animé une table ronde le dimanche sur quelle définition enfin une bonne fois pour tout ce qui est un data produit. Je suis pas sûr qu'on on y soit arrivé pendant la table ronde mais ça va faire un début. On avait beaucoup avancé en tout cas. On avait beaucoup avancé. C'était c'était un moment assez exceptionnel. On avait réussi à mettre 40 personnes dans dans une pièce pendant 1 heure et puis il y a pas eu de sang même au Texas.
Euh et on avait réussi à à mettre des gens qui sont des des des gens de la data et des gens du produit et euh et tout le monde avec des opinions assez assez tranchées et et on a on a réussi moi on a réussi à à faire un bon draft que j'ai fini un peu après et il est pas vraiment contesté. C'est la définition qui est maintenant sur Wikipédia quoi de de ce que c'est qu'un data producto donc je suis assez content en fait du résultat final quoi. Ouais. Donc ça c'était quelques encore quelques
allers-retours mais presque un an après l'on ça commence enfin à se il y aura jamais de consensus de de partout mais au moins il y a il y a des Non mais à partir d'un à partir d'un à partir d'un de quelque chose tu peux tu peux continuer à construire tu vois. Je veux dire, tu on a une on a une bonne on a une bonne V1 quoi. Bon, on a peut-être pas une V1 parce qu'il y avait déjà eu des des des approximations, des définitions avant, mais on a on a quelque chose qui devient
assez solide, qui est assez respecté. Euh euh c'est un peu long, euh la définition est un peu longue, hein. Euh donc je vais pas la réciter parce que déjà je Non, mais que en tes propres mots, chacun chacun chacun peut aller sur Wikipédia. Mais en gros euh c'est un c'est un c'est un il faut imaginer un dataset dans dans la dans l'esprit d'un dans l'esprit d'un d'un data product qui représente des par exemple des données relationnelles. Euh on peut imaginer que euh c'est un dataset avec éventuellement plusieurs datasets qui peuvent être intégrés à l'intérieur et
qui peut avoir des relations entre eux et il peut y avoir tout un système de commande, tout un système de contrôle autour. Donc c'est quelque chose d'actif avec lequel on peut interagir. Donc euh c'est un peu c'est un peu ça en en short la la définition en en suivant tout ce qui est fait hein de findable, accessible, interoperable and reusable quoi. Donc c'est voilà, c'est à peu près ça le c'est pas c'est pas juste le fichier CSV quoi. Ça c'est pas un data product quoi. C'est c'est un fichier ça peut être un fichier CSV mais
avec plein d'autres choses. Et un data product peut avoir plusieurs de ces artefacts qui sont souvent des output portes. Donc on peut imaginer que même dans le cadre de l'IA, on pourrait avoir un modèle à l'intérieur d'un data product ou des embedings ou des choses comme ça quoi. Ouais. Et donc il y a une chose que tu as pas mentionné mais du coup exprès c'est pas lié à une technologie, c'est pas lié à quoi que ce soit de de technique. C'est un ensemble de euh structuration et de bonnes pratiques qu'on peut qu'on qu'on doit mettre
autour de de su Ouais. Et et c'était c'était un c'était un c'était un exercice essentiel. Un des trucs que j'ai pas dit dans ma dans dans me présentant, c'est que je suis ça fait je viens d'être élu là pour la 3ème année, le le le CH, donc le président de du comité technique d'un projet qui s'appelle Beatle au sein de la fondation Linux qui définit en fait on a commencé par définir ce que c'était qu'un data contract. Maintenant, on en est pardon, on en est à définir en fait, on a défini ce que c'était un
data un data product en anglais dans le texte, on va dire, et il a pour qu'on puisse le normaliser, le standardiser. Donc la la la grosse motivation en fait de tout ce qui est de Beatle, c'est de pouvoir normaliser des data contract, des data product et d'autres éléments de data pour faciliter l'interopérabilité des systèmes quoi. Tu peux nous réexpliquer un peu les cet écosystème de standardisation parce que tu me Il y a Beatle, il y a OCDS au au DPS au DPS arrivé euh il y a il y a un peu plusieurs initiatives de de
structuration de de d'open source autour de ces sujets. Ouais. Alors alors alors le c'est c'est parti. Quand j'ai quand j'ai travaillé chez quand j'ai travaillé chez PayPal l'équipe dont je faisais partie euh on a construit le premier datamèche euh chez chez PayPal et quand on a commencé à à construire le le produit le premier datamèche l'idée c'était OK on construit un data product donc on s'est dit on va construire un data product et quand on a construit dat product c'est là où on s'est rendu compte en fait ah ben il nous faut un il nous
faut une description des ressources quoi. Et donc le premier le premier data contract est né et la la V1 de ce data contract template et l'idée c'était de définir de s'en servir comme d'un comme d'un comme d'un descripteur de ressources quelque part comme beaucoup de fichiers que sur Cubernetis par exemple les descripteurs de ressources sur Cubernetis. Donc l'idée c'était un peu c'était un peu ça. Euh et euh mais on avait on était pas parti maintenant quand je quand je parle de je par quand je parle à beaucoup de gens euh je dis on commence par
le data contract puis on va sur le produit si on va puis on va sur le mèche éventuellement. Euh maintenant quand nous chez PayPal on a commencé par le produit et c'est là où on s'est rendu compte qu'il manquait quelque chose quoi. D'accord. Donc euh donc on on est parti on est parti sur le data contract. On a eu notre V1 avant quand on est passé en avant de passer en prod, on est passé on a on a changé notre V1 en V2. la V1 c'est généralement on essuie un peu les plâtres et cetera et
chez PayPal on a eu le droit de open sourcer la la ce ce template de data contract quoi. Donc en fait et euh quand je suis parti de chez PayPal, il y avait pas vraiment j'ai pas vu qu'il y avait quelqu'un qui avait l'appétit de continuer ça. Donc j'ai pris, j'ai fait un forc, je suis allé voir la fondation Linux avec l'association avec don dont jeis parti et ils ont dit "Banco vas-y" quoi. Et c'est là où en fait on a eu le premier, on a renommé le template en open data contract standard au DCS.
Euh et l'idée c'était de de de je voulais pas être tout seul quoi, je voulais pas dire c'est moi. Euh donc j'ai fait le tour un petit peu des acteurs même physiquement je suis allé en Allemagne, je suis allé en Belgique. Euh alors ça para ça paraît pas loin de Strasbourg mais de de New York ça faisait un peu plus loin. Euh et je suis allé les voir et puis je leur ai dit ben écoutez voilà c'est j'ai envie de monter ça. Est-ce que vous en êtes ? Et je suis allé voir les gens qui
faisaient qui faisaient du data contract, par exemple les gens de chez Ino qui avaient dat data datam manager et cetera et ils ont dit "OK, banco, on y va quoi ?" Et donc on s'est retrouvé euh voilà petite quinzaine euh à la fois du il y avait à la fois du vendeur, d'accord ? vendeur de soft, il y avait de du prestataire de conseil et il y avait de du de l'enduser quoi. Et euh et c'est ce que je voulais, je voulais avoir je voulais avoir ce mix en fait de de de richesse, d'analyse des
besoins, tu vois, pas que ce soit un vendeur qui tire la couverture à lui ou un super vendeur avec tout plein de petits vendeurs à côté, je pas d'allusion, euh qui qui en fait qui tire la couverture à lui. Je voulais vraiment avoir cette combinaison de cette combinaison de de de plus pluriel quelque part sur tu vois sur l'objet quoi. Et donc pendant un an, on a trava on a on a d'abord réadapté en fait on a viré certains trucs de qui étaient propriétaire à PayPal même qui était parti en open source. Euh on a
nettoyé ça euh et puis on a sorti la version 3 de ODCS il y a un tout petit peu plus d'un an maintenant euh et qui qui était vraiment le le le la fondation euh solide qui est maintenant un standard de facto par la par l'industrie. Euh j'ai vu des sondages il y a pas longtemps que malheureusement je peux pas partager encore mais l'adoption en fait d'ODCS est massive par rapport aux entreprises qui veulent faire ça. Euh il y a un mois on a on a sorti la version 3 points où il manquait quelques petits
trucs. Bah de toute façon ça c'est comme tout hein. Il rajoute il faut rajouter des petits trucs et il y a des demandes. Là on a rajouté les les relations entre les éléments et cetera. euh avoir un système de relation à l'intérieur et extérieur au contrat euh ça paraissait ça paraissait évident mais c'était pas facile à faire euh de tout de suite parce qu'on on représente pas forcément que de la donnée relationnelle quoi. On va on va pouvoir de la il peut y avoir de la donnée non structurée et cetera. Il peut y avoir des
systèmes d'information euh pas forcément que des systèmes de gestion de base de données. Donc en fait le truc c'est qu' on quand on prend une prend moins une décision, il faut essayer de faire gaffe à ce qu'on bousille pas tout le reste quoi. Donc voilà c'est pour ça qu'on avait pris un peu de temps pour faire cette ce système de relation. Maintenant, c'est dedans. Euh, on a ça devient un produit extrêmement solide par rapport à ça quoi. Ouais. Euh, et en parallèle en fait cet été, on a sorti ODPS euh qui est l'Open Data Prolog.
Euh mais justement, c'est pour ça tu parlais de la réunion qu'on avait eu la en en janvier à à Austine. L'idée c'était c'était de définir d'abord et d'être d'accord d'avoir un d'avoir un consensus de de professionnel autour de ce que c'est qu'un data product avant de pouvoir le normaliser. D'accord. Et donc en fait c'est là où on l'a normalisé basant là-dessus et le premier la première version est sortie cet été quoi. Donc euh et ça reprend la même philosophie que le contrat. Donc quelqu'un qui utilise déjà ODCS va être assez va rapidement familiarisé. Oui, ça
se répond quand même. Ouais. Et puis c'est là là euh les deux sont indépendants, ils peuvent avoir leur propre cycle de vie s'il fallait. Euh mais les deux tu vois, c'est c'est plus on est plus dans un scénario de 1 + 1 = 3 euh parce que il y a une bonne synergie entre les éléments quoi. Voilà. H et euh min discrétion. Mais donc c'est pas facile de rassembler plusieurs acteurs de différents domaines pour définir des standards et cetera. Comment tu arrives à faire en sorte que ça soit pas ça ressorte pas à un espèce
de consensus mou de on met tout le monde un petit peu d'accord mais qu'on met des allemands dans le groupe. Ah ouais ça c'est jamais mou. Non non je je déconne. des divergences de de structurelles où globalement il y a il y a il y a tu sais je veux dire bon tu es entrepreneur je suis aussi je veux dire une boîte c'est pas démocratique. D'accord. le patron bah il met il met il met certaines choses sur la table donc en fait il a il a ses responsabilités et du coup il prend ses décisions quoi
avec éventuellement ses actionnaires et cetera mais bon là on est dans un événement on est dans un système qu'on placé c'est c'est limit loi 1901 donc je veux dire on est tous au même machin au même les seuls la seule la seule exception on il y a actuellement il y a je crois qu'il y a 13 boîtes et 14 personnes et 14 votants. D'accord. C'est c'est individuel. C'est pas c'est pas par exemple IBM nous nous adopter au DCS. Euh ils veulent faire partie du board mais c'est pas parce qu'il s'appelle IBM qui rentre au bord
quoi. D'accord. C'est parce qu'il y a quelqu'un chez IBM qui va bosser sur data contract et si son boulot est reconnu de qualité c'est lui. Après il va monter il va monter dans le technical stearing committee quoi. DSC. Ouais. Et et donc en fait en général quand tu arrives là les gens sont bon tu as toujours tu as toujours tu peux avoir toujours des des des gens qui sont moins collaboraturs que d'autres on va dire ou ou moins team players que d'autres mais je veux dire en fait le le le processus en fait se se
il y a il y a se nettoie par lui-même. Euh, on a une réunion mensuelle. Tu as le droit d'être absent à la réunion, mais il faut que tu le dises que tu es absent. Tu as le droit d'être la tu as le droit d'être absent à la réunion suivante, mais il faut quand même que tu le dises. Euh la troisième fois, même si tu le dis que tu seras pas absent et que tu donnes signe de vie, tu es dehors, quoi. D'accord. Donc en fait, c'est comme ça que le et et on a suffisamment
de gens qui font partie du working group euh des groupes de travaux différents sur les différents sur les différents aspects qu'en fait c'est là-dedans qu'on va piocher quoi. Donc tu vois, il y a ce système en fait de cooptation euh et on a des gens on a des gens qui sont qui sont qui sont brillants là-dedans. On a Andrew Jones qui a qui a écrit le premier bouquin sur les data contract. Euh on a euh Simonara et Yuren Christ qui ont monté en Tropidata. Ouais. Petit concurrent Action. Euh on a euh récemment on a Andrea
Joa de de de de Manticar à Milan. Euh donc des gens euh et et tu vois c'est le Andrea, il nous a rejoint quand on a commencé par les data product qui était pas particulièrement intéressant intéressé lui sur la partie data contract. Euh mais Andrea comme il avait travaillé, il avait travaillé sur un produit qui s'appelait DPPS euh et sur et sur et sur d'autres et sur d'autres et d'autres d'autres tentatives de standard, c'est là où on va pas on va pas en frontal avec les autres en leur disant "Ton truc c'est une pce piece
of shit quoi." C'est on va dire viens travailler avec nous, ramène ton savoir et on va et on va construire quelque chose en plus. Voilà. H donc et euh et Beatle dans tout ça. Ouais. Donc beatol projet, c'est le nom de l'organisation et donc en fait les standards que ce soit euh ODCS et ODPS en fait sont rattachés à Bitol. D'accord. Euh on travaille sur un autre standard qui s'appelle Oasours. Euh et en fait le but d'ours c'est la collecte de de résultats euh de tout ce qui est observabilité data qualité en fait de normaliser
ça pour pouvoir le remonter au niveau du data product. product étant un élément actif, tu peux récupérer de façon standardisée en fait euh toutes ces informations-là pour que tu puisses les traiter quoi. Un peu comme un open télémétrie quelque part mais vraiment dédié sur la data quoi. Et donc euh grâce à ces standards, ça devient une presque un un tampon de gage de de qualité quand je suis un Vendor par exemple. euh de Bah ouais, tu tu vois en fait sur sur 2000 sur 2025 en terme de de de vender, bon Actian m'a embauché euh
entre autres pour pouvoir apporter cette cette cette expertise. Euh entropie data aîné. Euh Entropie, c'est le c'est une spin-off du du groupe allemand Ino qui était une boîte de service. Donc en fait, ils ont fait une spin-off euh dédié dédié à à ça. Euh une grosse boîte belge dans le domaine de la dans de la métadonnée euh à adopter au DCS. Je peux pas prononcer le nom, c'est je vais être désintégré instantanément sinon. euh IBM, mais on a aussi euh alors je suis vraiment désolé pour mes amis de Lille, mais on a une boîte, on
a des copains à Lille qui ont adopté ODCS aussi euh euh et j'oublie toujours le nom de leur boîte. Ils ont ils ont une boîte de de ils ont une super boîte et un super produit de D datagove euh à Lille. Euhonneras, désolé. Euh je les mettrai je les mettrai dans les commentaires. Euh euh et euh ouais donc voilà donc donc en fait c'est vraiment 2025 ça été vraiment l'année l'adoption quoi. Et donc ouais c'est l'idée tu vois pour moi l'idée du du data contract c'est l'interopérabilité. D'accord. C'est je veux faire marcher je veux faire
marcher un informatica avec un avec un oracle par exemple, tu vois ou je ou un truc comme ça. Je veux là et là les gens qui ont compris ça c'est ben IBM a commencé à comprendre euh la boîte belge a commencé à comprendre pour les les gens les plus connus. Euh voilà, donc c'est ça ça prend maintenant quoi. C'est euh l'analogie que je prends souvent, c'est euh et c'est HTML. Si chacun avait sa propre version d'HTML, le web ça serait pas euh ça serait pas trop top quoi. Euh donc en fait euh là à partir
de ce moment où maintenant fonctionnellement on peut échanger des datas contract un peu plus facilement, ben voilà quoi. Ouais, c'est simplifié. Ouais. Et parlons peut-être de ton où où est-ce que ça ça va aujourd'hui ? que ton ton nouveau data aussi au-delà des data product, c'est comment est-ce que je rends la data et ready si je dis pas de bêtises com c'est presque enfin pour moi c'est Ouais c'est une juste continuité aussi de ce travail de structuration de de standardisation de comment est-ce qu'on construit la la les fondations qui te permet après bah d'aller adresser
ces sujets dans l'entreprise. Ouais. Alors, je pense qu'il y a aussi une année une pas une révolution, mais il y a vraiment une compréhension. Tu sais quand quand bon, on en fait depuis je sais pas combien de temps quoi. Euh mais je pense que le côté bon comme tout le monde un chat GPT avec Jen, ils ont ça a mis un petit peu un un coup de pied dans la dans la dans la dans la fourmilière et donc du coup tout le monde toutes les fourmilles elles sont partis dans tous les sens et euh donc
on découvre des trucs euh on réinvente des machins qu'on avait déjà euh et cetera. Bref, euh mais sur les même il y a même des gens qui disaient que pour on avait pas besoin de donner hein. Je au début genre 2024 il y a des gens qui j'ai plus besoin de donner j'ai même pas besoin de donner de qualité de toute façon va corriger ça et cetera. Bref, bref. Heureusement, on n pas on est passé de ça. Euh mais on s'aperçoit aussi maintenant qu'on est passé de ça, c'est que que l'importance du contexte euh associé
à la donnée que tu vois si si on prend par exemple un humain euh qui fait un qui fait un job sur sur une sur un sur un sur un jeu de données, euh on se rend pas bien forcément compte de toute la partie de tout de tout le savoir empirique qu'il a, quoi. D'accord. Donc tout ce qui est histoire, formation et cetera, tout ce que tout ce que la personne a dans son cerveau sur lequel il va surimpressionner les les données et arriver à cette conclusion là. D'accord ? Euh donc en fait la cette
partie du contexte sur pour LIA, elle devient de on s'aperçoit de plus en plus qu'elle devient de plus en plus importante. Euh alors il y a des gens qui parlent de contexte graphe machin et cetera. Enfin bon, on peut parler de n'importe quoi, mais je veux dire euh mais toujours est-il que toujours est-il que que toujours est-il que ce cette notion de de de contexte est importante ? Euh et euh et et voilà, c'est donc comment on avait cette discussion euh en janvier dernier à des Texas en là dans quelques dans la semaine prochaine en
gros euh ben je retourne à je retourne à Austin avec l'ambition de pouvoir définir un petit peu ce que c'est que AI ready quoi. D'accord. Euh ma boîte Actian, mais d'autres boîtes aussi, ils disent voilà notre soft il est AI ready euh euh où les datas sont les les datas sont construire les data ready. Mais tu fais ça, c'est c'est quoi ça représente quoi ? D'accord, c'est euh et est-ce que c'est un switch ? Est-ce que c'est quelque chose de binaire du stylec et puis voilà, ça marche quoi. Ouais, c'est un tampon. Le côté bien
alsacien. Euh mais ou alors est-ce que c'est est-ce que c'est un niveau de maturité de tes données ? D'accord. Donc tout ça c'est c'est vraiment des sujets sur lesquels j'ai envie de travailler en 2026. Euh on va commencer à Austin mais j'ai la semaine prochaine, je suis à Londres, il y a une conférence où je aussi en parler. Je commence à récolter un peu de feedback, machin et cetera. Il y a il y a il y a déjà des des convictions fondamentales que que tu aimerais partager à ces ces groupes là qui commencent à émerger.
Et et ouais, le alors c'est peut-être pas des c'est peut-être c'est pas encore fondamental, mais pour beaucoup de gens avec qui j'ai discuté, la notion de temporalité est plus importante que que précédemment quelque part. Je pense que la notion de temporalité dans la donnée a toujours été mais elle a toujours été peut-être un un un candidat un tu vois, un second class citizen quelque part. Euh et peut-être qu'il va falloir la monter, la bump up un petit peu quoi, tu vois. Euh c'est mais mais déjà même maintenant tu l'as tu fais juste une jointure entre
deux tables dans une juste relationnelle. Si tu as des données qui ont 3 mois et tu mélanges ça avec des données qui sont à la microseconde de des décalages, le résultat ça va être bizarre quoi. Donc euh non donc en fait il faut peut-être que il faut peut-être que maintenant on arrive à à prendre ça, à récupérer ça et euh et à mieux comprendre en fait ce cette temporalité des données. Donc il y a il y a deux trois personnes avec qui j'ai pu discuter qui sont beaucoup là-dessus. Euh il y a des gens qui
sont sur créer un graphe de décision euh donc récupérer en fait les décisions d'activité de de qui pourrait y avoir dans ta boîte. Ouais. Je veux dire au moment que tu fais tout chacun prend une décision la documenter quelque part et pouvoir la donner au système d'agent pour qu'en fait l'agent ait ce cette connaissance là. Euh je sais pas encore, tu vois, je je là c'est il y a quelques pistes là-dessus. Je je suis je suis pas encore complètement fan de de de tout ça, mais c'est un peu essayer de voir un petit peu tout
ça, mais je pense que le le je pense qu'on va on va devoir essayer de gratter un peu ce que c'est que le contexte. D'accord. Euh il y a le contexte il y a des contextes par rapport euh par rapport à à la donnée, mais aussi des contextes par rapport à l'entreprise, mais par rapport aussi au domaine dans lequel euh on va développ on va on va se positionner où l'agent va évoluer. Donc il y a des choses là-dessus encore il faut vraiment il faut encore vraiment qu'on voit. L'idée sera pas de balancer tout le
contexte que tu as réussi à à avoir sur d'un seul coup. va falloir choisir le bon contexte pour le bon agent sous-agent pour aller chercher les Ouais. Par contre, il y a des choses sur les sur lesquelles je commence à être persuadé que tu vois, autant il y a des choses, je sais pas encore et cetera. Euh il y a des choses par contre sur lesquelles je commence à avoir une opinion un peu plus arrêtée, c'est pour moi, il y a pas de notion. La notion de sémantier là, elle a rien à là-dedans, quoi. Euh
euh je suis assez euh tu vois tout ce qu'on est en train de construire avec les datas contract, les datas product et cetera, on est sur il y a beaucoup de gens qui disent que c'est du décentralisé. Moi je pense je préfère le terme de fédérer. Ouais. Euh maintenant si on retourne sur de la sémantique ler, on retourne sur sur du centralisé quoi et et donc du coup j'aime pas j'aime moyen quoi. Mais par contre la notion d'un de de d'un glosser fédéralisé par exemple ou ou des business définition qui sont plus départementales et cetera
que certains catalogues proposent. Là c'est là je pense que là il y a plus de choses à récupérer éventuellement quoi. Donc voilà. OK, c'est ça va dans la même dans la même mouvance que ce qu'on essaie de faire dans la construction de nos datas catholiques à l'heure actuelle dans les tu vois le le le le je suis en train de de de comparer le j'essaie de comparer l'humain à la à ce qu'on veut faire donner à la machine. D'accord ? L'humain il a besoin du data catalogue. D'accord ? Je veux dire, tu parles data scientist
qui veut faire un rapport ou n'importe quoi, il va regarder ce qu'il a besoin ou elle a besoin dans dans le catalogue. Euh, ils vont extraire en fait les informations du du catalogue et cetera. Mais tout ça manuellement avec la lecture et cetera quoi. Donc comment est-ce que je transfère cette notion ? Ça c'est le contexte quelque part. que je transfère et les parties du contexte là à la machine quoi. Et c'est là où je pense que le data contract peut aider aussi quoi. Tu dire imagine que un agent qui soit lié à un data
product par exemple et ben le tout une grosse partie du contexte dont il a besoin va pouvoir être récupéré à partir du data contract ou ou de la définition du data product quoi. Ouais. Tu tu sens une une maturité qui commence aussi à arriver dans les entreprises de comme tu disais 2024 2025 c'était un peu OK à fond sur à fond sur l'IA puis on on oublie un petit peu certains fondamentaux parce que façon faut explorer et puis le potentiel est excellent. Maintenant, on se rend compte, on redescend un peu dans ce creux de la
vague de de l'adoption d'une nouvelle le cycle le cycle de vie de Gartner là ou la la la je sais plus comme la fausse du du il y a il y a le la vallée du désespoir Kruger aussi. Enfin, il y a on est un peu dans ce à ce niveau-là quand on commence à être vraiment sur des applications plus euh plus avancées de lien en entreprise et on se rend compte que bah qu'est-ce qui manque ? Le le la bonne information, le bon contexte, la bonne Ouais. Alors alors sur l'IA, c'est parce que il
y a tellement d'énergies de pognons qui qui sont mis sur l'IA qu'en fait ça devient assez évident quoi. Sur la partie sur sur la partie data contract et data product. Ce qui est à la fois intéressant et inquiétant, c'est que j'ai la chance de pouvoir travailler avec des des gens qui sont très mur sur le sujet, quoi. Euh et là, on avance extrêmement vite. Euh euh bah on rencontre aussi des murs parce que par exemple les standards sont pas tous sont pas forcément prêts par rapport à aux besoins qu'ils ont et cetera. C'est là où
les standards vont aussi évoluer. Euh et il y a des gens qui sont vraiment bon Ouais, peut-être qu'on voit ça en 2027 machin et cetera. Donc en fait, tuas mais tu as vraiment, je pense que c'est pour toutes les toutes les technologies ou méthodologies parce que je pense que ça on est plus sur de la méthodologie que la la techno. Euh on est on est quand même on est quand même euh globalement quand même pas très mû hein. Euh mais mais ça mais ça mais ça vient quoi. Ça ça vient. Il y a il y
a de plus en plus d'outils, il y a de plus en plus euh un des trucs sur tu vois sur le projet Beatle, c'est qu'on s'est posé la question des gens qui nous ont approché, il nous ont dit "Ouais, j'ai fait un parceur de machin, j'ai fait ce petit outil et cetera. Euh est-ce que est-ce que dans le cadre de Beatle vous voulez pas le distribuer ? On a dit nous on fait pas de code nous. D'accord. Bon parce que parce que d'abord on va pas pouvoir maintenir et cetera. On n pas on n pas
cette volonté là quoi. Donc on veut rester vraiment sur le standard. Euh même à la rigueur la méthodologie c'est plus au boîte de conseil de la développer autour tu vois. Donc OK. Et euh je spoiler rien en disant que tu es en train d'écrire un nouveau livre sur les justement building data products. Ouais. Euh est-ce que du coup comme tu comme on se disait dans la dans le début de la discussion, il y a certains standards qui commencent à s'établir, des qui commence à être communes et cetera. Déjà, qu'est-ce qui t'a motivé à se dire
"OK, il y a quand même besoin un niveau là-dessus et par rapport à ce qu'on vient de se parler, est-ce que tu comptes aussi inclure un volet sur AI ready de Est-ce que ça du sens ?" Euh le dans dans le l'idée l'idée du bouquin euh c'était de faire un bouquin très technique sur les dat product. D'accord. Quand j'ai écrit avec Broda, on a écrit implementing deh. Les certaines critiques du bouquin, c'était que c'était pas assez technique. Mais bon, ouais, mais c'est c'est il aurait fait 700 pages sinon. Mais ouais, c'est ça. C'est c'est c'est
ça peut ça peut devenir vite imbitable. Euh donc euh mais là euh et on efflore quand même quelques points techniques machin et cetera. Je veux dire, c'est pas c'est pas juste de la c'est pas juste de la prose. Euh mais sur building sur building product, c'était pour moi c'était de prendre toutes les recettes et toute l'expertise qu'on a déjà mis dans dans Beatle et de l'expliquer. Donc euh et les standards les standards, malheureusement, je peux pas dire maintenant, mais je veux dire les standards, je vois vraiment il y a vraiment une croissance de l'adoption des
standards de Bitol. D'accord. Donc je veux dire ça, j'ai assez j'ai assez d'espoir en fait que que le bouquin devrait se vendre de façon assez correcte. Hm hm. que je prenne ma retraite comme J ton apothéos carrière. Je crois qu'il y a jamais quelqu'un qui a pris une retraite après voir un bouquin en informatique. Je saurais je crois même notre ami Jo Ouais mais donc c'est c'est vraiment le zoomer sur la partie data product par rapport au livres datam qui était beaucoup plus large sur l'ensemble des pieds datamèch avec un un angle beaucoup plus technique
et et mise en application dans le Ouais. Et et aussi le le truc c'est que quand quand Jean-Mac Degani a introduit le concept de Data Mèche, c'était ses premiers papier c'était en 2019 et puis un deuxème en 2020. Son bouquin, je crois qu'il est sorti en 2021 ou 2022. Euh il y a vraiment eu un gros engouement très fort euh bon quand euh euh quand elle quand elle quand elle euh quand elle donne des taux que les gens euh se déplacent quand même un tout petit peu plus euh que pour le kid moyen. Donc elle
est elle est encore là. Mais je veux dire que le concept de Datamèche euh a un peu souffert. Le fait que Gartner a dit que c'était mort avant le le l'apothéose euh ça n'a pas aidé. Euh mais euh et je pense qu'en fait il y a cette démarche incrémentale quoi. Euh comme je comme je disais chez chez PayPal, on avait commencé par un data product puis on les a méchés et cetera. Euh l'approche que je préconise maintenant, c'est plutôt on commence par des contrats, on assemble les contrats sur un produit et après on peut assembler
les les produits sur du mèche quoi. Euh quand j'étais chez quand j'étais chez Xedia, on a on m'a m'avait demandé de construire un un écosystème de data product euh mais pas un datamèche. Hm. C'est c'est rien à voir. Rien à voir. C'est complètement différent mon brave monsieur. Faut pas dire le mot. Voilà, c'est pas faut il y a des mots qui vut mieux. Donc donc en fait et ça ça je pense que ça a un peu joué contre le bouquin euh euh et et un peu contre l'industrie quoi. Puis je veux dire bon après Jen
est arrivé, ça a mis ça a secoué tout le beau monde et cetera quoi. Et donc maintenant queonut on veut tous faire de l'IA euh c'est là où il faut se dire "OK pour revenons aux fondamentaux". Tu vois, c'est un petit peu c'est un petit peu on part dans tous les sens et puis maintenant bon voilà, on on restructure quoi. Mais pour juste rebondir sur ce point, j'ai pas mal de clients récemment dans les discussions surtout l'année dernière où quand ils ils sont en phase vraiment de de structuration de leur leur data product, de comment
est-ce queon les fédèr et cetera, n'employez pas le terme data product pardon. On pas le terme d'attache. Ouais parce que dans certaines boîtes c'était connoté à grosse transfo un peu bourine. On fait on refait tout du sol au plafond et du coup ça a perdu un peu l'essentiel du bah la philosophie derrière derrière ça. Donc le terme est moins adopté est moins utilisé je trouve dans les entreprises d'aujourd'hui même si en fait ce qu'on se pose comme question structurante ça fait partie des des piliers qui Ouais. et tel que tu vois quand quand je fais
des to j'ai une slide où en fait j'explique en fait comment tu gagnes en maturité où tu commences en fait par ton data contract. Tu as tuas je suis assez obsédé par l'idée de de la valeur que tu peux récupérer la donnée ou de la métadonnée. Donc tu as un certain niveau de valeur que tu récupères à niveau du data contract. Tu vas sur le produit tu as un autre jeu de valeur. Tu vas sur le mèche, tu as encore plus de valeur quoi. D'accord. Mais est-ce que si tu as est-ce que tu as pas
forcément besoin d'aller jusqu'au mèche quoi. Donc euh il y a des gens rien que le rien qu'avec le contrat, tu as déjà énormément de valeur quoi. D'accord. Ça résout des paines. Ouais. Et et ce que ce qu'il y a beaucoup de gens aussi, je ce que ce que je vois assez plus récemment, c'est que il y a l'approche de la de la gouvernance et l'approche de de l'ingénierie aussi, tu vois. Ouais. et et et même de de l'OPS quelque part où en fait comme le contrat il est un peu central par rapport à tout ça
mais ça dépend qui le pousse dans l'entreprise et beaucoup de gens qui poussent le contrat dans l'entreprise c'est la gouvernance donc en fait il voit sous que sous langu tu vois je veux dire c'est c'est l'éléphant que tu mets dans dans les quatre les quatre sages qui vont toucher dans le noir des quatre aveugles qui vont toucher les différentes parties de l'éléphant et ouais ça voilà hein ça c'est ça c'est la queue ça c'est l'oreille ça c'est la trompe machin et cetera et chacun décrit quelque chose de différent Le data contact, c'est un peu ça
quoi. Et en fait, tu as l'angle de la gouvernance où tu vas pouvoir documenter, suivre les changements, définir l'équipe et cetera. Donc avoir une bonne vision de ce qui se passe au niveau de ton système d'information et tes données. Euh mais tu peux utiliser ça dans un dans dans le déploiement pour t'assurer que tu vas rien casser quand tu déploies et tu peux t'en servir pour le monitoring et cetera. Donc en fait, tu vois, tu as vraiment ça devient ça devient ta ta ton joker, ta wild card que tu peux passer un petit peu partout
quoi. Sais que nous a dans beaucoup de d'ateliers, on fait des ce qu'on appelle des fresques de la data pour culturer le vocabulaire commun des entreprises et cetera. Et souvent ces termes-là de data produit, data contract quand on forme des personnes qui sont pas qui ne viennent pas des écosystèmes data ou moin tech, ce sont des des mots clés qui qui se disent "OK, ça c'est c'est la tambouille des équipes et data." Mais en fait quand on le drive par les Voici ce qui se passe quand tu le mets pas en place. Combien de fois
tu es venu me voir parce que tu as pas confiance dans ta parce que tu sais pas comment capculer et cetera. Qu'est-ce qui s'est passé ? Telle équipe applicative a changé le schéma. Ça a tout pété dans dans le dashboard plus tard. Voici ce qui s'est passé. Bah par ces exemples là comprennent mieux l'intérêt et l'importance de mettre en place quelque chose et donc comprendre le concept qu'il y a derrière. Ouais, je je pense c'est c'est c'est c'est pareil dans beaucoup de choses quand tu veux expliquer un nouveau concept et qu'est-ce qu'est-ce que tu vois
? Je veux dire les Américains c'est what's in for me hein ? Qu'est-ce que moi je veux en avoir comme machin ? Donc en fait tu as tout à fait raison. Je veux dire en fait euh tu vas dire ouais je peux détecter du schéma drift je peux et je peux et je peux le traiter quasiment automatiquement si je veux. Euh je peux faire de la formation euh je peux tu vois un un des un des un des aspects aussi du contrat c'est de pouvoir parce que le contrat est assez riche mais tous les éléments
sont pas obligatoires. Il y a très peu qui sont obligatoires dans dans dans ODCS. Euh mais ça permet de créer aussi un framework autour duquel tu vas pouvoir créer cette discussion entre le tech et et le business. Euh parce que bah ouais, comme tu dis, ils ont pas le même vocabulaire, ils savent même pas par quel par quel bout commencer quoi. Donc en fait là, tu prends le contrat, tu suis ligne par ligne quelque part et puis voilà. Donc ça te pose les questions, c'est quoi c'est quoi mes contraintes de SLA ? C'est quoi mes
contraintes de data qualité et cetera quoi et c'est itératif quoi. Ouais ouais, j'ai vois énormément de de d'avantages dans les discussions que j'ai eu de juste on va on va créer un un vocabulaire communal alignement sur qu'est-ce qu'on a envie collectivement de de construire. Après, on met le on met le terme, on met on met on en place les choses, mais on commence d'abord par OK, est-ce qu'on a vraiment un objectif commun et et tex sur qu'est-ce qu'on qu'est-ce qu'on veut comme standard de qualité, comme standard de et cetera et on on pose des choses
qui vont qui vont bien ensuite. Je voulais conclure sur une petite touche que j'apprécie chez toi JeanJor, c'est que tu as beau écrire des bouquins tech et tu as un architecte reconnu, tu as le tu as l'humour facile et même dans tes livres techniques, il y a des petites Ouais ouais. Mais j'aime bien aussi le le fait, j'ai je donne cet exemple, tu en as trois comme ça, datamage fories, j'imagine que c'est un parti d'un délire personnel que je sais pas pour Ouais, il y avait il y avait il y avait il y avait un
peu de ça. Euh mais l'idée c'était c'était un peu euh de de de d'expliquer à des enfants ce que c'était que le datamèche quoi. Donc en fait dans le bouquin, il y a des exemples super simples avec les pompiers, la police et cetera. Euh d'expliquer ce que c'est la fédération des des des des choses là-dedans. Euh mais c'était pas forcément un délire. Euh c'était pas voué, c'était pas injurieux de dire délire. C'était je je je c pas une injure de dire cette dernière délire. Non non non non mais des fois je m'ent des délire. Non
non mais je veux dire euh Non non c'était mais l'idée l'idée l'idée du livre c'était c'était Ouais c'était vraiment destiné aux enfants quoi. Et en fait c'est assez amusant parce qu'il y a pas mal de gens alors c'est j'ai eu beaucoup de réactions différentes machin et cetera. Donc j'ai eu un jeune papi qui l'a acheté puis qui le lit à son gamin de 3 mois. Alors, je un peu jeune mais mais voilà euh j'ai euh euh et euh et il y a quelqu'un et une une ingénieure sur à Wall Street qui m'a dit "Je suis
je suis à mon 4e que j'achète parce qu'à chaque fois que j'en que je l'achète et que je laisse sur mon bureau, il y a un de mes patrons qui le qui me le pique." Euh et donc en fait, il y a cette euh il y a suffisamment en fait de de de concept là-dedans et c'est ça explique les truc de façon pour les enfants mais ça marche aussi pour les vi je je vais te dire moi oui je je me suis amusé lire avec avec mes enfants. trouve ça drôle les images surtout voilà ils
ont ils étaient encore un peu jeunes mais en fait les exemples l'illustration de la ville et cetera des différents départements euh bah ça c'est ça fait aussi des exemples très imagés pour expliquer des concepts en entreprise. Ouais ben je je suis content je suis content que ça pu servir là-dessus aussi. Et en fait, un des trucs avec ces bon alors déjà dans dans la vie d'auteur, on gagne pas sa vie euh énormément quoi. Mais là euh un peu plus de la moitié des profits que je fais sur ces bouquins-là euh je les donne à deux
associations aux États-Unis. Euh une qui fait euh qui s'appelle girl euh girl voilà l'impression. Ouais. Ouais. qui s'appelle Black Black Girl Code qui est en fait des jeunes qui qui expliquent à des jeunes filles noires comment rentrer dans l'informatique et coder quoi. Et une autre c'est juste Girls Book code qui sont aussi voilà donc en fait notre industrie manque un petit peu de de de de femmes et elles ont en fait un esprit analytique en général qui est plutôt brillant je trouve souvent meilleur que les hommes. Et donc en fait si on peut aider un
peu avec ça, voilà, c'est un peu ça l'idée aussi quoi. Ouais. Moi en tout cas c'est j'aime bien l'initiative au-delà de ça, je trouve que ça ça aide aussi à faire rayonner cet écosystème d'attaque qui souvent reste un petit peu dans sa bulle entre eux et expliquer les choses à plus au plus grand public. Donc vouette touche ouverture peut-être en conclusion, j'avais juste une dernière question de tout ce qu'on s'est dit là. Est-ce que c'est à ton ton avis je démarre une entreprise, un produit from scratch ? Est-ce que je dois mettre en place à
minima ce qu'on a dit sur les data produit data contract c'est plus quand alors de façon super surprenante dans le TSC ami qui s'appelle Diego Carvalo et il a monté une boîte une start-up dans dans le monde du service. D'accord. Donc pas une start-up tech quoi. Euh mais en fait bon, il manipule énormément de données parce que des c'est si j'ai bien compris son système, c'est plutôt du du placement de personnel médical. OK. Euh et en fait il a tout basé sur les data contract from scratch. OK. Tout tout le système tout son tout son
tout son si est basé nativement sur les datas contract. Voilà. et ça ça te pose les les fondations. Il peut ensuite scaler son il peut scaler son truc, il peut gérer il peut gérer le changement, il a des nouvelles sources de données, ben il les rajoute avec d'autres data contract et voilà. Non, je pose la question parce que je trouve je trouve intéressant aussi de se dire aujourd'hui quand tu crées quelque chose from scratch même quand même quand tu incubes un nouveau sujet dans une grosse entreprise, on a tendance à vouloir tout accélérer, on peut
tout prototyper, c'est super et cetera mais au final bah du coup on reprend encore une fois les mêmes erreurs, les mêmes raccourcis que qu'on prend et on se pose la question plus tard. Ah ce serait bien que je sur ça. Ouais il y a c'est pas un effort sur surhumain qu'on ce qu'on se dit met en place ce type de bonne pratique. Non non c'est pas un non c'est pas un effort surhumain. Même ce que j'ai pu voir c'est que les EA comprennent relativement bien parce que quand on va sur le ripo de de de
Beatle en fait et qu'on récupère les la spec et on a un schéma Jason de validation quand on donne tout ça à alors j'ai pas fait avec Claude mais je l'avais fait avec je l'avais fait avec certains certains LLM euh genre Lama Granite de ChibM et chat GPT donnes tout ça à l'intérieur et puis il Ça ils comprennent bien quoi. C'est du structuré, ils aiment bien. Donc donc tu peux lui demander d'enrichir le contrat, de de l'interpréter, de régénérer des contrat. Donc les les IA les IA comprennent relativement bien. Euh donc ça c'est il y
a pas d'incompatibilité déjà quoi. Donc ouais clairement. Bon après euh c'est c'est c'est moi ce que je tu vois le j'ai j'ai fait j'ai fait un peu de vibe coding un peu tout comme tout le monde avec des résultats euh mit nitigés mais je veux dire mais quand même globalement j'étais assez satisfait euh mais c'est très bien pour la création pour la maintenance après et cetera je sais pas si je sais pas si les outils vont être aussi bons que ça et le data contact c'est quand même quelque chose qui a qui a vocation à
à évoluer quoi. Un peu comme un modèle en quoi. Le modèle quand il quand on arrête de l'évoluer, il a je pense pas il se passe des choses. Ouais. Ouais. Et donc en fait sur les dat contract, moi j'ai un peu la même j'ai un peu la même la même vision quoi. Donc est-ce que là les modèles vont pouvoir nous aider après à maintenir où est-ce qu'il faut des outils particuliers pour faire ça ? Il y a des et là il y a aussi de l'espace pour la startup K qui veut aller là-dedans parce que
parce que c'est c'est un domaine c'est un domaine très très en vogue quand je vois le l'adoption des des standards. Euh donc il y a aussi voilà hm h appel à start nouvel nouvelle idée de 2026 et ben génial merci beaucoup JeanJor c'était super de pouvoir éclairer tout ça avec toi. Merci merci de m'avoir invité. Bon courage, mon courage au Texas pour redéfinir des nouveaux conseils, des nouveaux standards. Dommage, dommage que tu viens pas cette année. Pas cette année en plus, c'est la dernière, je crois. Ouais, c'est ce que Lin Bender a dit, c'est la
dernière. Mais euh il y en a une qui qui commence à prendre un peu de de euh c'est pas qu'elle commence, mais j'étais à Dayline the D à D3 par nos amis Ryan Dolly, Aaron Wilkinson et cetera. C'était pas mal. C'était pas mal. Ouais, il y avait un peu il y avait un peu la bonne viê. Donc euh donc on va voir si Lin il arrête. Est-ce que Aaron va continuer ? Ah suspense dans le monde de la communauté dat incroyablement soutenable. Prochain épisode vous saurez tout. Ça ça me plaît. Conclons là-dessus. Merci beaucoup Jean
George pour ton temps. Merci à très bientôt. Plaisir à très bientôt. Merci à tous. Yeah.