Aujourd'hui, si tu veux être Data Analyste, tu as deux options. La première, c'est de faire 5 ans d'études dans une école qui va te coûter très cher, et la seconde, c'est de te former en seulement quelques minutes sur Chat GPT. Si tu préfères la deuxième option, reste bien dans cette vidéo.
Je vais te montrer comment charger, nettoyer et analyser des données pour résoudre tous les problèmes, qu'ils soient très simples du quotidien ou bien plus complexes, que tu peux retrouver dans ton métier. L'analyse de données peut faire peur, mais honnêtement, avec Chat GPT, tu peux faire des miracles en quelques minutes. Si tu es prêt, on ne perd pas plus de temps, et je te montre ça tout de suite.
Depuis la version 4 et les nouveaux modèles de Chat GPT, l'analyse de données est directement intégrée dans les systèmes. Pour cette démonstration, je vais prendre le modèle 4o, car c'est le plus rapide, mais tu peux faire la même chose avec le 4, il n'y a aucun souci. On reste sur le 4o, et je vais te montrer un petit truc assez intéressant.
Avant de commencer, tu peux utiliser, si tu veux avoir des résultats un peu plus pertinents, les customs instructions. Si cette notion n'est pas claire pour toi, j'ai déjà fait une vidéo sur le sujet, je t'invite à aller la consulter. En tout cas, sache que c'est quelque chose qui peut t'aider, mais qui n'est pas du tout obligatoire.
Donc, évidemment, si ça peut aider, on va s'en servir. On va cliquer sur notre profil ici, et on va aller dans "Personnaliser Chat GPT". C'est ici que tu vas pouvoir donner ces fameuses instructions qui vont permettre de guider Chat GPT sur qui tu es, ce que tu veux vraiment, et la manière dont tu veux qu'il réponde.
Ça peut être intéressant pour avoir un modèle un peu plus affiné. Cependant, ça prend du temps, donc moi je n'ai pas envie de m'embêter. J'ai demandé à Chat GPT lui-même de me fournir ses instructions.
Donc, tout simplement, je vais pas te montrer ici, mais j'ai demandé à Chat GPT : "Je suis dans un rôle de Data Analyste, j'aimerais te faire analyser des données, est-ce que tu peux me préparer les instructions personnalisées pour pouvoir t'optimiser ? " Et derrière, il va te fournir quelque chose de très complet. Ça va être à toi de trier en fonction de ce qui t'intéresse.
Je vais te montrer ce qu'il m'a proposé. Donc, ça c'est pour la partie information à fournir à Chat GPT pour l'aider à mieux répondre. "Je suis un Data Analyste débutant, j'ai besoin de ton aide," etc.
J'ai donné quelques informations que Chat GPT m'avait suggérées, j'en ai enlevé d'autres. Donc, ça donne des premiers éléments qui vont nous permettre d'avoir des réponses un peu plus détaillées. Pour la deuxième partie sur le type de réponse, pareil, je copie-colle ce qui m'a été suggéré.
Donc, je souhaite des réponses structurées incluant des exemples pratiques, explication pas à pas, visualisation, meilleure pratique. Et je préfère donc des réponses concises mais complètes, avec une orientation pratique pour appliquer directement les concepts dans mon travail quotidien. Là, j'ai décidé d'orienter Chat GPT dans un sens particulier.
Tu peux totalement faire différent si tu veux des choses beaucoup plus complexes, tu peux lui demander. Si tu es un vrai débutant et que tu veux des choses au contraire très simples, tu peux également, bref c'est à toi de le définir. Tu peux t'aider de Chat GPT, ou alors tu peux ne pas te servir des instructions personnalisées, et honnêtement, ça marchera aussi très bien.
Donc, pas de souci, en l'occurrence, on va les garder. Avant de fermer, on va s'assurer que c'est bien actif pour les nouveaux Chat. Et on enregistre.
Voilà, donc là, les instructions sont configurées, on peut attaquer le vrai sujet : l'analyse de données. Le fichier que je vais vouloir analyser aujourd'hui, c'est un fichier Excel qui contient la base de données client de mon site internet. Évidemment, c'est un site factice, mais tu vas voir, c'est un bon exemple sur lequel on va pouvoir travailler.
Voici le fichier, donc c'est ma fameuse base client, j'ai un certain nombre de personnes, une centaine, avec leur âge, leur sexe, leur ville, leur revenu, le produit qu'ils ont acheté sur mon site, le montant de leur achat, et la date de l'achat. Là, en l'occurrence, on a un fichier Excel, mais Chat GPT peut analyser une multitude de fichiers, que ce soit du CSV, de l'Excel, un PowerPoint, des fichiers texte, bref, tout ce que tu veux, il n'y a pas vraiment de limitation en termes de format, et ça c'est très cool. Si je retourne sur mon fichier, je vais le télécharger en cliquant ici, "Télécharger".
Je peux décider, comme je te l'ai dit, de le télécharger en format Excel ou CSV, peu importe. Je vais le conserver en Excel. Je le télécharge, et là, tout de suite, on va le remettre dans Chat GPT.
Donc, on repasse sur Chat GPT, on va démarrer la conversation, on va cliquer sur l'icône "Pièce jointe", et on va charger le document. Je charge mon document base client, et là je vais donner mon premier "prompt". Et c'est important que tu retiennes ce prompt, car il a une construction assez simple, mais qui va permettre à Chat GPT d'être pertinent.
Donc, le prompt va être le suivant : "Ce fichier représente ma base de données clients pour mon site de vente d'accessoires de sport. " Donc là, tu lui donnes le contexte, et ensuite je veux analyser des tendances à partir de ces données, nettoie et formate correctement la donnée si nécessaire pour la préparer à une analyse détaillée, sans faire d'analyse pour l'instant. C'est important de séparer les demandes.
Donc, on lance la demande, c'est parti, on voit le fichier qui. . .
Apparaît en aperçu, donc ça peut être pratique pour voir si le fichier nous convient. Si on n'a pas fait d'erreur, mais de toute façon, s'il y a des erreurs, Chat GPT va les corriger. Donc c'est parfait, et voilà, c'est parti.
On voit que c'est rapide avec le tout nouveau modèle. Donc, pour préparer les données à une analyse détaillée, il est nécessaire de les nettoyer et de les formater correctement. Donc, il va nous expliquer toutes les étapes qu'il va mettre en place : vérification des valeurs manquantes, vérification des types de données, normalisation des données, gestion des valeurs aberrantes, et ajout de colonnes dérivées si nécessaire.
Ça c'est intéressant, il est proactif et il me propose des choses en plus auxquelles je n'aurais pas forcément pensé. Ensuite, il va démarrer les étapes et là, tu vois qu'il nous propose du code. Donc, moi, ce n'est pas forcément quelque chose qui m'intéresse, ce sont des choses qui peuvent concerner certaines personnes.
Donc, c'est intéressant de l'avoir ici. C'est du Python, mais tu peux très bien ne pas le considérer et juste regarder la suite. En tout cas, si tu en as besoin, tu peux le copier en cliquant juste ici.
Donc, on voit que pour chacune des étapes, il utilise du code : étape une, étape 2, et cetera. Une fois qu'il a écrit le code, il va exécuter les étapes. Donc là, il a déjà tout exécuté, hein.
Le temps que je t'explique, tout a été réalisé. Donc, la première étape, c'était pour nettoyer et formater les données. Il va me faire un résumé de ce qu'il a fait : il a vérifié s'il y avait des valeurs manquantes, il y a aucun problème, il vérifie le type de données, donc ID, nom, et cetera, en fonction du format, pas de souci.
Normalisation des données, donc les valeurs uniques pour produits achetés sont produit 1, 2, 4, et 3, donc c'est parfait. Les villes Strasbourg, Lyon, il n'y a pas de problème, gestion des valeurs aberrantes, a priori, il n'y en a pas, parfait. Et ajout de colonne dérivée, donc là, c'est le côté proactif, de nouvelles colonnes ont été ajoutées, c'est parfait, on a mois d'achat, le mois d'achat, et année d'achat, ouais, donc ça c'est pratique.
Si tu regardes le fichier initial, on remonte juste ici, on avait uniquement une date d'achat un peu complexe avec l'année, le mois, et cetera, même l'heure qui n'est pas forcément utile. Là, on voit que Chat GPT a fait une modification et m'a rajouté des colonnes, ça peut être pratique si on veut modifier la donnée dernière. Donc, franchement, c'est très cool, on va peut-être s'en servir.
Donc, les données sont nettoyées, formatées, on a le code Python, mais peu importe, on va passer à la deuxième étape, et c'est ça qui nous intéresse maintenant : on va lui demander de réaliser une analyse de ces données avec des graphiques interactifs, si possible, pour faire émerger des premières tendances. Alors là, c'est quelque chose de très intéressant. Historiquement, Chat GPT proposait uniquement des graphiques statiques, et depuis peu, il est possible d'avoir des graphiques interactifs.
Donc, on va voir s'il va me les sortir, on regarde le début de l'analyse. Pour faire une analyse exploratoire des données et faire émerger des tendances à partir des données, il va utiliser des visualisations interactives. Comme d'habitude, il ressort le code, d'accord, donc on va avoir différentes étapes : distribution de l'âge des clients, ça peut être intéressant, répartition des sexes parmi les clients, le revenu, le montant des achats, analyse des achats par produits, analyse des achats par ville, et tendance mensuelle et annuelle des achats.
Donc là, seulement en deux prompts, tu te rends compte qu'il y a déjà un gros travail de Data analyse qui a été fait, et ça, sans ça, ça aurait pu être très long. Et tu vas voir, c'est que le début. Donc, comme d'habitude, il nous sort le code associé à chacune des tâches, encore une fois, ça m'intéresse pas forcément, donc on va avancer.
Ensuite, il exécute, et après, on va voir tous les graphiques. Donc, c'est parfait, de l'analyse exploratoire, et on va avoir nos fameux premiers graphiques : distribution de l'â. .
. Contre sur cette distribution et surtout sur ces graphiques-là, on a des graphiques interactifs et c'est hyper intéressant. Parce que tu vois que tu peux passer ta souris et avoir quelque chose de beaucoup plus dynamique.
Là, c'est quelque chose de statique. Je peux télécharger mon graphique et ça peut déjà être une très bonne chose, mais là on a des graphiques qui sont plus poussés, dynamiques et surtout tu vas pouvoir effectuer quelques modifications. Par exemple changer la couleur des produits achetés.
Comme ça, on voit que c'est encore les débuts, mais tu peux commencer petit à petit à modifier tes graphiques et c'est très prometteur pour la suite. Si tu cliques ici, tu repasses sur un graphique très basique et là, tu vois que c'est quand même beaucoup moins sympa. Donc, on repasse sur le graphique interactif, on peut évidemment le télécharger en cliquant ici et voilà, j'ai toute mon analyse visuelle.
Si on continue, Chat GPT a fait une analyse exploratoire des données, ce qu'on appelle une EDA et ce qu'on a vu ensemble en fait. Donc, il l'a fait pour moi. La plupart des clients se situent dans une tranche d'âge de 30 à 55 ans, répartition des sexes bien répartie.
Donc, c'est tout ce qu'on vient de dire en fait mais ça, il me l'a fait en quelques secondes. Concentration notable des revenus entre 40000 et 120000, bref on va pas rentrer dans le détail. Et tu te rends compte à quel point ça peut être hyper puissant en quelques secondes.
Les résultats qu'on a, personnellement, je suis assez bluffé. Bon allez on va aller un peu plus loin, on va lui demander de me construire trois stratégies commerciales et marketing qui soient simples. Et qui vont me permettre d'augmenter rapidement mes ventes.
Donc, on va lui demander de réanalyser tout le contexte, parce que c'est important de lui redire de prendre en compte toute la base de données. Et là on voit qu'il récupère l'analyse qu'il vient de faire et derrière il va me faire des suggestions de stratégie commerciale et marketing. Donc, par exemple qu'est-ce que je peux faire pour augmenter mes ventes et ben forcément je peux me concentrer sur l'ger le revenu par exemple.
Donc, avoir des campagnes de pub qui sont spécifiques sur des clients de tel âge à tel âge en fonction de tel ou tel revenu. Et ça c'est en fonction du contexte qu'il a analysé juste avant. Ce que je peux faire aussi, c'est me rendre compte que j'ai tel ou tel produit qui est plus populaire qu'un autre.
Donc, par exemple, faire des campagnes spécifiques sur les produits les plus populaires. Il me suggère d'ailleurs de faire des bundles de produits, donc des packs de produits qui vont mixer par exemple un produit populaire avec un autre. Donc, ça c'est des choses qui sont intéressantes.
Donc, c'est important de lui demander de réanalyser les chiffres, parce que parfois, il peut ne pas prendre en compte l'ensemble des données. Donc, je lui ai précisé de tout réanalyser et là, derrière il a refait une analyse détaillée avec les achats par produits, achats par ville, et cetera. Donc, ça c'est des choses qui sont présentes dans le fichier, mais ce qui va être intéressant c'est juste après la stratégie pour augmenter mes ventes.
Je lui en ai demandé trois. La première c'est une cible géographique Paris et Lyon où les montants moyens d'achat sont les plus élevés. Donc, ça c'est des choses très intéressantes qu'il aurait été assez compliqué de deviner tout seul, ou du moins ça aurait pris du temps.
Donc, effectivement, je peux faire des campagnes marketing locales ciblées sur ces villes. Je peux augmenter la visibilité dans les zones à fort potentiel, ça c'est une chose basique mais qui peut être intéressante. Promotion sur les produits populaires et rentables, donc par exemple le produit 2 est le plus vendu et le produit 1 est le plus cher en moyenne.
Donc, là ce qui me suggère c'est d'offrir des réductions ou des offres group sur ces produits pour inciter les clients à en acheter plus évidemment. Et donc il me dit de faire un focus sur ces deux produits, donc c'est des choses qui sont intelligentes. Et derrière que je vais pouvoir réajuster, mais c'est quand même une très bonne base de travail.
Dernier point, la segmentation par âge et personnalisation des offres. Il a trouvé des groupes d'âge qui dépensaient le plus et derrière je peux faire des campagnes marketing personnalisées pour cibler ces groupes pour espérer augmenter mon chiffre d'affaires. Voilà!
Donc après on sort un petit peu de l'analyse des données, mais il peut te donner des stratégies commerciales et marketing très puissantes. D'ailleurs s'il y a des choses qui peuvent t'intéresser, tu prends la stratégie qui te semble plus pertinente, tu la sélectionnes. Comme ça, tu vas pouvoir citer cette stratégie là, reprendre et derrière si celle-là t'intéresse particulièrement et que tu comptes travailler dessus pour la semaine prochaine.
Tu vas lui dire, détaille-moi cette stratégie avec un plan d'action sur une semaine sous forme de tableau. Parce que moi j'aime bien la forme de tableau, je trouve ça plus pratique. Donc en quelques secondes il te sort le tableau avec ton planning pour la semaine.
Si tu veux développer sa stratégie, c'est parfait. Donc le lundi, préparation des offres, création des supports marketing. Le mardi, lancement des campagnes et envoie de newsletters, et cetera, et cetera.
On va pas rentrer plus dans le détail, mais tu te rends compte à quel point c'est fou. En trois promptes je suis passé du nettoyage, formatage de données, à une analyse de données assez poussée, et derrière les stratégies marketing et même mon planning pour la semaine. Franchement en temps normal, c'est des choses qui peuvent te prendre énormément de temps, là c'est hyper poussé et surtout extrêmement rapide avec la version 4 de TRRO.
J'ai même pas. Le temps de t'expliquer, tout est déjà rédigé, c'est incroyable! Voilà, je voulais pas faire quelque chose de plus long parce que je voulais seulement te montrer les grands principes sur l'analyse de données.
Souvent, c'est des choses qui peuvent faire peur. Tu dois te dire: "Ouais, il faut faire des choses assez complexes avec des scripts en Python, et cetera. " Pas du tout!
Tu charges ton fichier, quel que soit le format. À la limite, ça peut être du CSV, de l'Excel, même s'il y a deux-trois problèmes. Tu peux avoir peur que le fichier soit pas propre.
Bah, Chatpt peut le nettoyer à ta place en quelques secondes. Encore une fois, derrière tu peux lui poser toutes tes questions, tu peux l'orienter sur telle ou telle thématique. Et là, je t'ai montré un cas précis, d'une base de données client pour un site internet.
Mais tu peux imaginer tous les cas d'usage, et même dans tes tâches quotidiennes, ou même pour t'aider dans ton travail, que ce soit en marketing, en commerce, en tout ce que tu veux. Je suis sûr qu'il y a énormément de choses que tu vas pouvoir tirer de cet outil. Tu essayes d'appliquer ce qu'on vient de faire, sur les cas d'usages que tu rencontres régulièrement, tu vas gagner un temps fou tous les jours, ça, tu peux me croire.
Voilà, donc si la vidéo t'a plu, ce que tu peux faire, c'est mettre un like, comme ça je verrai directement s'il faut faire un épisode 2. Je pense qu'il y a encore beaucoup de choses à dire sur le sujet. Si tu veux m'aider, tu peux t'abonner, ça va m'aider énormément.
En plus, c'est les tout débuts de la chaîne, donc c'est d'autant plus important. Si tu as des questions ou des suggestions pour améliorer le contenu, bah tu me dis tout ça dans l'espace commentaire juste en dessous. En tout cas, c'était un vrai plaisir de faire cette vidéo et je te dis à la prochaine pour une nouvelle vidéo autour de Lia.