Biais de ChatGPT à la lumière de Don Quichotte . . .
J'ai redécouvert avec plaisir Don Quichotte, une œuvre de mon enfance, grâce au podcast éclairé 'Un été avec Don Quichotte' de William Marx sur France Inter. J'invite à une réflexion sur le phénomène du biais de l'IA et de ChatGPT, à la lumière de l'épisode du 28 juillet 2023, intitulé 'Où l'on doute de la réalité.'
ChatGPT et perception : Entre données et illusions de Don Quichotte
Dans l'univers romanesque de Miguel de Cervantes, Don Quichotte incarne le chevalier égaré dans les méandres de son imagination. Les simples moulins à vent se muent en colosses menaçants, un barbier devient chevalier, et un banal plat à barbe s'élève au rang de heaume précieux. Marx, dans son analyse, le souligne avec acuité : "Don Quichotte transforme cet âne en noble destrier, ce barbier en fier chevalier, ce vulgaire métal en or précieux, ce plat à barbe en un heaume légendaire – rien de moins que celui arraché au roi Mambrin par le vaillant Renaud de Montauban."
ChatGPT, par une analogie éloquente, se construit et se déforme à travers les prismes des données qu'elle traite. Les systèmes d'apprentissage machine, gorgés de données massives (comme les 175 milliards de paramètres de GPT-3), façonnent leurs modèles à partir de ces influx d'informations. À l'instar de Don Quichotte percevant des ennemis là où ne se dressent que des moulins, ChatGPT discerne tendances, prédictions et liens, là où l'humain ne voit que des faits et des nombres. Cette interprétation singulière de la réalité s'avère un terreau fertile pour les biais potentiels.
Biais de l'IA et de ChatGPT : Dans le sillage de Don Quichotte numérique
Le défi des préjugés inhérents à l'intelligence artificielle s'ancre profondément dans la qualité des données qui la nourrissent. Tel Don Quichotte, le chevalier de Cervantes, qui interprète le monde selon sa vision personnelle et son imagination débordante, ChatGPT se forge et s'éduque à travers le spectre des données qu'elle reçoit. Lorsque ces informations sont erronées, partiales ou incomplètes, l'IA, à son tour, adopte et reproduit ces mêmes inclinaisons dans ses analyses et ses conseils.
Marx, dans son exploration podcastique, met en exergue comment la réalité perçue par Don Quichotte est façonnée par ses choix de croyance et de perception. De façon similaire, ChatGPT sélectionne des modèles dans les données, suivant les orientations et les limites imposées par son apprentissage. Elle peut ainsi accentuer certaines tendances tout en en délaissant d'autres, révélant ainsi les contours de sa propre 'réalité' algorithmique.
Et maintenant ... biaisées or not biaisées ?
Comme le souligne Luc Julia, co-inventeur de Siri et expert en IA, un algorithme est alimenté par des données recueillies sur Internet, qui peuvent parfois être erronées ou tout simplement fausses (tout ce qu'on trouve sur Internet n'est pas vrai ?!). Il aborde également le problème des "hallucinations" où ChatGPT génère des résultats qui n'ont aucun sens ou qui sont déconnectés de la réalité. Cela est dû au fait que les systèmes d'IA sont conçus pour fournir une réponse à tout prix, même lorsque l'information recherchée est introuvable. Dans de tels cas, ChatGPT "improvise" une réponse basée sur des statistiques ou des suppositions, ce qui conduit à ce que l'on appelle une "hallucination."
Dans le même ordre d'idées, les sources anglophones sont surreprésentées dans les différents modèles, au détriment de régions comme l'Afrique, ce qui peut entraîner des biais culturels.
La qualité des données est souvent à l'origine des différents biais dans ChatGPT. Mais qui a l'autorité pour déterminer la véracité de certaines informations ? Prenons l'exemple des affirmations non vérifiées et des théories du complot propagées par un certain Donald, ancien président de la première puissance mondiale. Ces déclarations ont été largement diffusées en ligne, mais qui doit décider de leur véracité ? La réponse à cette question soulève des problèmes complexes d'éthique, de responsabilité et de gouvernance.
Et si on enchaînait sur un thème fétiche de Donald...
Fake News vs Vérité : Don vs Donald
Dans l'univers fictif de Don Quichotte, la frontière entre réalité et fiction est floue et sujette à interprétation. Le chevalier, accompagné de son fidèle Sancho Panza, s'immerge dans des débats philosophiques sur la nature de la réalité, souvent teintés d'humour. Toutefois, au cœur de ces échanges se dissimule une interrogation cruciale : quelles conséquences entraîne une perception de la réalité influencée par des informations erronées ou trompeuses ? Les "fake news", ces nouvelles fallacieuses, disséminent des convictions et des idéologies parfois radicalement éloignées de la réalité objective. Ce phénomène prend une ampleur particulière lorsqu'il est amplifié par des personnalités d'influence et relayé par certains médias, brouillant ainsi le discernement entre la vérité et le mensonge. Cette quête de vérité, emblématique de Don Quichotte, trouve un écho particulièrement pertinent dans notre ère actuelle, marquée par une surabondance d'informations et une désinformation rampante.
La démocratie de ChatGPT : un vote sur la réalité
Dans l'odyssée de Don Quichotte, Cervantes illustre comment la réalité peut être façonnée par la majorité. Marx, dans son analyse perspicace, interroge cette idée de réalité définie collectivement. Un épisode marquant du roman met en scène un vote organisé par les compagnons de Don Quichotte pour trancher si un objet est un heaume de légende ou un simple plat à barbe. Le consensus est clair et unanime : il s'agit d'un heaume. Marx s'interroge : "Un épisode fascinant. Peut-on vraiment établir la réalité par un consensus, comme dans un processus démocratique ?"
Cette réflexion trouve un écho dans les dilemmes contemporains liés à ChatGPT. Peut-on vraiment définir la réalité à travers un consensus algorithmique ? Les prédictions de ChatGPT, lorsqu'elles sont adoptées par la majorité, deviennent-elles notre réalité partagée ? Que se passe-t-il lorsque ces prédictions s'appuient sur des données biaisées ou non représentatives ? Et que dire des contenus générés automatiquement par des systèmes comme AutoGPT, sans aucune intervention humaine pour vérifier leur validité, contenus qui influencent ensuite les modèles de ChatGPT ?
Du chevalier aux "Illuminati"
Marx, dans son analyse approfondie, trace un parallèle saisissant entre la perception altérée de la réalité de Don Quichotte et les théories du complot modernes. Il observe : "Remplacez l'‘enchanteur’ de Don Quichotte par des entités comme les ‘Illuminati’ ou la ‘CIA’, et vous obtenez le socle des thèses conspirationnistes actuelles." Lorsqu'elle est mal orientée ou mal interprétée, ChatGPT peut effectivement nourrir de telles théories. Les algorithmes, manipulables, peuvent renforcer des préjugés ou diffuser des informations erronées. Ces distorsions de la réalité, similaires aux illusions de Don Quichotte, peuvent s'avérer aussi ridicules qu'elles sont dangereuses.
Conclusion du centaure du marketing et de l'IA : De la quête de Don Quichotte à la réalité de ChatGPT
En définitive, le débat sur les biais de ChatGPT et la perception de la réalité dans notre ère numérique repose sur notre capacité à discerner et à comprendre. Tout comme Don Quichotte, nous sommes invités à appréhender la réalité telle qu'elle est réellement, non comme nous la rêvons ou la craignons. L'aventure de Don Quichotte nous enseigne la nécessité d'une vigilance critique envers nos perceptions de la réalité, que ce soit face à des moulins à vent, des plats à barbe, ou des ensembles de données numériques. Cette leçon revêt une importance capitale alors que nous naviguons dans un monde de plus en plus dominé par le numérique et l'automatisation, où les frontières entre réalité et fiction tendent à s'estomper.
Les biais dans ChatGPT émergent lorsque les algorithmes favorisent certaines données ou groupes en fonction de leur programmation initiale, conduisant à des décisions ou des prévisions qui peuvent être injustes ou ne pas refléter fidèlement la réalité.
Podcast : Où l’on doute de la réalité (radiofrance.fr)
Dernière mise à jour : 10 mars 2024