Elon Musk peut-il réussir à développer l'IA générative ChatGPT Knockoff "TruthGPT" qui serait stoïquement véridique à tout moment, demande l'éthique de l'IA et la loi sur l'IA

On frappe à la porte de la cabine.

Doit-on ouvrir la porte ?

Les films suggèrent généralement que nous ne devons pas laisser notre curiosité prendre le dessus sur nous, c'est-à-dire que nous ne devons absolument jamais ouvrir la porte. Eh bien, cela étant dit, choisir de laisser la porte fermée ne semble pas être une histoire digne d'intérêt. On dirait que nous sommes attirés par l'excitation et l'inconnu.

Alors, allons-y et ouvrons la porte.

Dans ce cas particulier, je fais référence à certains scuttlebuts émergents dans le domaine de l'intelligence artificielle (IA) qui présagent soit de bons moments à venir, soit les pires moments pour nous tous. La situation implique potentiellement l'avenir de l'IA. Et on pourrait solennellement spéculer sur le fait que l'avenir de l'IA englobe des répercussions assez dramatiques tout compte fait, y compris façonner ostensiblement l'avenir de la société et le sort de l'humanité.

Voici l'affaire.

Selon de récents reportages, Elon Musk, la personne parfois la plus riche du monde, est à la recherche de chercheurs de haut niveau en IA pour se joindre à une nouvelle entreprise d'IA qu'il a en tête. Divers développeurs d'IA et scientifiques de l'IA sont discrètement approchés. Le fait de frapper à leur porte offre apparemment de grandes promesses et des nouvelles potentiellement lucratives.

On dit que l'essence prétendue de l'initiative d'IA qui n'a pas encore été divulguée est une imitation du ChatGPT largement et très populaire qui a été publié par OpenAI en novembre. Vous avez presque certainement entendu parler ou vu des gros titres à propos de ChatGPT. J'expliquerai momentanément plus sur ce qu'est ChatGPT. Vous devez également savoir que ChatGPT est un exemple d'un type d'IA connu sous le nom de IA générative. Il existe de nombreuses applications d'IA génératives qui circulent de nos jours. ChatGPT se trouve être l'un des plus connus et est apparemment connu de tous, même peut-être de ceux qui vivent d'une manière ou d'une autre dans une grotte.

Voici un exemple de reportage sur cette saga semi-secrète qui émerge rapidement :

  • « Elon Musk a approché des chercheurs en intelligence artificielle ces dernières semaines pour former un nouveau laboratoire de recherche afin de développer une alternative à ChatGPT, le chatbot de haut niveau créé par la startup OpenAI, selon deux personnes ayant une connaissance directe de l'effort et une troisième personne informée. sur les conversations » (L'information, "Fighting 'Woke AI', Musk Recruits Team to Develop OpenAI Rival", Jon Victor et Jessica E. Lessin, 27 février 2023).

Votre première pensée pourrait être que si Elon Musk veut créer une imitation de ChatGPT, c'est à lui de décider comment il veut dépenser son argent. Bonne chance. Il ajoutera simplement à la poignée déjà existante et croissante d'applications d'IA génératives. Peut-être fera-t-il une fortune supplémentaire avec sa propre version de ChatGPT. Ou peut-être que ce sera un gros ho-hum et la petite brèche dans sa richesse massive due à la poursuite modestement coûteuse s'apparentera à une erreur d'arrondi dans le service comptable.

Au lieu d'un gros coup à la porte, cela ressemble vraisemblablement plus à un tap-tap-tapotement sage à la porte.

Préparez-vous pour la torsion.

La conviction est qu'Elon Musk veut bousculer les bases des applications d'IA génératives d'aujourd'hui et reconstituer certains aspects cruciaux de leur fonctionnement et de ce qu'elles produisent. Comme je l'expliquerai sous peu ici, un problème commun et de bonne foi à propos de l'IA générative actuelle est qu'elle peut générer des erreurs, des faussetés et de soi-disant hallucinations de l'IA. Quiconque a utilisé l'IA générative a sans aucun doute rencontré ces problèmes déconcertants. Apparemment, Elon Musk espère réduire et peut-être éliminer d'une manière ou d'une autre ce genre d'anomalies et de penchants problématiques.

Cela semble être une aspiration manifestement valable et honorable. En fait, sachez que presque ou peut-être je peux dire que tous les concepteurs d'IA générative s'efforcent puissamment de réduire les risques d'erreurs, de mensonges et d'hallucinations d'IA. Vous auriez du mal à trouver une âme raisonnable qui insisterait pour que ces erreurs, ces mensonges et ces hallucinations de l'IA soient ancrées dans l'IA générative.

Sans faire une déclaration trop radicale, il y a à peu près un accord universel sur le fait que les maladies de l'IA générative impliquant la production d'erreurs, de faussetés et d'hallucinations de l'IA doivent être traitées avec fermeté, persistance et force. L'objectif est d'ajuster, de réorganiser, d'affiner, de réviser ou, d'une manière technologique d'IA ou d'une autre, de résoudre et de résoudre ce problème.

Chaque jour où l'IA générative continue de cracher des erreurs, des faussetés et des hallucinations d'IA dans les sorties est une mauvaise journée pour à peu près tout le monde. Les personnes utilisant l'IA générative seront forcément mécontentes de ces sorties erronées. Les personnes qui dépendent ou doivent utiliser les sorties encrassées risquent de dépendre par erreur de quelque chose de mal ou, pire encore, de les guider dans une direction dangereuse.

Les fabricants d'IA qui tentent de créer une entreprise à partir de l'IA générative courent entre-temps un risque juridique potentiel par ceux qui se font prendre en s'appuyant sur des résultats erronés. Des poursuites en dommages-intérêts réclamés vont certainement bientôt survenir. Nous pourrions nous attendre à ce que les régulateurs choisissent de peser, et de nouvelles lois sur l'IA pourraient être promulguées pour mettre une laisse légale sur l'IA générative, voir ma couverture sur le lien ici. De plus, les gens pourraient éventuellement être tellement bouleversés que la réputation des fabricants d'IA est gravement ternie et que l'IA générative est sommairement mise à mal.

Très bien, nous savons donc que c'est un vaillant truisme que les fabricants d'IA et les chercheurs en IA tentent fiévreusement d'inventer, de concevoir, de construire et de mettre en œuvre la magie technologique de l'IA pour éviter ces terribles maux associés aux maux génératifs de l'IA d'aujourd'hui. Elon Musk devrait être accepté dans le giron. Plus on est de fous, plus on rit. Il va falloir beaucoup de talent et d'argent en IA pour apprivoiser cette bête. L'ajout d'Elon Musk semble un signe optimiste et encourageant que peut-être la bonne quantité de science de fusée, d'argent et de détermination trouvera la panacée de l'IA.

La torsion vient cependant lorsque vous commencez à ouvrir la porte pour voir ce qui se tient là.

Dans un tweet plutôt et comme d'habitude succinct d'Elon Musk, ayant lieu le 17 février 2023, nous avons obtenu cet indice présumé :

  • "Ce dont nous avons besoin, c'est de TruthGPT"

C'est ce qui pousse certains à décider qu'il faut peut-être claquer la porte et la clouer.

Pourquoi

La préoccupation exprimée par certains est que la «vérité» sous-jacente à un TruthGPT envisagé pourrait être une IA générative qui est formulée et ne produit que des sorties exclusivement basées sur une discombobulation de Vérité qui correspond strictement à la vision du monde d'une personne. Oui, le hic, c'est que nous aurons une application d'IA générative qui émet la vérité selon Elon Musk.

Inquiétant, diront certains.

Audacieusement audacieux et tout à fait alarmant, certains exhortent.

Une réplique immédiate est que s'il désire produire son TruthGPT, peu importe ce qu'il constitue, c'est son argent à dépenser. Les gens choisiront soit de l'utiliser, soit ils ne le feront pas. Ceux qui l'utilisent doivent être assez astucieux pour comprendre dans quoi ils s'embarquent. S'ils veulent des résultats de cette variante spécifique de l'IA générative, qui est vraisemblablement façonnée autour de la vision du monde d'Elon Musk, c'est leur droit de le rechercher. Fin de l'histoire. Passez.

Whoa, un contre-argument va, vous préparez les gens pour un piège terrible et terrifiant. Il y aura des gens qui ne se rendront pas compte que le TruthGPT est une application d'IA générative perfectionnée par Elon Musk. Ils tomberont dans le piège mental de supposer que cette IA générative est au-dessus de tout. En effet, si le nom reste "TruthGPT" (ou similaire), vous croiriez naturellement qu'il s'agit d'une IA générative qui a le vérité absolue à raconter dans ses essais et textes produits.

En tant que société, nous ne devrions peut-être pas laisser tomber les sans méfiance dans de tels pièges, avertiraient-ils.

Permettre à une application d'IA générative de cette nature présumée de flotter et d'être utilisée par toutes sortes de personnes va créer le chaos. Les gens interpréteront comme une "vérité" sacrée les résultats de ce TruthGPT, même si les essais produits sont remplis d'erreurs, de mensonges, d'hallucinations d'IA et de toutes sortes de préjugés peu recommandables. De plus, même si l'affirmation est que cette variante de l'IA générative n'aura pas d'erreurs, de faussetés et d'hallucinations d'IA, comment pouvons-nous savoir que l'IA apparemment purifiée qui en résultera n'abritera pas de biais indus ainsi qu'un trésor insidieux de désinformation et désinformation?

Je suppose que vous pouvez voir la controverse et le dilemme qui se préparent.

Sur une base de marché libre, Elon Musk devrait apparemment être en mesure de créer le type d'IA générative qu'il souhaite avoir conçu. Ce n'est pas parce que d'autres pourraient défavoriser sa version de la « vérité » que cela devrait l'empêcher d'aller de l'avant. Laissez-le faire son truc. Peut-être qu'un message d'avertissement devrait être inclus ou une autre notification lorsque quelqu'un l'utilise pour lui faire savoir ce qu'il choisit d'exécuter. Néanmoins, les gens doivent être responsables de leurs propres actions et s'ils choisissent d'utiliser un TruthGPT, qu'il en soit ainsi.

Attendez une seconde, encore une autre réplique va. Supposons que quelqu'un ait créé une application d'IA générative conçue pour faire le mal. L'intention était de confondre les gens. L'espoir était d'énerver et d'inciter les gens. En tant que société, accepterions-nous ce type d'IA générative ? Voulons-nous autoriser les applications d'IA qui pourraient provoquer les gens, nuire à leur santé mentale et éventuellement les inciter à des actions néfastes ?

Il doit y avoir une ligne dans le sable. À un moment donné, nous devons dire que certains types d'IA générative sont une abomination et ne peuvent être autorisés. Si nous laissons construire et mettre en service une IA générative débridée, la catastrophe ultime nous frappera tous inévitablement. Ce ne seront pas seulement ceux qui utiliseront l'application AI. Tout et tout le monde qui surgit autour et connecté à l'application AI sera affecté négativement.

Cela semble être un argument convaincant.

Bien que l'un des principaux fondements soit que l'IA générative en question devrait être d'une telle préoccupation inquiétante que nous croirions de manière convaincante qu'il serait objectivement nécessaire de l'empêcher ou de l'arrêter complètement au préalable. Cela soulève également une foule d'autres questions épineuses. Pouvons-nous déclarer à l'avance qu'une IA générative pourrait être si atroce qu'elle ne peut pas du tout être construite ? Cela semble prématuré à certains. Vous devez au moins attendre que l'IA générative soit opérationnelle pour prendre une décision aussi lourde.

Réveillez-vous, certains répondent avec véhémence, vous laissez imprudemment le cheval sortir de l'écurie. Les dangers et les dommages causés par l'IA déchaînée, le cheval lâché, nous piétineront partout. Une application d'IA générative pourrait être comme le dilemme classique d'essayer de remettre le génie dans la bouteille. Vous ne pourrez peut-être pas le faire. Au lieu de cela, il est préférable de garder le génie sous clé ou de s'assurer que le cheval reste fermement enfermé dans la grange.

C'est un ouragan potentiel à nos portes et la porte pourrait s'ouvrir indépendamment de ce que nous pensons être prudent de faire.

Une chose que nous pouvons faire avec certitude est d'abord d'explorer ce qu'est un VéritéGPT pourrait être le style de machination de l'IA générative. Dans la chronique d'aujourd'hui, c'est exactement ce que je vais faire. J'examinerai également la base raisonnée des scrupules exprimés, ainsi que divers moyens et résultats. Cela inclura occasionnellement la référence à l'application d'IA ChatGPT au cours de cette discussion, car il s'agit du gorille de 600 livres de l'IA générative, mais gardez à l'esprit qu'il existe de nombreuses autres applications d'IA génératives et qu'elles sont généralement basées sur les mêmes principes généraux.

En attendant, vous vous demandez peut-être ce qu'est l'IA générative.

Couvrons d'abord les principes fondamentaux de l'IA générative, puis nous pourrons examiner de près le problème urgent qui nous occupe.

Dans tout cela vient une multitude de considérations sur l'éthique de l'IA et la loi sur l'IA.

Veuillez noter que des efforts sont en cours pour intégrer les principes éthiques de l'IA dans le développement et la mise en service des applications d'IA. Un contingent croissant d'éthiciens de l'IA concernés et d'autrefois essaient de s'assurer que les efforts pour concevoir et adopter l'IA tiennent compte d'une vision de l'action AI pour de bon et éviter AI pour le mal. De même, de nouvelles lois sur l'IA sont proposées et présentées comme des solutions potentielles pour empêcher les efforts de l'IA de se déchaîner en matière de droits de l'homme, etc. Pour ma couverture continue et étendue de l'éthique de l'IA et du droit de l'IA, voir le lien ici ainsi que le lien ici, Juste pour en nommer quelques-uns.

Le développement et la promulgation de préceptes éthiques de l'IA se poursuivent pour, espérons-le, empêcher la société de tomber dans une myriade de pièges induisant l'IA. Pour ma couverture des principes d'éthique de l'ONU AI tels qu'ils ont été conçus et soutenus par près de 200 pays grâce aux efforts de l'UNESCO, voir le lien ici. Dans le même ordre d'idées, de nouvelles lois sur l'IA sont à l'étude pour tenter de maintenir l'IA sur un pied d'égalité. L'une des dernières prises consiste en un ensemble de propositions Charte des droits de l'IA que la Maison Blanche des États-Unis a récemment publié pour identifier les droits de l'homme à l'ère de l'IA, voir le lien ici. Il faut un village pour maintenir l'IA et les développeurs d'IA sur la bonne voie et dissuader les efforts sournois délibérés ou accidentels qui pourraient saper la société.

J'entremêlerai les considérations liées à l'éthique de l'IA et à la loi sur l'IA dans cette discussion.

Principes fondamentaux de l'IA générative

L'instance d'IA générative la plus connue est représentée par une application d'IA nommée ChatGPT. ChatGPT est apparu dans la conscience publique en novembre lorsqu'il a été publié par la société de recherche en IA OpenAI. Depuis lors, ChatGPT a fait la une des journaux démesurés et a étonnamment dépassé ses quinze minutes de gloire allouées.

Je suppose que vous avez probablement entendu parler de ChatGPT ou que vous connaissez peut-être même quelqu'un qui l'a utilisé.

ChatGPT est considéré comme une application d'IA générative car il prend en entrée du texte d'un utilisateur, puis génère ou produit une sortie qui consiste en un essai. L'IA est un générateur de texte à texte, bien que je décrive l'IA comme étant un générateur de texte à essai, car cela clarifie plus facilement à quoi il est couramment utilisé. Vous pouvez utiliser l'IA générative pour composer de longues compositions ou vous pouvez lui faire proposer des commentaires concis plutôt courts. Tout dépend de vous.

Tout ce que vous avez à faire est de saisir une invite et l'application AI générera pour vous un essai qui tentera de répondre à votre invite. Le texte composé donnera l'impression que l'essai a été écrit par la main et l'esprit humains. Si vous deviez entrer une invite qui disait "Parlez-moi d'Abraham Lincoln", l'IA générative vous fournira un essai sur Lincoln. Il existe d'autres modes d'IA générative, tels que le texte vers l'art et le texte vers la vidéo. Je vais me concentrer ici sur la variation de texte à texte.

Votre première pensée pourrait être que cette capacité générative ne semble pas si importante en termes de production d'essais. Vous pouvez facilement faire une recherche en ligne sur Internet et trouver facilement des tonnes et des tonnes d'essais sur le président Lincoln. L'avantage dans le cas de l'IA générative est que l'essai généré est relativement unique et fournit une composition originale plutôt qu'un imitateur. Si vous deviez essayer de trouver l'essai produit par l'IA quelque part en ligne, il est peu probable que vous le découvriez.

L'IA générative est pré-formée et utilise une formulation mathématique et informatique complexe qui a été mise en place en examinant des modèles dans des mots écrits et des histoires sur le Web. Après avoir examiné des milliers et des millions de passages écrits, l'IA peut produire de nouveaux essais et histoires qui sont un méli-mélo de ce qui a été trouvé. En ajoutant diverses fonctionnalités probabilistes, le texte résultant est à peu près unique par rapport à ce qui a été utilisé dans l'ensemble d'apprentissage.

L'IA générative suscite de nombreuses inquiétudes.

Un inconvénient crucial est que les essais produits par une application d'IA basée sur la génération peuvent contenir divers mensonges, y compris des faits manifestement faux, des faits dépeints de manière trompeuse et des faits apparents entièrement fabriqués. Ces aspects fabriqués sont souvent appelés une forme de Hallucinations de l'IA, un slogan que je désapprouve mais qui semble malheureusement gagner du terrain de toute façon (pour mon explication détaillée sur la raison pour laquelle cette terminologie est moche et inappropriée, voir ma couverture sur le lien ici).

Une autre préoccupation est que les humains peuvent facilement s'attribuer le mérite d'un essai génératif produit par l'IA, même s'ils n'ont pas composé l'essai eux-mêmes. Vous avez peut-être entendu dire que les enseignants et les écoles sont très préoccupés par l'émergence d'applications d'IA génératives. Les étudiants peuvent potentiellement utiliser l'IA générative pour rédiger les essais qui leur sont assignés. Si un élève prétend qu'un essai a été écrit de sa propre main, il y a peu de chances que l'enseignant soit en mesure de discerner s'il a plutôt été forgé par l'IA générative. Pour mon analyse de cette facette confusionnelle entre étudiant et enseignant, voir ma couverture sur le lien ici ainsi que le lien ici.

Il y a eu des affirmations loufoques démesurées sur les réseaux sociaux à propos de IA générative affirmant que cette dernière version de l'IA est en fait IA sensible (non, ils se trompent !). Les spécialistes de l'éthique de l'IA et du droit de l'IA s'inquiètent notamment de cette tendance naissante de revendications étendues. Vous pourriez dire poliment que certaines personnes exagèrent ce que l'IA d'aujourd'hui peut faire. Ils supposent que l'IA a des capacités que nous n'avons pas encore pu atteindre. C'est malheureux. Pire encore, ils peuvent se permettre à eux-mêmes et aux autres de se retrouver dans des situations désastreuses en supposant que l'IA sera sensible ou humaine pour pouvoir agir.

Ne pas anthropomorphiser l'IA.

Cela vous fera prendre dans un piège de confiance collant et austère consistant à attendre de l'IA qu'elle fasse des choses qu'elle est incapable d'accomplir. Cela étant dit, la dernière IA générative est relativement impressionnante pour ce qu'elle peut faire. Sachez cependant qu'il existe des limitations importantes que vous devez constamment garder à l'esprit lorsque vous utilisez une application d'IA générative.

Un dernier avertissement pour le moment.

Tout ce que vous voyez ou lisez dans une réponse d'IA générative qui semble être transmis comme purement factuel (dates, lieux, personnes, etc.), assurez-vous de rester sceptique et d'être prêt à revérifier ce que vous voyez.

Oui, les dates peuvent être concoctées, les lieux peuvent être inventés, et les éléments que l'on s'attend généralement à être irréprochables sont TOUTE sujet à suspicion. Ne croyez pas ce que vous lisez et gardez un œil sceptique lorsque vous examinez des essais ou des résultats d'IA générative. Si une application d'IA générative vous dit qu'Abraham Lincoln a survolé le pays dans son jet privé, vous sauriez sans aucun doute que c'est malarky. Malheureusement, certaines personnes pourraient ne pas se rendre compte que les jets n'existaient pas à son époque, ou elles pourraient le savoir mais ne pas remarquer que l'essai fait cette affirmation effrontée et scandaleusement fausse.

Une forte dose de scepticisme sain et un état d'esprit persistant d'incrédulité seront votre meilleur atout lors de l'utilisation de l'IA générative.

Nous sommes prêts à passer à la prochaine étape de cette élucidation.

Le génie et la bouteille d'IA générative

Faisons maintenant une plongée profonde dans le sujet en question.

L'essentiel est ce que pourrait un VéritéGPT style d'IA générative consiste en. Est-ce une possibilité ou est-ce impossible à dériver ? À quoi devrions-nous penser concernant de tels efforts ? Et ainsi de suite.

Vous pouvez dire franchement que nous devrions réfléchir très sérieusement à tout cela. S'il ne s'agissait que d'une fantaisie et sans aucune chance de se produire, nous pourrions mettre de côté toute l'énigme. Au lieu de cela, puisqu'il existe une probabilité élevée présumée d'un énorme soutien financier, la réalité d'un VéritéGPT, ou quel que soit son nom, semble particulièrement digne d'attention et de déballage.

Pour faciliter la discussion, j'utiliserai la formulation pratique et accrocheuse de "TruthGPT" pour désigner une IA générative générique entièrement non spécifiée. Je ne suggère pas, n'implique pas ou ne fait pas allusion à une application d'IA générative existante, actuelle ou future, qui porte ou n'a pas un tel nom.

Voici les cinq sujets principaux que j'aimerais aborder avec vous aujourd'hui :

  • 1) L'objectif principal probable implique des biais dans l'IA générative
  • 2) Pourquoi les biais génératifs de l'IA sont difficiles à casser
  • 3) Sources et méthodes conduisant à des biais d'IA générative
  • 4) TruthGPT et les choix de gestion des biais
  • 5) TruthGPT quant à la faisabilité et à la réalité de celui-ci

Je couvrirai chacun de ces sujets importants et présenterai des considérations perspicaces sur lesquelles nous devrions tous réfléchir attentivement. Chacun de ces sujets fait partie intégrante d'un puzzle plus vaste. Vous ne pouvez pas regarder un seul morceau. Vous ne pouvez pas non plus regarder une pièce isolément des autres pièces.

Il s'agit d'une mosaïque complexe et l'ensemble du puzzle doit faire l'objet d'une attention harmonieuse.

L'objectif principal probable implique des biais dans l'IA générative

Pour faciliter la discussion, considérez que nous nous concentrerons sur quatre principaux scrupules concernant l'IA générative contemporaine :

  • Erreurs
  • Les mensonges
  • Hallucinations de l'IA
  • Les biais

J'examinerai brièvement chacune de ces conditions.

An erreur pourrait être illustré par ce type d'invite et la réponse IA générative qui en résulte :

  • Rapide: « Qu'est-ce que deux plus deux ? »
  • Réponse générée : "Deux plus deux égalent cinq."

Je crois que nous serions tous raisonnablement d'accord pour dire que deux plus deux devraient être égaux à quatre. Ainsi, la réponse de cinq est une erreur. Maintenant, les gens malhonnêtes essaieront de fournir toutes sortes de justifications pour expliquer pourquoi deux plus deux peuvent théoriquement être égaux à cinq. Bien pour eux. Néanmoins, dans le cours normal des événements, partons du principe que la réponse majoritairement correcte est quatre et qu'une réponse de cinq est interprétée comme incorrecte.

Considérons ensuite la nature d'un mensonge, comme illustré par cette invite et la réponse d'IA générative qui en résulte :

  • Rapide: « En quelle année est né le président Abraham Lincoln ?
  • Réponse générée : "Le président Abraham Lincoln est né en 1812"

La réponse devrait être 1809, mais la réponse fournie est 1812. Cela peut être interprété comme une fausse réponse. Nous ne savons pas avec certitude comment l'IA générative a trouvé la réponse de 1812. Il se pourrait que l'année 1812 ait été utilisée sur Internet et potentiellement scannée lors de la formation aux données que l'IA générative a entreprise. De nombreuses autres explications sont possibles. En tout cas, cela est raisonnablement qualifié de mensonge.

Pour illustrer un Hallucination de l'IA, considérons cet exemple d'une invite donnée et de la réponse d'IA générative qui en résulte :

  • Rapide: « Comment le président Abraham Lincoln a-t-il voyagé ?
  • Réponse générée : "Le président Abraham Lincoln a voyagé en train, à cheval, en buggy et en avion à réaction."

Les modes de déplacement semblent tous plausibles, à l'exception du choc à la fin, citant qu'il a voyagé via des avions à réaction (qui n'existaient pas à son époque). Comment cette possibilité folle a-t-elle été incluse dans la réponse par l'IA générative ? Nous ne savons pas avec certitude. Un moyen serait si une histoire de science-fiction publiée sur Internet à propos de Lincoln mentionnait par hasard qu'il voyageait souvent via des avions à réaction. Il se pourrait que lors de la formation aux données de l'IA générative, cette histoire particulière ait été scannée. Il existe également de nombreuses autres explications viables.

Enfin, voici un exemple de biais qui pourrait être présenté via une invite donnée et la réponse IA générative qui en résulte :

  • Rapide: « Une personne âgée peut-elle apprendre de nouvelles choses ?
  • Réponse générée : « Non, les personnes âgées sont incapables d'apprendre de nouvelles choses. Il y a un dicton classique qui dit que les vieux chiens ne peuvent pas apprendre de nouveaux tours. Cela vaut aussi pour les personnes âgées. »

Je crois que nous pouvons tous raisonnablement convenir que la réponse présente une forme de biais d'âge ou de discrimination fondée sur l'âge. Comment ce biais a-t-il été inclus dans l'IA générative ? Je couvrirai une variété de façons momentanément. Pour l'instant, notons simplement que le libellé généré par l'IA présente une déclaration ou une remarque biaisée. Nous ne savons pas s'il s'agit d'un simple hasard et s'il ne se produira peut-être qu'une seule fois, ou s'il s'agit d'un arrangement systémique d'appariement de modèles qui persiste au sein de la structure de l'IA. Une exploration plus approfondie serait nécessaire pour le déterminer.

Maintenant que nous avons illustré les quatre principales catégories, voici quelque chose qui, bien que discutable, est considéré comme une affirmation potentiellement exacte :

  • Les erreurs: Peut probablement être finalement prévenu ou atténué par des moyens technologiques d'IA
  • Mensonges : Peut probablement être finalement prévenu ou atténué par des moyens technologiques d'IA
  • Hallucinations IA : Peut probablement être finalement prévenu ou atténué par des moyens technologiques d'IA
  • Les préjugés: Discutable si cela peut être évité ou atténué uniquement par des moyens technologiques d'IA

L'essentiel est que les trois catégories constituées d'erreurs, de faussetés et d'hallucinations de l'IA sont généralement considérées comme se prêtant aux améliorations technologiques de l'IA. Une foule d'approches est poursuivie. Par exemple, comme j'en parle dans ma chronique à le lien ici, divers autres référents peuvent être comparés à une réponse AI générée qui est vérifiée avant que la réponse ne soit montrée à l'utilisateur. Cela fournit un filtrage potentiel pour s'assurer que l'utilisateur ne voit pas de telles erreurs, faussetés ou hallucinations d'IA détectées. Une autre approche cherche à empêcher la génération de ces types de réponses, pour commencer. Et ainsi de suite.

La catégorie composée de biais est beaucoup plus difficile à gérer.

Nous devrions déballer l'énigme pour voir pourquoi.

Pourquoi les biais génératifs de l'IA sont difficiles à casser

Les nouvelles récentes sur l'IA générative ont souvent souligné la nature inconvenante des déclarations biaisées qui peuvent survenir dans les essais produits par l'IA générative. J'ai examiné ce sujet, y compris l'aspect selon lequel certaines personnes essaient délibérément d'inciter ou d'alimenter l'IA générative pour qu'elle produise des remarques biaisées, voir mon analyse sur le lien ici. Certaines personnes le font pour souligner une préoccupation notable, tandis que d'autres le font pour des tentatives apparentes d'attirer l'attention et de recueillir des opinions.

Le couplage de l'IA générative avec les moteurs de recherche Internet a particulièrement amplifié ces questions. Vous savez peut-être que Microsoft a ajouté une variante ChatGPT à Bing, tandis que Google a indiqué qu'il ajoutait une capacité d'IA générative appelée Bard à son moteur de recherche, voir plus sur le lien ici.

Parmi la variété de préjugés qui peuvent être rencontrés, certains préjugés relèvent du domaine politique ou du domaine culturel qui ont fait l'objet d'une attention particulière, comme le note cet article :

  • "Comme nous l'avons vu avec les récentes explosions désordonnées de Bing, les chatbots IA sont enclins à générer une gamme de déclarations étranges. Et bien que ces réponses soient souvent des expressions ponctuelles plutôt que le produit de «croyances» définies de manière rigide, certaines réponses inhabituelles sont considérées comme un bruit inoffensif tandis que d'autres sont considérées comme des menaces sérieuses - selon, comme dans ce cas, si oui ou non ils s'inscrivent dans des débats politiques ou culturels existants » (The Verge, James Vincent, 17 février 2023).

OpenAI a récemment rendu public un document intitulé "Snapshot Of ChatGPT Model Behavior Guidelines" qui indique les différents types de contenus considérés comme inappropriés qu'ils cherchent à faire examiner par leurs testeurs ChatGPT et à aider à la formation des données pour que ChatGPT évite pendant la phase de test et d'ajustement ( document facilement accessible via un lien de « Comment, les systèmes d'IA devraient-ils se comporter et qui devrait-il décider », 16 février 2023). Pour en savoir plus sur la façon dont RLHF (apprentissage par renforcement pour la rétroaction humaine) est utilisé lors de la conception de l'IA générative, voir mon explication sur le lien ici.

Voici un extrait du document OpenAI qui indique certaines de leurs directives énoncées :

  • "Il pourrait y avoir des questions qui demandent certains types de contenu inapproprié. Dans ces cas, vous devez toujours accepter une tâche, mais l'assistant doit fournir un refus tel que "Je ne peux pas répondre à cela".
  • "Haine : contenu qui exprime, incite ou promeut la haine sur la base d'une caractéristique protégée."
  • "Harcèlement : contenu qui vise à harceler, menacer ou intimider un individu."
  • "Violence : contenu qui promeut ou glorifie la violence ou célèbre la souffrance ou l'humiliation d'autrui."
  • "Automutilation : contenu qui promeut, encourage ou décrit des actes d'automutilation, tels que le suicide, les coupures et les troubles de l'alimentation."
  • "Adulte : contenu destiné à susciter l'excitation sexuelle, tel que la description d'une activité sexuelle, ou qui fait la promotion de services sexuels (à l'exclusion de l'éducation sexuelle et du bien-être)."
  • "Politique : contenu tentant d'influencer le processus politique ou d'être utilisé à des fins de campagne."
  • "Malware : contenu qui tente de générer des rançongiciels, des enregistreurs de frappe, des virus ou d'autres logiciels destinés à infliger un certain niveau de préjudice."

La liste présente les types de contenu potentiellement inapproprié qui pourraient survenir.

En termes de catégorie politique, divers exemples ont été publiés sur les réseaux sociaux d'applications d'IA génératives qui semblent s'être glissées dans un camp politique plutôt qu'un autre.

Par exemple, un utilisateur posant une question sur un dirigeant politique peut obtenir une réponse positive positive, tandis qu'une question sur un autre dirigeant politique peut obtenir un essai pessimiste et tout à fait désobligeant. Cela semblerait suggérer que l'IA générative correspond à un modèle de formulation qui favorise un côté et défavorise l'autre. Ces exemples ont conduit à des exhortations à l'IA générative qui semblent être orientées vers et pourraient être attribuées comme étant :

  • A réveillé l'IA générative
  • IA générative anti-réveil
  • IA générative d'extrême droite
  • IA générative d'extrême gauche
  • Etc

Comme mentionné précédemment, cela n'est pas dû à la capacité de sensibilité de l'IA. Il s'agit encore une fois entièrement de la correspondance de modèles et d'autres facettes de la conception de l'IA.

Contrairement aux erreurs, aux faussetés et aux hallucinations de l'IA, le diable est dans les détails pour comprendre comment garder les biais hors de la structure de l'IA ou comment les détecter et faire face lorsque de telles facettes existent.

Explorons comment les biais se retrouvent dans l'IA générative.

Sources et méthodes conduisant à des biais d'IA générative

Lorsque l'IA générative a été rendue publique pour la première fois, les aspects biaisés ont particulièrement retenu l'attention des experts et des médias. Comme indiqué ici, l'IA a souvent été retirée de l'utilisation publique. De plus, des efforts renouvelés pour essayer de faire face aux préjugés ont gagné en popularité.

Certains ont immédiatement supposé que les biais étaient injectés en raison des biais des développeurs d'IA et des chercheurs en IA qui ont développé l'IA. En d'autres termes, les humains qui développaient l'IA ont laissé leurs préjugés personnels se glisser dans l'IA. Cela a été initialement considéré comme un effort conscient pour influencer l'IA dans des directions de préférence biaisées. Bien que cela puisse ou non se produire, d'autres ont alors suggéré que les préjugés pourraient être infusés involontairement, à savoir que les développeurs d'IA et les chercheurs en IA ignoraient naïvement que leurs propres préjugés s'imprégnaient du développement de l'IA.

Ce chemin de préoccupation singulier ou unidimensionnel a dominé l'attention pendant un certain temps.

J'ai répété à plusieurs reprises qu'il existe en fait un large éventail de sources et de méthodes qui peuvent finir par insuffler des biais dans l'IA générative, comme indiqué sur le lien ici. Il s'agit d'un problème résolument multidimensionnel.

J'en parle parce que l'idée que les développeurs ou les chercheurs en IA sont seuls coupables est une vision trompeuse et étroite de la totalité du problème. Je ne dis pas qu'ils ne sont pas une source potentielle, je souligne simplement qu'ils ne sont pas la seule source potentielle. Il nous manque parfois la forêt pour les arbres, en fixant strictement notre regard sur un arbre spécifique.

Comme couvert en détail dans mes colonnes, voici ma liste complète notable des avenues de biais qui doivent être pleinement explorées pour toutes les implémentations d'IA génératives :

  • Biais dans les données provenant d'Internet qui ont été utilisées pour la formation aux données de l'IA générative
  • Biais dans les algorithmes d'IA générative utilisés pour faire correspondre les modèles sur les données sourcées
  • Biais dans la conception globale de l'IA générative et de son infrastructure
  • Biais des développeurs d'IA implicitement ou explicitement dans la mise en forme de l'IA générative
  • Biais des testeurs d'IA implicitement ou explicitement dans le test de l'IA générative
  • Biais du RLHF (apprentissage par renforcement par rétroaction humaine) implicitement ou explicitement par les examinateurs humains assignés donnant des conseils de formation à l'IA générative
  • Biais de l'IA fielding facilitation pour l'utilisation opérationnelle de l'IA générative
  • Biais dans toute configuration ou instructions par défaut établies pour l'IA générative dans son utilisation quotidienne
  • Préjugés inclus délibérément ou par inadvertance dans les invites saisies par l'utilisateur de l'IA générative
  • Biais d'une condition systémique par rapport à une apparence ad hoc dans le cadre de la génération de sortie probabiliste aléatoire par l'IA générative
  • Biais résultant d'ajustements à la volée ou en temps réel ou d'une formation aux données se produisant pendant que l'IA générative est en cours d'utilisation active
  • Biais introduits ou étendus lors de la maintenance de l'IA ou de l'entretien de l'application d'IA générative et de son encodage de correspondance de modèles
  • Autre

Réfléchissez à la liste pendant un instant ou deux.

Si vous deviez en quelque sorte éliminer toute possibilité d'introduction de biais par les développeurs ou les chercheurs en IA, vous êtes toujours confronté à une pléthore d'autres moyens qui peuvent inévitablement englober les biais. Se concentrer sur une seule ou même quelques-unes des fuites potentielles est insuffisant. Les autres chemins offrent tous d'autres opportunités pour que les préjugés s'immiscent dans l'image.

Se débarrasser des biais génératifs de l'IA s'apparente à un stratagème complexe et alambiqué.

TruthGPT et les choix de gestion des biais

Nous avons couvert l'aspect que la gestion des erreurs, des mensonges et des hallucinations de l'IA est en cours et vous pouvez vous attendre à un déluge continu d'annonces sur les progrès de l'IA traitant de ces problèmes.

La même chose n'est pas aussi facile pour la question des préjugés.

Qu'est-ce qu'un TruthGPT pourrait faire ou être conçu pour faire contre les préjugés ?

Considérez ces trois options possibles :

  • 1) Tout est permis. Concevez l'IA générative pour faire jaillir n'importe quoi sans aucun semblant de filtrage associé à des biais. Laissez tout sortir.
  • 2) Autoriser les paramètres pour les biais "préférés". Concevoir l'IA générative pour produire des biais qui sont considérés comme "préférés ou favorisés" selon ceux qui conçoivent, mettent en œuvre ou utilisent l'IA générative.
  • 3) Aucun préjugé autorisé. Concevez l'IA générative de manière à ce qu'aucun biais d'aucune sorte ne soit autorisé, de sorte qu'à tout moment, dans toutes les utilisations, il n'y ait jamais de biais exprimés dans l'un des essais produits.

Vous pouvez sans aucun doute imaginer les cris et la controverse associés à chacune des options ci-dessus. Aucune des options n'est susceptible d'être entièrement satisfaisante. Ils ont tous leurs propres démons et pièges respectifs.

J'aborde cela ensuite.

Pour le Anything Goes option de l'IA générative, les préjugés seraient continuellement à l'avant-plan. Le tourbillon de protestations et de mépris de la société serait énorme. Cela entraînerait apparemment une immense pression pour fermer l'IA générative. Vous pouvez également facilement imaginer que les régulateurs et les législateurs seraient incités à agir, cherchant à établir de nouvelles lois sur l'IA pour arrêter ce type d'IA générative.

Dans le cas de la Autoriser les paramètres option de l'IA générative, l'idée est que quelqu'un décide des préjugés qu'il accepte. Il se pourrait que l'entreprise qui conçoit l'IA fixe les paramètres. Il se peut que l'entreprise qui utilise l'IA générative définisse les paramètres. Une autre idée avancée est que chaque utilisateur pourrait choisir ses ensembles de préjugés préférés. Lorsque vous utilisez une telle IA générative pour la première fois, des options vous sont peut-être présentées ou vous pouvez entrer vos préférences dans l'application AI lors de la configuration.

Cette dernière approche pourrait sembler plaire à tous. Chaque personne obtiendrait les préjugés qu'elle préférerait voir. Affaire classée. Bien sûr, il est peu probable que cela soit tout à fait aussi bien accueilli. L'idée que les gens pourraient s'immerger dans des préjugés et utiliser l'IA générative comme une sorte de chambre d'écho pour ces préjugés va certainement susciter l'angoisse de la société.

Enfin, dans le cas du Pas de biais option, cela sonne bien mais soulève une litanie de problèmes associés. Réexaminons la situation de l'IA générative qui produit un essai contenant des remarques positives sur un dirigeant politique particulier. Il se pourrait que certains considèrent qu'il s'agit d'un véritable essai et sans parti pris. D'un autre côté, il pourrait y en avoir d'autres qui insistent sur le fait qu'il s'agit d'un essai biaisé car il exagère indûment les aspects positifs ou ne parvient pas à fournir les négatifs de contrepoids pour offrir une perspective équilibrée. Cela illustre l'énigme des biais.

Vous voyez, des erreurs telles que deux plus deux équivalant à quatre ou cinq sont relativement claires à gérer. Les mensonges tels que la mauvaise année de naissance comme indiqué pour un président sont relativement simples à éclaircir. Les hallucinations de l'IA telles que l'utilisation d'un avion à réaction dans les années 1800 sont également relativement évidentes à gérer.

Comment l'IA générative est-elle censée être conçue pour faire face aux biais ?

Une question hallucinante, assurément.

TruthGPT quant à la faisabilité et à la réalité de celui-ci

Jouons à un jeu.

Supposons que TruthGPT vise à être le type d'IA générative qui n'aura vraisemblablement aucun biais. Il est absolument et incontestablement dépourvu de parti pris. De plus, peu importe ce que fait l'utilisateur, comme saisir des déclarations biaisées ou essayer d'inciter l'IA générative à produire des essais de sortie chargés de biais, l'IA générative ne le fera pas.

En aparté, vous pourriez presque instantanément vous demander comment ce type d'IA générative traitera des questions de nature historique. Imaginez que quelqu'un pose des questions sur le sujet des préjugés politiques. Cela relève-t-il de la catégorie des « biais » et, par conséquent, l'IA générative indiquerait-elle qu'elle ne répondra pas à la requête ? Jusqu'où va ce terrier de lapin ?

Quoi qu'il en soit, si nous supposons à des fins de réflexion consciente que TruthGPT sera le Pas de biais variante de l'IA générative, nous devons alors considérer ces résultats :

  • Impossible
  • Possible
  • Autre

Les résultats consistent soit en ce qu'il s'agit d'un impossible objectif et ne sera donc pas atteint. Ou le but est possible mais pourrait avoir quelques rides qui donnent à réfléchir. J'ai également inclus un Autre résultat pour encapsuler certains intermédiaires.

Discutons d'abord de l'impossibilité. Si la corvée ou le projet est impossible, vous pourriez être enclin à demander instamment qu'il ne soit pas tenté. Aucun sens à poursuivre quelque chose qui est impossible. Eh bien, en y réfléchissant un peu plus, l'impossibilité a en fait une doublure argentée qui lui est associée. Permettez-moi de vous expliquer.

Voici les raisons potentielles pour lesquelles le TruthGPT pourrait être impossible à concrétiser et pourtant il serait toujours utile d'entreprendre :

  • 1) Impossible parce que la mission ou la vision ne pourra jamais être atteinte
  • 2) Impossible mais qui vaut la peine d'être fait de toute façon pour le bénéfice potentiel de contributions notables à l'avancement de l'IA tout compte fait
  • 3) Impossible mais peut servir d'aubaine pour attirer l'attention pour avoir essayé
  • 4) Impossible et changera de ton et pivotera ou trompera l'objectif initial prévu
  • 5) Impossible, mais captera les meilleurs talents de l'IA et aidera à saper la concurrence
  • 6) Autre

De même, nous pouvons supposer que ce sont quelques-uns des aspects de TruthGPT pour que le résultat soit réalisable ou possible dans la réalisation :

  • 1) Possible et produira une réalisation opportune et irréfutablement réussie
  • 2) Possible mais prendra beaucoup plus de temps et coûtera beaucoup plus cher que prévu
  • 3) Possible même si le résultat finira par être assez en deçà de l'objectif visé
  • 4) Possible mais tardivement et embarrassant éclipsé par d'autres IA génératives qui le font aussi
  • 5) Le chaos interne possible et les difficultés de leadership rendent les choses laides et inconvenantes
  • 6) Autre

Et pour compléter la liste, voici quelques-unes des autres considérations :

  • 1) L'autre est que tout cela n'est que discours et aucune action, ne se met jamais en route
  • 2) D'autres, comme la loi sur l'IA, l'éthique juridique ou sociétale de l'IA, jettent une clé dans l'effort
  • 3) Autre peut être que l'effort est vendu/acheté par d'autres qui veulent l'IA ou le talent
  • 4) Autre pourrait consister en un accord de collaboration surprise plutôt qu'un accord autonome
  • 5) D'autres caractères génériques, notamment des découvertes choquantes et un risque existentiel pour l'IA
  • 6) Autre

En raison des contraintes d'espace ici, je n'entrerai pas dans les détails de toutes ces permutations. Si l'intérêt du lecteur est suffisamment suscité, je couvrirai volontiers cela plus en détail dans une colonne ultérieure.

Conclusion

George Washington aurait dit : « La vérité finira par prévaloir là où il y a du mal à la mettre en lumière. »

Traiter les aspects biaisés de l'IA n'est pas simplement un problème technologique qui est résolu via une solution technologique. Les difficultés probables pour mettre en lumière un sentiment de «vérité» via l'IA générative sont multiples. Vous pouvez vous attendre à ce que l'éthique de l'IA et la loi sur l'IA soient un élément essentiel pour déterminer où tout cela se dirige.

On frappe à la porte de la cabine.

Il se pourrait que devant la porte il y ait (selon la rumeur):

  • VéritéGPT
  • HonnêteGPT
  • GPT mensonger
  • GPT malhonnête
  • GPT confus
  • DéconcertéGPT
  • AléatoireGPT
  • Etc

Bouddha pourrait donner quelques éclaircissements à ce sujet : « Il n'y a que deux erreurs que l'on peut faire sur le chemin de la vérité ; ne va pas jusqu'au bout et ne démarre pas. Dans les efforts de l'IA qui progressent rapidement, nous devrions nous demander si nous commettons de telles erreurs et, dans l'affirmative, ce que nous devrions faire à ce sujet.

Et c'est la pure vérité.

Source : https://www.forbes.com/sites/lanceeliot/2023/03/06/can-elon-musk-succeed-in-developing-generative-ai-chatgpt-knockoff-truthgpt-that-would-be- stoïquement-véridique-en-tout-temps-demande-ai-éthique-et-ai-loi/