Est-il vrai que l'IA générative ChatGPT inondera Internet de contenu infini, demande l'éthique de l'IA et la loi sur l'IA

Connaissez-vous par hasard le livre pour enfants inspirant Un poisson hors de l'eau?

Le livre enchanteur a été écrit par Helen Palmer (de son vrai nom Helen Palmer Geisel) et était basé sur une nouvelle du Dr Seuss (de son vrai nom Theodor Geisel). L'équipe mari et femme a produit une contribution désormais légendaire à la littérature pour enfants, ravissant les jeunes du monde entier.

Si vous n'êtes pas familier avec l'intrigue ou si vous avez besoin d'un rafraîchissement, permettez-moi de résumer brièvement. Un garçon achète un poisson rouge dans son animalerie locale. Il est sévèrement chargé de ne jamais suralimenter la minuscule créature marine. Vous ne savez jamais ce qui pourrait arriver si vous le faites.

Le garçon suralimente par inadvertance son poisson rouge, une seule fois, mais cela déclenche une quantité stupéfiante de croissance débridée.

Les choses commencent à mal tourner.

Le poisson autrefois minuscule devient rapidement trop grand pour son aquarium et devient si gros que le garçon met l'animal bien-aimé dans une baignoire de la maison. Le poisson ne cesse de grandir et de grandir. Cela semble imparable.

Bientôt, la police et les pompiers viennent en aide au garçon et transportent le poisson rouge maintenant de la taille d'un éléphant vers la piscine publique locale. En fin de compte, le propriétaire de l'animalerie arrive et parvient à réduire le poisson rouge à sa taille normale. Nous ne savons pas comment cet exploit magique a été réalisé. Le garçon est à nouveau mis en garde d'éviter la suralimentation.

Leçon apprise, à la dure.

Nous devrons peut-être tenir compte de cette même leçon déchirante en ce qui concerne l'avenir d'Internet.

Comment cela?

La réalité d'aujourd'hui est que nous aurions pu concevoir une forme d'intelligence artificielle (IA) qui va se développer et remplir Internet d'un torrent de données massif et sans fin. Il y a beaucoup de torsions qui IA générative, l'IA la plus en vogue ces jours-ci, fera exactement cela.

L'IA générative est capable de générer ou de produire des sorties telles que du texte avec une simple invite saisie par un utilisateur humain. Un essai complet et approfondi peut être généré via quelques mots bien choisis. Vous connaissez peut-être l'IA générative grâce à une application d'IA très populaire connue sous le nom de ChatGPT qui a été publiée en novembre par OpenAI. J'en dirai plus à ce sujet dans un instant.

Certains ont averti avec ferveur que l'IA générative peut être utilisée pour créer une quantité apparemment infinie de contenu.

Une personne peut facilement tirer parti de l'IA générative pour produire plusieurs milliers d'essais en une seule session en ligne, le faisant avec un minimum de travail de sa part. La personne pourrait alors choisir de publier les essais générés sur Internet. Imaginez cela fait à grande échelle. Essentiellement, allez-y et multipliez cela par des millions et des millions d'internautes. Un véritable tsunami de contenu généré peut être facilement produit et publié.

Rincez, répétez, sans cesse, jour après jour, minute par minute.

S'agit-il d'une affirmation nerveuse qui tombe sur le ciel ou a-t-elle un mérite valable ?

Dans la chronique d'aujourd'hui, j'aborderai ces inquiétudes exprimées que nous sommes confrontés à un avenir d'un Internet complètement obstrué et submergé par le contenu génératif de l'IA. Nous examinerons la base de ces scrupules et examinerons certains avantages potentiels qui ne sont généralement pas indiqués. Je ferai occasionnellement référence à ChatGPT au cours de cette discussion car il s'agit du gorille de 600 livres de l'IA générative, mais gardez à l'esprit qu'il existe de nombreuses autres applications d'IA générative et qu'elles sont généralement basées sur les mêmes principes généraux.

En attendant, vous vous demandez peut-être ce qu'est en fait l'IA générative.

Couvrons d'abord les principes fondamentaux de l'IA générative, puis nous pourrons examiner de près le problème urgent qui nous occupe.

Dans tout cela vient une multitude de considérations sur l'éthique de l'IA et la loi sur l'IA.

Veuillez noter que des efforts sont en cours pour intégrer les principes éthiques de l'IA dans le développement et la mise en service des applications d'IA. Un contingent croissant d'éthiciens de l'IA concernés et d'autrefois essaient de s'assurer que les efforts pour concevoir et adopter l'IA tiennent compte d'une vision de l'action AI pour de bon et éviter AI pour le mal. De même, de nouvelles lois sur l'IA sont proposées et présentées comme des solutions potentielles pour empêcher les efforts de l'IA de se déchaîner en matière de droits de l'homme, etc. Pour ma couverture continue et étendue de l'éthique de l'IA et du droit de l'IA, voir le lien ici ainsi que le lien ici, Juste pour en nommer quelques-uns.

Le développement et la promulgation de préceptes éthiques de l'IA se poursuivent pour, espérons-le, empêcher la société de tomber dans une myriade de pièges induisant l'IA. Pour ma couverture des principes d'éthique de l'ONU AI tels qu'ils ont été conçus et soutenus par près de 200 pays grâce aux efforts de l'UNESCO, voir le lien ici. Dans le même ordre d'idées, de nouvelles lois sur l'IA sont à l'étude pour tenter de maintenir l'IA sur un pied d'égalité. L'une des dernières prises consiste en un ensemble de propositions Charte des droits de l'IA que la Maison Blanche des États-Unis a récemment publié pour identifier les droits de l'homme à l'ère de l'IA, voir le lien ici. Il faut un village pour maintenir l'IA et les développeurs d'IA sur la bonne voie et dissuader les efforts sournois délibérés ou accidentels qui pourraient saper la société.

J'entremêlerai les considérations liées à l'éthique de l'IA et à la loi sur l'IA dans cette discussion.

Principes fondamentaux de l'IA générative

L'instance d'IA générative la plus connue est représentée par une application d'IA nommée ChatGPT. ChatGPT est apparu dans la conscience publique en novembre lorsqu'il a été publié par la société de recherche en IA OpenAI. Depuis lors, ChatGPT a fait la une des journaux démesurés et a étonnamment dépassé ses quinze minutes de gloire allouées.

Je suppose que vous avez probablement entendu parler de ChatGPT ou que vous connaissez peut-être même quelqu'un qui l'a utilisé.

ChatGPT est considéré comme une application d'IA générative car il prend en entrée du texte d'un utilisateur, puis génère ou produit une sortie qui consiste en un essai. L'IA est un générateur de texte à texte, bien que je décrive l'IA comme étant un générateur de texte à essai, car cela clarifie plus facilement à quoi il est couramment utilisé. Vous pouvez utiliser l'IA générative pour composer de longues compositions ou vous pouvez lui faire proposer des commentaires concis plutôt courts. Tout dépend de vous.

Tout ce que vous avez à faire est de saisir une invite et l'application AI générera pour vous un essai qui tentera de répondre à votre invite. Le texte composé donnera l'impression que l'essai a été écrit par la main et l'esprit humains. Si vous deviez entrer une invite qui disait "Parlez-moi d'Abraham Lincoln", l'IA générative vous fournira un essai sur Lincoln. Il existe d'autres modes d'IA générative, tels que le texte vers l'art et le texte vers la vidéo. Je vais me concentrer ici sur la variation de texte à texte.

Votre première pensée pourrait être que cette capacité générative ne semble pas si importante en termes de production d'essais. Vous pouvez facilement faire une recherche en ligne sur Internet et trouver facilement des tonnes et des tonnes d'essais sur le président Lincoln. L'avantage dans le cas de l'IA générative est que l'essai généré est relativement unique et fournit une composition originale plutôt qu'un imitateur. Si vous deviez essayer de trouver l'essai produit par l'IA quelque part en ligne, il est peu probable que vous le découvriez.

L'IA générative est pré-formée et utilise une formulation mathématique et informatique complexe qui a été mise en place en examinant des modèles dans des mots écrits et des histoires sur le Web. Après avoir examiné des milliers et des millions de passages écrits, l'IA peut produire de nouveaux essais et histoires qui sont un méli-mélo de ce qui a été trouvé. En ajoutant diverses fonctionnalités probabilistes, le texte résultant est à peu près unique par rapport à ce qui a été utilisé dans l'ensemble d'apprentissage.

L'IA générative suscite de nombreuses inquiétudes.

Un inconvénient crucial est que les essais produits par une application d'IA basée sur la génération peuvent contenir divers mensonges, y compris des faits manifestement faux, des faits dépeints de manière trompeuse et des faits apparents entièrement fabriqués. Ces aspects fabriqués sont souvent appelés une forme de Hallucinations de l'IA, un slogan que je désapprouve mais qui semble malheureusement gagner du terrain de toute façon (pour mon explication détaillée sur la raison pour laquelle cette terminologie est moche et inappropriée, voir ma couverture sur le lien ici).

Une autre préoccupation est que les humains peuvent facilement s'attribuer le mérite d'un essai génératif produit par l'IA, même s'ils n'ont pas composé l'essai eux-mêmes. Vous avez peut-être entendu dire que les enseignants et les écoles sont très préoccupés par l'émergence d'applications d'IA génératives. Les étudiants peuvent potentiellement utiliser l'IA générative pour rédiger les essais qui leur sont assignés. Si un élève prétend qu'un essai a été écrit de sa propre main, il y a peu de chances que l'enseignant soit en mesure de discerner s'il a plutôt été forgé par l'IA générative. Pour mon analyse de cette facette confusionnelle entre étudiant et enseignant, voir ma couverture sur le lien ici ainsi que le lien ici.

Il y a eu des affirmations loufoques démesurées sur les réseaux sociaux à propos de IA générative affirmant que cette dernière version de l'IA est en fait IA sensible (non, ils se trompent !). Les spécialistes de l'éthique de l'IA et du droit de l'IA s'inquiètent notamment de cette tendance naissante de revendications étendues. Vous pourriez dire poliment que certaines personnes exagèrent ce que l'IA d'aujourd'hui peut réellement faire. Ils supposent que l'IA a des capacités que nous n'avons pas encore pu atteindre. C'est malheureux. Pire encore, ils peuvent se permettre à eux-mêmes et aux autres de se retrouver dans des situations désastreuses en supposant que l'IA sera sensible ou humaine pour pouvoir agir.

Ne pas anthropomorphiser l'IA.

Cela vous fera prendre dans un piège de confiance collant et austère consistant à attendre de l'IA qu'elle fasse des choses qu'elle est incapable d'accomplir. Cela étant dit, la dernière IA générative est relativement impressionnante pour ce qu'elle peut faire. Sachez cependant qu'il existe des limitations importantes que vous devez constamment garder à l'esprit lorsque vous utilisez une application d'IA générative.

Un dernier avertissement pour le moment.

Tout ce que vous voyez ou lisez dans une réponse d'IA générative qui semble être transmis comme purement factuel (dates, lieux, personnes, etc.), assurez-vous de rester sceptique et d'être prêt à revérifier ce que vous voyez.

Oui, les dates peuvent être concoctées, les lieux peuvent être inventés, et les éléments que l'on s'attend généralement à être irréprochables sont TOUTE sujet à suspicion. Ne croyez pas ce que vous lisez et gardez un œil sceptique lorsque vous examinez des essais ou des résultats d'IA générative. Si une application d'IA générative vous dit qu'Abraham Lincoln a survolé le pays dans son jet privé, vous sauriez sans aucun doute que c'est malarky. Malheureusement, certaines personnes pourraient ne pas se rendre compte que les jets n'existaient pas à son époque, ou elles pourraient le savoir mais ne pas remarquer que l'essai fait cette affirmation effrontée et scandaleusement fausse.

Une forte dose de scepticisme sain et un état d'esprit persistant d'incrédulité seront votre meilleur atout lors de l'utilisation de l'IA générative.

Nous sommes prêts à passer à la prochaine étape de cette élucidation.

Regarder ce que l'IA générative pourrait faire à Internet

Maintenant que vous avez un semblant de ce qu'est l'IA générative, nous pouvons explorer la question épineuse de savoir si ce type d'IA va provoquer le chaos et le chaos via un gonflement d'Internet.

Voici mes huit sujets essentiels pertinents à ce sujet :

  • 1) Taille d'Internet
  • 2) Indexation d'Internet
  • 3) Évaluer ce qu'est le contenu génératif produit par l'IA
  • 4) Qu'est-ce qui ne va pas avec le contenu d'IA générative de toute façon
  • 5) Les gens publieront-ils du contenu IA génératif sur Internet ?
  • 6) Peut-être que les approches Paywall seront vénérées
  • 7) L'IA générative de Morass multimodal vous attend
  • 8) Cycles vicieux ou vertueux de l'IA générative

Je couvrirai chacun de ces sujets importants et présenterai des considérations clés sur lesquelles nous devrions tous réfléchir attentivement. Chacun de ces sujets fait partie intégrante d'un puzzle plus vaste. Vous ne pouvez pas regarder un seul morceau. Vous ne pouvez pas non plus regarder une pièce isolément des autres pièces.

Il s'agit d'une mosaïque complexe et l'ensemble du puzzle doit faire l'objet d'une attention harmonieuse.

Taille d'Internet

L'un des premiers aspects à considérer est la taille d'Internet.

Ceci est particulièrement important. L'affirmation qui est faite à propos de l'IA générative est qu'elle va apparemment gonfler énormément Internet. Nous aurons toutes sortes de contenus ajoutés en raison de la facilité d'utilisation de l'IA générative pour produire d'énormes volumes de documents numériques. Si tel est le cas, la question logiquement sensée concerne la taille d'Internet aujourd'hui, ainsi que la quantité de contenu supplémentaire généré par l'IA générative qui, autrement, n'aurait pas été sur Internet.

Essayer de se faire une idée de la taille d'Internet est malheureusement assez difficile et immensément imprécis.

Une estimation publiée sur Finance en ligne suggère qu'Internet a actuellement une taille d'au moins 74 zettaoctets (ZB) et atteindra potentiellement 463 ZB d'ici 2025 (notez que la croissance prévue ne semble pas prendre explicitement en compte l'IA générative en tant que facteur en soi et suppose simplement que tous sinon est égal dans la dérivation de cette projection).

Il existe de nombreuses autres estimations de la taille actuelle d'Internet. De même, il existe de nombreuses autres estimations de la croissance attendue de la taille. Je ne veux pas m'enliser dans des arguments sur de tels chiffres et je cherche simplement à souligner qu'Internet est sans aucun doute d'une taille gigantesque. En outre, il convient de noter que toutes les attentes raisonnables sont qu'Internet, dans le cours normal des événements, poursuivra sans vergogne sa croissance fulgurante.

Vous pourriez également trouver intéressant que Statista ait publié diverses statistiques suggérant qu'il y a actuellement environ 5.16 milliards d'internautes. Ceci est calculé comme représentant 64.4% de la population mondiale. Êtes-vous surpris? D'une part, nous pourrions naturellement supposer que la plupart des gens seraient effectivement sur Internet. Ceci est cependant quelque peu biaisé du point de vue d'un initié, car de nombreuses personnes n'ont pas un accès immédiat à Internet ou sont autrement incapables d'obtenir un accès. Dans tous les cas, on s'attend à ce que l'accès à Internet devienne finalement moins cher et devienne encore plus répandu, donc le nombre d'utilisateurs d'Internet augmentera indubitablement.

Je vous entraîne à travers ces statistiques pour nous amener à une question cruciale.

Dans quelle mesure l'IA générative contribuera-t-elle à la croissance actuelle et actuelle d'Internet ?

C'est ce que nous voulons savoir. Vous voyez, l'affirmation sur les impacts de l'IA générative semble prendre pour argent comptant que bien sûr, l'IA générative va inonder Internet. Tout cela est un peu un geste de la main si vous évitez commodément ou de manière distraite de discuter des chiffres réels et du nombre réel de choses.

Prenons par exemple l'hypothèse générale selon laquelle Internet a une taille d'environ 100 ZB et est en croissance. Si vous pensez que l'IA générative va ajouter peut-être 1 ZB par an, c'est une goutte dans l'océan de l'ampleur globale d'Internet.

L'IA générative reviendrait à éclabousser un caillou dans un vaste océan.

Cela ne semble pas correspondre au récit dominant sur ce sujet important. Certains ont émis l'hypothèse passionnée que nous pourrions nous retrouver avec 10 % d'Internet sur une base « normale » générée par les utilisateurs et les 90 % restants seront dus au contenu génératif produit par l'IA.

Il ne semble pas y avoir de base solide pour cette affirmation, elle est apparemment concoctée à partir de rien. Supposons de toute façon que cela se soit produit. Si nous prenons les 100 ZB existants comme base et supposons qu'il s'agit essentiellement de contenu généré par les utilisateurs (enfin, c'est discutable), cela signifie que nous devrions nous retrouver face à un Internet de 1,000 900 ZB. Cela représente 100 Zo de contenu génératif produit par l'IA et XNUMX Zo de contenu généré par les utilisateurs.

Nous aurions pris l'océan actuel de contenu supposé fait à la main et l'aurions quelque peu éclipsé par rapport à la totalité des mers Internet génératives produites par l'IA.

Spéculation sur conjecture.

Alors, lequel sera-ce ?

Allons-nous voir l'IA générative produire un caillou ou va-t-elle multiplier par plusieurs la taille d'Internet ?

Personne ne peut dire avec certitude de toute façon. Nous devrions explorer ces chiffres clés de manière sérieuse afin que les discussions sur le sujet soient enracinées dans quelque chose de tangible. Ne pas le faire rend le bavardage un peu vide et presque comme le garçon qui a crié au loup.

Considérons le facteur suivant, et gardons à l'esprit que tous ces facteurs sont interdépendants et doivent être considérés comme un collectif et non simplement sur une base individuelle.

Indexation d'Internet

Vous réalisez probablement que lorsque vous effectuez une recherche sur Internet, vous utilisez le moteur de recherche de quelqu'un qui a tenté d'indexer régulièrement le contenu d'Internet. Je parie que vous pourriez avoir l'impression que vous accédez à la prépondérance d'Internet lorsque vous utilisez un moteur de recherche populaire.

C'est hautement improbable.

Selon certaines estimations, seule une fraction d'Internet a été indexée, peut-être moins de 1 % environ (certains disent que c'est jusqu'à 5 % ou peut-être légèrement plus élevé ; ce n'est pas au niveau que la plupart des gens supposent généralement, comme par exemple 50% ou 90%). Encore une fois, ces chiffres varient mais sont néanmoins relativement faibles. L'essentiel est que vous ignorez presque toujours une grande partie d'Internet.

Pourquoi est-ce important dans ce contexte ?

Parce que le contenu ajouté que l'IA générative produira vraisemblablement sera potentiellement soumis à une considération d'indexation similaire. Il se peut que presque aucun contenu ajouté ne soit indexé. Dans ce cas, vous ne le verrez probablement jamais.

Le revers de la médaille suppose que ces contenus "artificiels" seront indexés et rendus au regrettable manque d'attention aux contenus "conventionnels". Un argument est que les index seront préoccupés par le contenu de l'IA générative et négligeront le contenu conventionnel. Ainsi, même si le contenu génératif de l'IA ne submerge pas Internet, il semblera que cela soit dû à l'indexation disproportionnée de ce contenu.

En fin de compte, il se pourrait qu'essayer de trouver du contenu conventionnel soit comme essayer de trouver une aiguille dans une botte de foin. L'énorme fouillis du contenu génératif produit par l'IA s'apparentera à des balles de foin surdimensionnées et étirées. Quelque part là-dedans, il y aura ces précieux petits joyaux de contenu conventionnel si vous pouvez les trouver.

Vous pensez peut-être immédiatement que les créateurs d'indices devraient trouver comment faire face à ce dilemme. S'ils peuvent effectuer l'indexation de la « bonne manière », peu importe la quantité de contenu IA génératif produit. Il s'installera dans les rues latérales et les ruelles d'Internet et ne verra pas spécialement la lumière du jour de toute façon.

Continuons notre exploration pour voir comment ce problème d'indexation se pose davantage.

Évaluer ce qu'est le contenu génératif produit par l'IA

D'accord, si l'IA générative va se déchaîner et produire des tonnes et des tonnes de contenu Internet, nous pouvons logiquement y faire face tant que nous pouvons distinguer ce contenu du contenu "conventionnel".

Semble facile comme solution.

Tout moteur de recherche qui effectue une indexation détecterait simplement si le contenu est produit par une IA générative par rapport à une production conventionnelle. L'index pourrait alors choisir de ne pas inclure les matériaux d'IA générative ou de marquer dans l'index que le contenu provient de l'IA générative. Les utilisateurs d'un tel moteur de recherche pourraient alors spécifier lors d'une recherche s'ils souhaitent englober le contenu de l'IA générative ou l'ignorer.

Affaire classée.

Désolé de dire que ce n'est pas particulièrement viable.

Voici pourquoi.

Essayer de distinguer les sorties génératives de l'IA du contenu conventionnel n'est pas facile et finira presque par être irréalisable. J'ai couvert dans ma chronique que ces prétendues applications de détection sont une fausse promesse et essentiellement une mascarade trompeuse, voir le lien ici.

En bref, les fabricants d'IA de l'IA générative continuent d'améliorer leur IA pour produire un contenu qui, de par sa conception, ne se distingue pas du contenu conventionnel généré par l'homme. C'est un objectif intentionnel. Les applications de détection sont confrontées à un jeu continuel du chat et de la souris. De plus, ces applications de détection sont basées sur toutes sortes d'hypothèses sur ce qui distingue les sorties d'IA génératives, bien que ces hypothèses soient souvent incorrectes ou uniquement basées sur des probabilités. Le résultat final est que toute application de détection ne fait que deviner la probabilité et n'est pas en mesure de faire une indication à toute épreuve.

En fin de compte, il est peu probable que nous soyons en mesure de déterminer ce qu'est un contenu d'IA générative à moins qu'il n'y ait une indication claire fournie par le fournisseur d'IA générative, bien que ce ne soit pas à toute épreuve non plus. Encore une fois, voyez ma couverture de ce sujet complexe, discuté à le lien ici. L'idée poursuivie est qu'un filigrane serait secrètement inclus dans le contenu généré. Vous pourriez en théorie utiliser le filigrane pour déterminer si le contenu était via l'IA générative. L'inconvénient est qu'avec divers changements apportés à la sortie, il sera relativement facile de gâcher le filigrane. Le contenu ne respectera alors pas le filigrane et le panneau qui était censé nous donner un pourboire est maintenant vaincu.

Certains pensent que nous avons besoin de nouvelles lois sur l'IA pour faire face à cela. Adoptez des lois qui obligent les applications d'IA génératives à inclure des filigranes. De plus, rendez illégal d'essayer de vaincre ces filigranes. C'est peut-être le seul moyen de réduire ces jeux de technologie du chat et de la souris. J'ai examiné ces propositions dans ma chronique et j'ai souligné que même si les préceptes semblent raisonnables, le diable est dans les détails de la mise en œuvre de ces régimes et de l'application de ces politiques.

Dans l'ensemble, pour revenir aux inquiétudes concernant le gonflement d'Internet via le contenu d'IA génératif, nous ne pourrons malheureusement pas résoudre le problème en notant simplement ce qui est du contenu d'IA génératif par rapport à ce qui ne l'est pas. Le problème est plus difficile que cela.

Qu'est-ce qui ne va pas avec le contenu d'IA générative de toute façon

Toute cette inquiétude concernant le tsunami de contenu généré par l'IA repose généralement sur une hypothèse plutôt essentielle, à savoir que le contenu sera défectueux.

Si le contenu est bon, nous devrions probablement être satisfaits des publications ajoutées sur Internet. Bien sûr, le volume peut être élevé, mais si les informations publiées en valent la peine, il s'agit simplement d'avoir plus de bonnes choses à parcourir. Plus on est de fous, mieux c'est, comme on dit.

La considération clé consiste à savoir si le contenu génératif produit par l'IA sera informatif ou peut-être rempli d'erreurs, de mensonges, de désinformation, de désinformation, etc. Cela fait apparaître plusieurs facettes.

Premièrement, il se pourrait que l'IA générative soit encore plus avancée, de sorte que les chances de produire des essais mal rédigés soient extrêmement faibles. Nous serions apparemment négligents si nous voulions d'une manière ou d'une autre interdire à toute IA générative d'être publiée sur Internet, en supposant que dans l'ensemble, les essais générés par l'IA générative sont raisonnablement corrects pour la plupart ou la prépondérance du temps. Souhaiter rejeter tous les essais publiés s'apparenterait au classique jeter le bébé avec l'eau du bain (un vieux dicton, probablement proche de la retraite).

Deuxièmement, comme je l'ai expliqué dans ma chronique sur le lien ici, il existe un intérêt croissant pour les applications complémentaires d'IA qui peuvent effectuer une double vérification des essais générés par l'IA générative. Les double-vérificateurs d'IA pourraient être utilisés avant que les gens ne publient du contenu d'IA génératif sur Internet. Même si les gens ne présélectionnent pas le contenu qu'ils souhaitent publier, les mêmes outils peuvent être utilisés sur le contenu déjà publié. En bref, une double vérification peut être effectuée quelle que soit la source du contenu, de sorte que nous devrions naturellement rester également méfiants vis-à-vis du contenu généré par l'homme.

Troisièmement, comme je l'ai mentionné dans mon point susmentionné, la croyance semble souvent être que le contenu généré par l'homme est toujours bon, tandis que le contenu génératif de l'IA est toujours mauvais. Une fausse hypothèse farfelue. Il y a beaucoup de contenu généré par l'homme qui contient toutes sortes d'erreurs, de mensonges et de bêtises inventées. Nous ne sommes pas en sécurité simplement parce qu'un humain a créé du contenu à la main.

Tout contenu, qu'il soit conçu par l'homme ou par l'IA générative, doit être soumis à un examen minutieux.

Les gens publieront-ils le contenu de l'IA générative sur Internet

Un autre facteur à considérer est de savoir si les gens vont effectivement publier du contenu d'IA génératif sur Internet, et si oui, à quelle ampleur.

Voici ce que je veux dire.

Les gens utilisent l'IA générative telle que ChatGPT à des fins très diverses. Ils peuvent utiliser l'IA générative pour stimuler les idées sur un problème auquel ils sont confrontés. Ils pourraient l'utiliser pour faire des recherches. Ils peuvent l'utiliser pour fournir un brouillon de matériel qu'ils ont l'intention de modifier, puis l'envoyer à quelqu'un par e-mail. Et ainsi de suite.

Le point crucial est qu'une grande partie de l'utilisation générative de l'IA n'a peut-être rien à voir avec quelqu'un visant à publier les essais résultants sur Internet. Il semble que nous tombions souvent dans le piège selon lequel, simplement parce que quelqu'un utilise l'IA générative, il souhaite inonder Internet des résultats produits.

Nous ne savons pas encore combien de temps les gens utiliseront l'IA générative pour leurs propres usages et opteront donc pour ne sauraient publier les résultats sur Internet.

Pour clarifier, je ne dis pas que les gens ne publieront pas les résultats de l'IA générative sur Internet. Ils le feront très certainement. Les personnes qui créent des blogs en ligne utiliseront sans aucun doute l'IA générative. De nombreuses utilisations de l'IA générative pour produire du contenu pour Internet vont certainement se produire. Etc.

Ainsi, une considération est que nous pourrions ne pas avoir autant de contenu d'IA génératif publié sur Internet qu'on pourrait le supposer autrement. Pour ces experts qui supposent que nous assistons à une apocalypse de données non-stop et débridée, nous ne savons pas si c'est ce qui va se passer. Bien sûr, même si seulement un minimum de personnes choisit de faire de telles publications, cela pourrait encore représenter une énorme quantité de contenu ajouté entassé sur Internet.

Une torsion est de savoir si les sorties génératives de l'IA seront potentiellement automatiquement publiées sur Internet.

C'est une astuce facile à réaliser. Vous pouvez simplement faire en sorte que toute sortie de votre application d'IA générative soit immédiatement publiée sur Internet. Vous pouvez même mettre cela dans une boucle. Ayez une série d'invites prédéfinies. Alimentez-les dans une application d'IA générative. L'application d'IA générative est programmée pour publier immédiatement les essais produits sur Internet.

Voilà, vous disposez d'une machine à mouvement perpétuel pour générer du contenu de données pour Internet.

Mais où vont aller les publications ?

Tous les sites Web ou autres lieux en ligne qui permettent la publication de ce type de contenu crachant des mitrailleuses seront potentiellement tenus responsables de ce qu'ils autorisent à se produire. Vraisemblablement, les gens éviteront ces sites. Ou ces sites seront marqués par les moteurs de recherche et les algorithmes d'indexation. L'aspect que le contenu d'IA génératif est publié est un aspect, tandis qu'un autre aspect tout aussi crucial est l'endroit où les publications atterriront.

Peut-être que les approches Paywall seront vénérées

Une affirmation communément exprimée est que nous finirons par nous lasser du Far West d'Internet. Les gens se tourneront vers des sources en ligne fiables. Ils éviteront délibérément d'autres zones incomplètes ou inconnues d'Internet.

Dans ce sens, on pense que les gens seront prêts à payer pour accéder à des sources fiables. Alors qu'aujourd'hui il y a encore un énorme débat sur la rentabilité du contenu payant, le flot de contenu génératif d'IA est considéré comme une aubaine pour la philosophie du paywall. Plus les choses s'aggravent en termes de recherche de contenu fiable sur Internet, plus le contenu payant devient précieux (en supposant, bien sûr, que le contenu payant est examiné de plus près).

L'ironie est en partie que le contenu derrière le paywall pourrait être constitué en grande partie de contenu génératif produit par l'IA. En supposant que la valeur ajoutée est que le fournisseur de paywall filtre le contenu, il effectue essentiellement la double vérification que j'ai mentionnée précédemment. Ils ne doivent pas nécessairement générer le contenu. Ils doivent juste s'assurer que le contenu est digne de confiance.

Il y a des désaccords sur cet avenir prédit. Peut-être, au lieu de paywalls, vous devez rencontrer des publicités ou des notifications de sponsors, et cela vous amène au contenu de confiance. De nombreuses autres possibilités existent.

Le marais multimodal de l'IA générative vous attend

Je me suis concentré ici sur l'IA générative liée au texte. C'est la variété texte à texte ou texte à essai de l'IA générative, telle que ChatGPT.

L'une de mes prédictions était que nous nous retrouverions bientôt submergés par l'IA générative multimodale, voir mon explication sur le lien ici. Nous assistons déjà à des conversions de texte en images, de texte en audio, de texte en vidéo et d'autres variantes des types ou modes de résultats produits par l'IA générative. La prochaine étape est que vous pourrez obtenir des sorties multimodales.

Par exemple, vous entrez une invite dans l'IA générative et posez des questions sur Abraham Lincoln. L'IA générative produit un essai pour vous. De plus, plusieurs images sont générées de Lincoln, le montrant dans des poses qui jusqu'alors n'avaient pas été affichées ou publiées. Une transcription audio est générée qui a ce qui semble être une voix de type Lincoln. Une vidéo est générée qui présente l'essai, y compris un montage d'images et d'images qui accompagnent le texte produit.

Bienvenue dans le monde de l'IA générative multimodale.

Excitant, assurément.

Mais ce n'est peut-être pas si excitant si vous pensez que c'est encore plus intéressant en tant que contenu pouvant être publié sur Internet.

Essentiellement, nous ne nous soucierons pas uniquement du texte qui pourrait être erroné, nous devrons également faire de même pour tous les autres modes de sortie. Les fichiers audio doivent être suspectés de contenir des faussetés, les images peuvent représenter des choses à tort et les vidéos vont également être inquiétantes.

Si vous n'aviez pas déjà inclus dans vos calculs sur le gonflement d'Internet la conflagration multimodale, vous auriez peut-être envie d'augmenter vos chiffres et vos vrombissements.

Cercles vicieux ou vertueux de l'IA générative

J'ai un facteur pour vous qui pourrait causer un peu d'hallucination. Attendez.

Dans cette saga de l'Internet inondé, nous supposons que l'IA générative est le méchant. L'IA générative est la façon dont tout ce contenu sujet aux erreurs et inventé va être produit. L'IA générative est mauvaise jusqu'à la moelle.

Supposons cependant que nous regardions cela sous un jour différent.

Il se pourrait que l'IA générative soit capable de produire le contenu valide le plus strident et le plus fort. Pendant ce temps, le contenu généré par la main humaine est considéré comme beaucoup moins fiable. L'IA générative en tant que méchant passe à l'IA générative en tant que héros.

Pensez-y.

J'ai une autre tournure amusante pour vous.

Supposons que l'IA générative est formée aux données via un contenu qui se trouve sur Internet. Si nous supposons également que le contenu de l'IA générative va être publié sur Internet, soit directement par choix humain, soit via un mécanisme automatique, nous allons nous retrouver pris dans un cycle intrigant.

Le contenu produit par l'IA générative devient le matériau source pour une formation ultérieure sur les données en IA générative. Une spirale se produit. De plus en plus de contenu produit par l'IA générative est publié sur Internet, qui était basé sur la formation de données du contenu déjà produit par l'IA générative.

Qu'est-ce que cette chambre d'écho de "l'IA générative alimentant l'IA générative" fait finalement à Internet et à l'humanité tout compte fait ?

Un point de vue est qu'il s'agit d'une horrible course vers le bas. Les erreurs dans les sorties AI génératives seront amplifiées. Chaque nouvelle itération de l'IA générative consommera les erreurs précédentes et les répétera encore et encore. À un moment donné, les chances de déterminer où se trouvent les erreurs seront décourageantes. Lugubre. Découragé.

Un autre point de vue est que si l'IA générative peut être conçue pour produire des sorties valides, vous pourriez avoir un mécanisme de nettoyage Internet qui aide à embellir Internet. Lorsque l'IA générative rencontre quelque chose d'erroné, qu'il soit produit par l'IA ou par la main humaine, l'IA générative détectera et surmontera apparemment cette fausseté. Avec l'IA générative faisant cela encore et encore, c'est comme si vous tondiez constamment la pelouse et réduisiez efficacement la nature et la proéminence des mauvaises herbes.

Cela peut sembler rassurant, à l'exception de la grande et imminente question de savoir ce qui constitue précisément des erreurs ou des mensonges. Cette machine à laver pourrait, par inadvertance, déprécier un contenu valide ou l'accuser à tort d'être sujet aux erreurs. Nous devons être conscients de ces faux positifs et faux négatifs lorsque nous envisageons ces types de mécanismes.

L'IA générative sera-t-elle un cercle vicieux ou un cercle vertueux ?

Le temps nous dira.

Conclusion

Les exhortations nombreuses et parfois paniquées sur l'IA générative inondant Internet doivent être soigneusement examinées. De nombreux scénarios peuvent facilement être envisagés. Doom and morosité n'est pas la seule avenue. Quiconque prétend prédire ce qui va se passer devrait être franc sur les hypothèses qu'il fait.

Il existe des facteurs atténuants qui détermineront où ira l'avenir de l'IA générative. L'éthique de l'IA et le droit de l'IA auront une part décisive à cela, ainsi que les perceptions générales de la société dans son ensemble.

Une dernière remarque pour le moment.

Marcus Aurelius a déclaré: «Ne laissez jamais l'avenir vous déranger. Vous l'affronterez, s'il le faut, avec les mêmes armes de la raison qui vous arment aujourd'hui contre le présent.

Assurons-nous que notre raisonnement d'aujourd'hui peut relever les défis d'un avenir chargé d'intelligence artificielle.

Source : https://www.forbes.com/sites/lanceeliot/2023/02/23/is-it-true-that-generative-ai-chatgpt-will-flood-the-internet-with-infinite-content- demande-ai-éthique-et-ai-loi/