L'IA générative ChatGPT peut engloutir de manière dérangeante vos données privées et confidentielles, prévient l'éthique de l'IA et la loi sur l'IA

Maintenant vous voyez vos données, maintenant vous ne les voyez plus.

Pendant ce temps, vos précieuses données font désormais partie du collectif, pour ainsi dire.

Je fais référence à un aspect qui pourrait surprendre ceux d'entre vous qui utilisent avec empressement et sérieux les dernières avancées en matière d'intelligence artificielle (IA). Les données que vous entrez dans une application d'IA ne sont potentiellement pas du tout entièrement privées pour vous et vous seul. Il se peut que vos données soient utilisées par le fabricant d'IA pour chercher vraisemblablement à améliorer ses services d'IA ou qu'elles soient utilisées par lui et/ou même ses partenaires alliés à diverses fins.

Vous êtes maintenant prévenu.

Cette transmission de vos données se produit de la manière la plus anodine et par potentiellement des milliers ou de l'ordre de millions de personnes. Comment? Il existe un type d'IA connu sous le nom d'IA générative qui a récemment fait la une des journaux et attiré l'attention du grand public. La plus remarquable des applications d'IA génératives existantes est celle appelée ChatGPT qui est conçue par la société OpenAI.

Il y aurait environ un million d'utilisateurs enregistrés pour ChatGPT. Beaucoup de ces utilisateurs semblent ravis d'essayer cette application d'IA générative la plus chaude et la plus récente. Le processus est extraordinairement simple. Vous entrez du texte comme invite, et le tour est joué, l'application ChatGPT génère une sortie texte qui se présente généralement sous la forme d'un essai. Certains parlent de texte à texte, bien que je préfère l'appeler texte à essai puisque ce verbiage a plus de sens au quotidien.

Au début, un utilisateur débutant saisira probablement quelque chose d'amusant et d'insouciant. Parlez-moi de la vie et de l'époque de George Washington, quelqu'un pourrait entrer comme une invite. ChatGPT produirait alors un essai sur notre légendaire premier président. L'essai serait entièrement fluide et vous auriez du mal à discerner qu'il a été produit par une application d'IA. Une chose excitante à voir arriver.

Il y a de fortes chances qu'après avoir joué pendant un certain temps, un segment d'utilisateurs débutants aura été rassasié et choisira potentiellement d'arrêter de jouer avec ChatGPT. Ils ont maintenant surmonté leur FOMO (peur de manquer quelque chose), le faisant après avoir expérimenté l'application AI dont presque tout le monde semble parler. Acte accompli.

Certains commenceront cependant à réfléchir à d'autres moyens plus sérieux d'utiliser l'IA générative.

Utilisez peut-être ChatGPT pour écrire ce mémo que votre patron vous a harangué d'écrire. Tout ce que vous avez à faire est de fournir une invite avec les puces que vous avez en tête, et la prochaine chose que vous savez, un mémo entier a été généré par ChatGPT qui rendrait votre patron fier de vous. Vous copiez l'essai généré à partir de ChatGPT, le collez dans le modèle officiel de l'entreprise dans votre package de traitement de texte et envoyez le mémorandum élégant à votre responsable. Vous valez un million de dollars. Et vous avez utilisé votre cerveau pour trouver un outil pratique pour faire le travail difficile à votre place. Tapotez-vous dans le dos.

Ce n'est pas tout.

Oui, il y a plus.

Gardez à l'esprit que l'IA générative peut effectuer une multitude d'autres tâches liées à l'écriture.

Par exemple, supposons que vous ayez écrit un récit quelconque pour un client précieux et que vous souhaitiez vivement faire réviser le matériel avant qu'il ne sorte.

Peasy facile.

Vous collez le texte de votre récit dans une invite ChatGPT, puis demandez à ChatGPT d'analyser le texte que vous avez composé. L'essai qui en résultera peut creuser profondément dans votre formulation et, à votre agréable surprise, tentera d'inspecter apparemment le sens de ce que vous avez dit (allant bien au-delà d'agir comme un correcteur orthographique ou un analyseur de grammaire). L'application AI peut détecter des défauts dans la logique de votre récit ou découvrir des contradictions dont vous n'aviez pas conscience qu'elles se trouvaient dans votre propre écriture. C'est presque comme si vous aviez embauché un éditeur humain astucieux pour regarder votre brouillon et fournir une litanie de suggestions utiles et de préoccupations notées (enfin, je tiens à déclarer catégoriquement que je n'essaie pas d'anthropomorphiser l'application AI, notamment qu'un éditeur humain est un humain alors que l'application AI n'est qu'un programme informatique).

Dieu merci, vous avez utilisé l'application d'IA générative pour examiner votre précieux récit écrit. Vous préféreriez sans aucun doute que l'IA trouve ces problèmes écrits inquiétants plutôt qu'après avoir envoyé le document à votre précieux client. Imaginez que vous ayez composé le récit pour quelqu'un qui vous a engagé pour concevoir une représentation assez vitale. Si vous aviez donné la version originale au client, avant de procéder à l'examen de l'application AI, vous pourriez être très embarrassé. Le client aurait presque certainement de sérieux doutes quant à vos compétences pour effectuer le travail demandé.

Montons les enchères.

Envisagez la création de documents juridiques. C'est évidemment une affaire particulièrement grave. Les mots et la façon dont ils sont composés peuvent épeler une défense juridique fougueuse ou une calamité juridique lamentable.

Dans le cadre de mes recherches et de mes conseils en cours, j'interagis régulièrement avec de nombreux avocats qui s'intéressent vivement à l'utilisation de l'IA dans le domaine du droit. Divers programmes LegalTech se connectent aux capacités de l'IA. Un avocat peut utiliser l'IA générative pour rédiger un brouillon de contrat ou composer d'autres documents juridiques. De plus, si l'avocat a fait lui-même une ébauche initiale, il peut transmettre le texte à une application d'IA générative telle que ChatGPT pour jeter un coup d'œil et voir quels trous ou lacunes pourraient être détectés. Pour en savoir plus sur la façon dont les avocats et le domaine juridique choisissent d'utiliser l'IA, consultez ma discussion sur le lien ici.

Nous sommes prêts cependant pour le hic à ce sujet.

Un avocat prend un contrat rédigé et copie le texte dans une invite pour ChatGPT. L'application AI produit un avis pour l'avocat. Il s'avère que plusieurs pièges sont trouvés par ChatGPT. L'avocat révise le contrat. Ils peuvent également demander à ChatGPT de suggérer une reformulation ou de refaire le texte composé pour eux. Une nouvelle et meilleure version du contrat est ensuite produite par l'application d'IA générative. L'avocat saisit le texte produit et le place dans un fichier de traitement de texte. Off la missive va à leur client. Mission accomplie.

Pouvez-vous deviner ce qui vient aussi de se passer ?

Dans les coulisses et sous le capot, le contrat aurait pu être englouti comme un poisson dans la gueule d'une baleine. Bien que cet avocat utilisant l'IA ne s'en rende peut-être pas compte, le texte du contrat, tel qu'il est placé comme une invite dans ChatGPT, pourrait potentiellement être englouti par l'application AI. C'est maintenant du fourrage pour la correspondance de modèles et d'autres complexités de calcul de l'application AI. Cela pourrait à son tour être utilisé de diverses manières. S'il y a des données confidentielles dans le brouillon, cela aussi est potentiellement maintenant dans les limites de ChatGPT. Votre invite telle que fournie à l'application AI fait maintenant apparemment partie du collectif d'une manière ou d'une autre.

De plus, l'essai produit est également considéré comme faisant partie du collectif. Si vous avez demandé à ChatGPT de modifier le brouillon pour vous et de présenter la nouvelle version du contrat, cela est interprété comme un essai de sortie. Les sorties de ChatGPT sont également un type de contenu qui peut être conservé ou autrement transformé par l'application AI.

Aïe, vous avez peut-être innocemment divulgué des informations privées ou confidentielles. Pas bon. De plus, vous ne seriez même pas au courant que vous l'aviez fait. Aucun drapeau n'a été levé. Un klaxon n'a pas sonné. Aucune lumière clignotante ne s'est éteinte pour vous choquer dans la réalité.

Nous pourrions prévoir que des non-avocats pourraient facilement faire une telle erreur, mais pour un avocat expérimenté, faire la même erreur de débutant est presque inimaginable. Néanmoins, il y a probablement des professionnels du droit qui font actuellement cette même erreur potentielle. Ils risquent de violer un élément notable du secret professionnel de l'avocat et éventuellement d'enfreindre les règles modèles de déontologie professionnelle (MRPC) de l'American Bar Association (ABA). En particulier : « Un avocat ne doit pas révéler d'informations relatives à la représentation d'un client à moins que le client n'y consente en connaissance de cause, que la divulgation ne soit implicitement autorisée afin d'effectuer la représentation ou que la divulgation ne soit autorisée par le paragraphe (b) » (cité de le MRPC, et pour lequel les exceptions associées à la sous-section b ne semblent pas englober l'utilisation d'une application d'IA générative de manière non sécurisée).

Certains avocats pourraient chercher à excuser leur transgression en affirmant qu'ils ne sont pas des sorciers de la technologie et qu'ils n'auraient eu aucun moyen de savoir que leur saisie d'informations confidentielles dans une application d'IA générative pourrait en quelque sorte être une sorte de violation. L'ABA a clairement indiqué qu'un devoir pour les avocats comprend d'être à jour sur l'IA et la technologie d'un point de vue juridique : « Pour maintenir les connaissances et les compétences requises, un avocat doit se tenir au courant des changements dans la loi et sa pratique, les avantages et les risques associés à la technologie pertinente, s'engager dans des études et une formation continues et se conformer à toutes les exigences de formation juridique continue auxquelles l'avocat est soumis » (par MRPC).

Plusieurs dispositions entrent dans cet semblant d'obligation légale, y compris le maintien des informations confidentielles du client (règle 1.6), la protection des biens du client tels que les données (règle 1.15), la communication appropriée avec un client (règle 1.4), l'obtention du consentement éclairé du client (règle 1.6), et assurer une représentation compétente au nom d'un client (Règle 1.1). Et il y a aussi la résolution peu connue mais très notable sur l'IA adoptée par l'ABA : "Que l'American Bar Association exhorte les tribunaux et les avocats à résoudre les problèmes éthiques et juridiques émergents liés à l'utilisation de l'intelligence artificielle ('IA') dans la pratique du droit, y compris : (1) la partialité, l'explicabilité et la transparence des décisions automatisées prises par l'IA ; (2) l'utilisation éthique et bénéfique de l'IA ; et (3) contrôles et surveillance de l'IA et des fournisseurs qui fournissent l'IA. »

Paroles aux sages pour mes amis et collègues juridiques.

Le nœud du problème est que presque tout le monde peut se mettre dans le pétrin en utilisant l'IA générative. Les non-avocats peuvent le faire par leur manque présumé de perspicacité juridique. Les avocats peuvent le faire aussi, peut-être amoureux de l'IA ou ne respirant pas profondément et réfléchissant aux répercussions juridiques qui peuvent survenir lors de l'utilisation de l'IA générative.

Nous sommes tous potentiellement dans le même bateau.

Vous devez également réaliser que ChatGPT n'est pas la seule application d'IA générative sur le bloc. Il existe d'autres applications d'IA génératives que vous pouvez utiliser. Eux aussi sont probablement coupés du même tissu, à savoir que les entrées que vous entrez en tant qu'invites et les sorties que vous recevez en tant qu'essais générés sont considérées comme faisant partie du collectif et peuvent être utilisées par le fabricant d'IA.

Dans la chronique d'aujourd'hui, je vais déballer la nature de la façon dont les données que vous saisissez et les données que vous recevez de l'IA générative peuvent être potentiellement compromises en ce qui concerne la vie privée et la confidentialité. Les fabricants d'IA mettent à disposition leurs exigences en matière de licence et il serait sage de lire ces stipulations vitales avant de commencer à utiliser activement une application d'IA avec un semblant de données réelles. Je vais vous présenter un exemple d'une telle licence, en le faisant pour l'application ChatGPT AI.

Dans tout cela vient une multitude de considérations sur l'éthique de l'IA et la loi sur l'IA.

Veuillez noter que des efforts sont en cours pour intégrer les principes éthiques de l'IA dans le développement et la mise en service des applications d'IA. Un contingent croissant d'éthiciens de l'IA concernés et d'autrefois essaient de s'assurer que les efforts pour concevoir et adopter l'IA tiennent compte d'une vision de l'action AI pour de bon et éviter AI pour le mal. De même, de nouvelles lois sur l'IA sont proposées et présentées comme des solutions potentielles pour empêcher les efforts de l'IA de se déchaîner en matière de droits de l'homme, etc. Pour ma couverture continue et étendue de l'éthique de l'IA et du droit de l'IA, voir le lien ici ainsi que le lien ici, Juste pour en nommer quelques-uns.

Il existe d'importantes nuances et dispositions éthiques en matière d'IA associées à la manière dont les fabricants d'IA peuvent ou doivent traiter les données ou informations qui semblent privées ou confidentielles pour leurs utilisateurs. Vous savez probablement aussi qu'un tas de lois existantes frappent au cœur de la façon dont les données sont censées être traitées par les entités technologiques. Il est également probable que les nouvelles lois proposées sur l'IA s'entrecroiseront également sur ce même territoire. Voir par exemple ma couverture de la Charte des droits de l'IA et d'autres querelles juridiques en cours à propos de l'IA, à le lien ici.

Voici la clé à retenir de cette discussion tout compte fait :

  • Soyez très, très, très prudent quant aux données ou informations que vous choisissez de mettre dans vos invites lorsque vous utilisez l'IA générative, et de même soyez extrêmement prudent et anticipez les types d'essais que vous pourriez obtenir, car les résultats peuvent également être absorbés.

Cela implique-t-il que vous ne devriez pas utiliser l'IA générative ?

Non, ce n'est pas du tout ce que je dis.

Utilisez l'IA générative à votre guise. L'essentiel est que vous devez être conscient de la façon dont vous l'utilisez. Découvrez quel type de stipulations de licence sont associées à l'utilisation. Décidez si vous pouvez vivre avec ces stipulations. S'il existe des moyens d'informer le fabricant d'IA que vous souhaitez invoquer certains types de protections ou d'allocations supplémentaires, assurez-vous de le faire.

Je mentionnerai également une autre facette qui, je le sais, rendra certaines personnes folles. Voici. Quelles que soient les conditions de licence, vous devez également supposer qu'il est possible que ces exigences ne soient pas pleinement respectées. Les choses peuvent mal tourner. Les choses peuvent glisser entre les fissures. En fin de compte, bien sûr, vous pourriez avoir une action en justice contre un fabricant d'IA pour non-conformité à ses stipulations, mais c'est un peu après que le cheval soit déjà sorti de l'écurie.

Une façon potentiellement hautement sécurisée de procéder serait de configurer votre propre instance sur vos propres systèmes, que ce soit dans le cloud ou en interne (et, en supposant que vous respectiez les précautions de cybersécurité appropriées, ce que certains ne font certes pas et ils sont pires dans leur propre cloud plutôt que d'utiliser le cloud du fournisseur de logiciels). Un problème un peu lancinant est cependant que peu d'applications à grande échelle d'IA générative le permettent actuellement. Ils fonctionnent tous à peu près sur la base de notre cloud uniquement. Rares sont ceux qui ont mis à disposition l'option d'avoir une instance entière taillée juste pour vous. J'ai prédit que nous verrons progressivement cette option se présenter, bien qu'au début ce sera plutôt coûteux et un peu compliqué, voir mes prédictions sur le lien ici.

Comment des personnes autrement particulièrement brillantes et particulièrement astucieuses se retrouvent-elles dans un bourbier d'érosion de la confidentialité des données ou des informations ?

L'attrait de ces applications d'IA génératives est assez magnétique une fois que vous commencez à en utiliser une. Pas à pas, vous vous retrouvez hypnotisé et choisissez de mettre vos orteils de plus en plus loin dans les eaux génératives de l'IA. La prochaine chose que vous savez, c'est que vous transférez facilement du contenu propriétaire qui est censé rester privé et confidentiel dans une application d'IA générative.

Résistez à l'envie et veuillez vous abstenir de tomber progressivement dans un piège peu recommandable.

Pour les chefs d'entreprise et les cadres supérieurs, le même avertissement s'adresse à vous et à toutes les personnes de votre entreprise. Les cadres supérieurs sont également pris dans l'enthousiasme et l'étonnement de l'utilisation de l'IA générative. Ils peuvent vraiment gâcher et potentiellement entrer des informations secrètes de haut niveau dans une application d'IA.

En plus de cela, ils pourraient avoir de larges ligues d'employés jouant également avec l'IA générative. Beaucoup de ces employés autrement attentifs saisissent sans réfléchir et avec bonheur les informations privées et confidentielles de l'entreprise dans ces applications d'IA. Selon des informations récentes, Amazon a apparemment découvert que certains employés saisissaient diverses informations exclusives dans ChatGPT. Un avertissement à caractère juridique aurait été envoyé en interne pour être prudent dans l'utilisation de l'irrésistible application AI.

Dans l'ensemble, un peu d'ironie entre dans le phénomène croissant des employés qui saisissent bon gré mal gré des données confidentielles dans ChatGPT et d'autres IA génératives. Permettez-moi d'élaborer. Les entreprises modernes d'aujourd'hui ont généralement des politiques de cybersécurité strictes qu'elles ont minutieusement élaborées et mises en œuvre. De nombreuses protections technologiques existent. L'espoir est d'empêcher les rejets accidentels de choses cruciales. Un battement de tambour continu consiste à être prudent lorsque vous visitez des sites Web, soyez prudent lorsque vous utilisez des applications non approuvées, etc.

Viennent ensuite des applications d'IA génératives telles que ChatGPT. Les nouvelles concernant l'application AI explosent et attirent une large attention. Une frénésie s'installe. Les employés de ces entreprises qui disposent de toutes ces protections de cybersécurité choisissent de sauter sur une application d'IA générative. Ils jouent avec paresseusement avec lui au début. Ils commencent alors à saisir les données de l'entreprise. Wham, ils ont maintenant potentiellement exposé des informations qui n'auraient pas dû être divulguées.

Le nouveau jouet brillant qui contourne comme par magie les millions de dollars de dépenses en protections de cybersécurité et en formation continue sur ce qu'il ne faut pas faire. Mais, hé, c'est excitant d'utiliser l'IA générative et de faire partie de la foule "in". C'est ce qui compte, apparemment.

J'espère que vous comprenez ma dérive d'être très prudent.

Examinons ensuite de plus près comment l'IA générative traite techniquement le texte des invites et des essais produits. Nous explorerons également certaines des stipulations de licence, en utilisant ChatGPT comme exemple. Sachez que je ne vais pas couvrir toute la gamme de ces éléments de licence. Assurez-vous d'impliquer votre conseiller juridique pour les applications d'IA génératives que vous pourriez décider d'utiliser. De plus, la licence diffère d'un fabricant d'IA à l'autre, et un fabricant d'IA donné peut choisir de modifier sa licence, alors assurez-vous de rester vigilant sur ce que stipule la dernière version de la licence.

Nous avons un déballage passionnant à faire sur ce sujet captivant.

Tout d'abord, nous devons nous assurer que nous sommes tous sur la même longueur d'onde sur ce en quoi consiste l'IA générative et sur ce qu'est ChatGPT. Une fois que nous avons couvert cette facette fondamentale, nous pouvons effectuer une évaluation convaincante de la métaphore du miroir associée à ce type d'IA.

Si vous connaissez déjà très bien l'IA générative et ChatGPT, vous pouvez peut-être parcourir la section suivante et passer à la section qui la suit. Je crois que tout le monde trouvera instructifs les détails vitaux sur ces questions en lisant attentivement la section et en se mettant au courant.

Une introduction rapide à propos de l'IA générative et de ChatGPT

ChatGPT est un système interactif orienté conversation d'IA à usage général, essentiellement un chatbot général apparemment inoffensif, néanmoins, il est activement et avidement utilisé par les gens d'une manière qui en prend beaucoup au dépourvu, comme je le développerai sous peu. Cette application d'IA exploite une technique et une technologie dans le domaine de l'IA souvent appelées IA générative. L'IA génère des sorties telles que du texte, ce que fait ChatGPT. D'autres applications d'IA basées sur la génération produisent des images telles que des images ou des illustrations, tandis que d'autres génèrent des fichiers audio ou des vidéos.

Je vais me concentrer sur les applications d'IA génératives basées sur le texte dans cette discussion puisque c'est ce que fait ChatGPT.

Les applications IA génératives sont extrêmement faciles à utiliser.

Tout ce que vous avez à faire est de saisir une invite et l'application AI générera pour vous un essai qui tentera de répondre à votre invite. Le texte composé donnera l'impression que l'essai a été écrit par la main et l'esprit humains. Si vous deviez entrer une invite qui disait "Parlez-moi d'Abraham Lincoln", l'IA générative vous fournira un essai sur Lincoln. Ceci est communément classé comme une IA générative qui effectue texte en texte ou certains préfèrent l'appeler texte à essai sortir. Comme mentionné, il existe d'autres modes d'IA générative, tels que le texte vers l'art et le texte vers la vidéo.

Votre première pensée pourrait être que cette capacité générative ne semble pas si importante en termes de production d'essais. Vous pouvez facilement faire une recherche en ligne sur Internet et trouver facilement des tonnes et des tonnes d'essais sur le président Lincoln. L'avantage dans le cas de l'IA générative est que l'essai généré est relativement unique et fournit une composition originale plutôt qu'un imitateur. Si vous deviez essayer de trouver l'essai produit par l'IA quelque part en ligne, il est peu probable que vous le découvriez.

L'IA générative est pré-formée et utilise une formulation mathématique et informatique complexe qui a été mise en place en examinant des modèles dans des mots écrits et des histoires sur le Web. Après avoir examiné des milliers et des millions de passages écrits, l'IA peut produire de nouveaux essais et histoires qui sont un méli-mélo de ce qui a été trouvé. En ajoutant diverses fonctionnalités probabilistes, le texte résultant est à peu près unique par rapport à ce qui a été utilisé dans l'ensemble d'apprentissage.

C'est pourquoi il y a eu un tollé à propos de la possibilité pour les étudiants de tricher lorsqu'ils rédigent des essais en dehors de la salle de classe. Un enseignant ne peut pas simplement prendre l'essai que les étudiants trompeurs affirment être leur propre écriture et chercher à savoir s'il a été copié à partir d'une autre source en ligne. Dans l'ensemble, il n'y aura pas d'essai préexistant définitif en ligne qui corresponde à l'essai généré par l'IA. Tout compte fait, l'enseignant devra accepter à contrecœur que l'étudiant ait écrit l'essai comme un travail original.

Il existe d'autres préoccupations concernant l'IA générative.

Un inconvénient crucial est que les essais produits par une application d'IA basée sur la génération peuvent contenir divers mensonges, y compris des faits manifestement faux, des faits dépeints de manière trompeuse et des faits apparents entièrement fabriqués. Ces aspects fabriqués sont souvent appelés une forme de Hallucinations de l'IA, un slogan que je désapprouve mais qui semble malheureusement gagner du terrain de toute façon (pour mon explication détaillée sur la raison pour laquelle cette terminologie est moche et inappropriée, voir ma couverture sur le lien ici).

Je voudrais clarifier un aspect important avant d'entrer dans le vif du sujet sur ce sujet.

Il y a eu des affirmations loufoques démesurées sur les réseaux sociaux à propos de IA générative affirmant que cette dernière version de l'IA est en fait IA sensible (non, ils se trompent !). Les spécialistes de l'éthique de l'IA et du droit de l'IA s'inquiètent notamment de cette tendance naissante de revendications étendues. Vous pourriez dire poliment que certaines personnes exagèrent ce que l'IA d'aujourd'hui peut réellement faire. Ils supposent que l'IA a des capacités que nous n'avons pas encore pu atteindre. C'est malheureux. Pire encore, ils peuvent se permettre à eux-mêmes et aux autres de se retrouver dans des situations désastreuses en supposant que l'IA sera sensible ou humaine pour pouvoir agir.

Ne pas anthropomorphiser l'IA.

Cela vous fera prendre dans un piège de confiance collant et austère consistant à attendre de l'IA qu'elle fasse des choses qu'elle est incapable d'accomplir. Cela étant dit, la dernière IA générative est relativement impressionnante pour ce qu'elle peut faire. Sachez cependant qu'il existe des limitations importantes que vous devez constamment garder à l'esprit lorsque vous utilisez une application d'IA générative.

Si vous êtes intéressé par l'agitation en pleine expansion autour de ChatGPT et de l'IA générative, j'ai fait une série ciblée dans ma colonne que vous pourriez trouver informative. Voici un aperçu au cas où l'un de ces sujets vous intéresserait :

  • 1) Prédictions des progrès de l'IA générative à venir. Si vous voulez savoir ce qui est susceptible de se dérouler à propos de l'IA tout au long de 2023 et au-delà, y compris les progrès à venir dans l'IA générative et ChatGPT, vous voudrez lire ma liste complète des prédictions 2023 sur le lien ici.
  • 2) IA générative et conseils en santé mentale. J'ai choisi d'examiner comment l'IA générative et ChatGPT sont utilisés pour des conseils en santé mentale, une tendance gênante, selon mon analyse ciblée sur le lien ici.
  • 3) Fondamentaux de l'IA générative et de ChatGPT. Cette pièce explore les éléments clés du fonctionnement de l'IA générative et se penche en particulier sur l'application ChatGPT, y compris une analyse du buzz et de la fanfare, à le lien ici.
  • 4) Tension entre les enseignants et les étudiants sur l'IA générative et ChatGPT. Voici les façons dont les étudiants utiliseront sournoisement l'IA générative et ChatGPT. De plus, il existe plusieurs façons pour les enseignants de faire face à ce raz-de-marée. Voir le lien ici.
  • 5) Utilisation contextuelle et générative de l'IA. J'ai également fait un examen ironique aux saveurs saisonnières sur un contexte lié au Père Noël impliquant ChatGPT et l'IA générative à le lien ici.
  • 6) Les escrocs utilisant l'IA générative. Sur une note inquiétante, certains escrocs ont compris comment utiliser l'IA générative et ChatGPT pour commettre des actes répréhensibles, notamment en générant des e-mails frauduleux et même en produisant du code de programmation pour les logiciels malveillants, voir mon analyse sur le lien ici.
  • 7) Erreurs de débutant en utilisant l'IA générative. Beaucoup de gens dépassent et étonnamment sous-estiment ce que l'IA générative et ChatGPT peuvent faire, alors j'ai regardé en particulier le sous-dépassement que les recrues de l'IA ont tendance à faire, voir la discussion sur le lien ici.
  • 8) Faire face aux invites génératives de l'IA et aux hallucinations de l'IA. Je décris une approche de pointe pour utiliser des modules complémentaires d'IA pour traiter les divers problèmes associés à la tentative d'entrer des invites appropriées dans l'IA générative, ainsi qu'il existe d'autres modules complémentaires d'IA pour détecter les soi-disant sorties et faussetés hallucinées de l'IA, comme couvert à le lien ici.
  • 9) Démystifier les affirmations de Bonehead sur la détection d'essais génératifs produits par l'IA. Il y a une ruée vers l'or erronée d'applications d'IA qui proclament être en mesure de déterminer si un essai donné a été produit par l'homme ou généré par l'IA. Dans l'ensemble, cela est trompeur et dans certains cas, une allégation stupide et intenable, voir ma couverture à le lien ici.
  • 10) Le jeu de rôle via l'IA générative pourrait laisser présager des inconvénients pour la santé mentale. Certains utilisent l'IA générative telle que ChatGPT pour faire du jeu de rôle, dans lequel l'application d'IA répond à un humain comme si elle existait dans un monde imaginaire ou dans un autre cadre inventé. Cela pourrait avoir des répercussions sur la santé mentale, voir le lien ici.
  • 11) Exposer la gamme d'erreurs et de faussetés générées. Diverses listes collectées sont en cours de constitution pour essayer de mettre en valeur la nature des erreurs et des mensonges produits par ChatGPT. Certains pensent que c'est essentiel, tandis que d'autres disent que l'exercice est vain, voir mon analyse à le lien ici.
  • 12) Les écoles interdisant l'IA générative ChatGPT ratent le coche. Vous savez peut-être que diverses écoles telles que le ministère de l'Éducation de la ville de New York (NYC) ont interdit l'utilisation de ChatGPT sur leur réseau et les appareils associés. Bien que cela puisse sembler une précaution utile, cela ne déplacera pas l'aiguille et manquera malheureusement complètement le bateau, voir ma couverture sur le lien ici.
  • 13) Generative AI ChatGPT va être partout en raison de la prochaine API. Il y a une tournure importante à propos de l'utilisation de ChatGPT, à savoir que via l'utilisation d'un portail API dans cette application d'IA particulière, d'autres logiciels pourront invoquer et utiliser ChatGPT. Cela va considérablement étendre l'utilisation de l'IA générative et a des conséquences notables, voir mon élaboration sur le lien ici.
  • 14) Façons dont ChatGPT pourrait pétiller ou fondre. Plusieurs problèmes potentiels vexatoires attendent ChatGPT en termes de sape des éloges qu'il a reçus jusqu'à présent. Cette analyse examine de près huit problèmes possibles qui pourraient faire perdre à ChatGPT sa vapeur et même se retrouver dans la niche, voir le lien ici.

Vous pourriez trouver intéressant que ChatGPT soit basé sur une version d'une application AI prédécesseur connue sous le nom de GPT-3. ChatGPT est considéré comme une étape légèrement suivante, appelée GPT-3.5. Il est prévu que GPT-4 sera probablement publié au printemps 2023. Vraisemblablement, GPT-4 sera un pas en avant impressionnant en termes de capacité à produire des essais apparemment encore plus fluides, à aller plus loin et à être une crainte -émerveillement inspirant quant aux compositions qu'il peut produire.

Vous pouvez vous attendre à voir une nouvelle série d'émerveillements exprimés lorsque le printemps arrive et que la dernière IA générative est publiée.

J'en parle parce qu'il y a un autre angle à garder à l'esprit, consistant en un talon d'Achille potentiel pour ces meilleures et plus grandes applications d'IA génératives. Si un fournisseur d'IA met à disposition une application d'IA générative qui crache de manière mousseuse la saleté, cela pourrait anéantir les espoirs de ces fabricants d'IA. Un débordement sociétal peut amener toute l'IA générative à avoir un sérieux œil au beurre noir. Les gens seront sans aucun doute assez contrariés par les sorties ignobles, qui se sont déjà produites à plusieurs reprises et ont conduit à des réactions violentes de condamnation de la société envers l'IA.

Un dernier avertissement pour le moment.

Tout ce que vous voyez ou lisez dans une réponse d'IA générative qui semble être transmis comme purement factuel (dates, lieux, personnes, etc.), assurez-vous de rester sceptique et d'être prêt à revérifier ce que vous voyez.

Oui, les dates peuvent être concoctées, les lieux peuvent être inventés, et les éléments que l'on s'attend généralement à être irréprochables sont TOUTE sujet à suspicion. Ne croyez pas ce que vous lisez et gardez un œil sceptique lorsque vous examinez des essais ou des résultats d'IA générative. Si une application d'IA générative vous dit qu'Abraham Lincoln a survolé le pays dans son propre jet privé, vous sauriez sans aucun doute que c'est malarky. Malheureusement, certaines personnes pourraient ne pas se rendre compte que les jets n'existaient pas à son époque, ou elles pourraient le savoir mais ne pas remarquer que l'essai fait cette affirmation effrontée et scandaleusement fausse.

Une forte dose de scepticisme sain et un état d'esprit persistant d'incrédulité seront votre meilleur atout lors de l'utilisation de l'IA générative.

Nous sommes prêts à passer à la prochaine étape de cette élucidation.

Savoir ce que le diable va arriver avec ce texte

Maintenant que nous avons établi les bases, nous pouvons nous plonger dans les considérations relatives aux données et aux informations lors de l'utilisation de l'IA générative.

Tout d'abord, examinons brièvement ce qui se passe lorsque vous saisissez du texte dans une invite pour ChatGPT. Nous ne savons pas avec certitude ce qui se passe dans ChatGPT puisque le programme est considéré comme propriétaire. Certains ont souligné que cela sape le sentiment de transparence concernant l'application AI. Une remarque quelque peu smarmy est que pour une entreprise qui s'appelle OpenAI, leur IA est en fait fermée à l'accès public et n'est pas disponible en open source.

Parlons de la tokenisation.

Lorsque vous entrez du texte brut dans une invite et que vous appuyez sur retour, il y a probablement une conversion qui se produit immédiatement. Le texte est converti dans un format composé de jetons. Les jetons sont des sous-parties de mots. Par exemple, le mot « hamburger » serait normalement divisé en trois jetons constitués de la portion « ham », « bur » et « ger ». En règle générale, les jetons ont tendance à représenter environ quatre caractères ou sont considérés comme environ 75 % d'un mot anglais conventionnel.

Chaque jeton est ensuite reformulé sous la forme d'un nombre. Diverses tables internes désignent quel jeton est attribué à quel numéro particulier. L'absorption à ce sujet est que le texte que vous avez entré est maintenant entièrement un ensemble de nombres. Ces nombres sont utilisés pour analyser informatiquement l'invite. De plus, le réseau de correspondance de modèles que j'ai mentionné plus tôt est également basé sur des valeurs tokenisées. En fin de compte, lors de la composition ou de la génération de l'essai produit, ces jetons numériques sont d'abord utilisés, puis avant d'être affichés, les jetons sont reconvertis en ensembles de lettres et de mots.

Penses-y un moment.

Quand je dis aux gens que c'est ainsi que fonctionne la mécanique du traitement, ils sont souvent stupéfaits. Ils ont supposé qu'une application d'IA générative telle que ChatGPT devait utiliser des mots entièrement intégratifs. Nous supposons logiquement que les mots agissent comme la clé de voûte pour identifier statistiquement les relations dans les récits écrits et les compositions. Il s'avère que le traitement a en fait tendance à utiliser des jetons. Cela ajoute peut-être à l'étonnement quant à la façon dont le processus de calcul semble faire un travail assez convaincant pour imiter le langage humain.

Je vous ai guidé tout au long de ce processus en raison d'une idée fausse commune qui semble se répandre. Certaines personnes semblent croire que parce que votre texte d'invite est converti en jetons numériques, vous êtes sûr que les composants internes de l'application AI n'ont plus votre texte initialement saisi. Ainsi, la réclamation va, même si vous avez entré des informations confidentielles dans votre invite, vous n'avez pas de soucis car tout a apparemment été symbolisé.

Cette notion est une erreur. Je viens de souligner que les jetons numériques peuvent être facilement ramenés au format textuel des lettres et des mots. La même chose pourrait être faite avec l'invite convertie qui a été tokenisée. Il n'y a rien de magiquement protecteur dans le fait d'avoir été symbolisé. Cela étant dit, après la conversion en jetons, s'il existe un processus supplémentaire qui choisit d'abandonner les jetons, de les déplacer et autrement de brouiller ou de hacher les choses, dans ce cas, il est en effet possible que certaines parties de l'original prompt ne sont plus intacts (et en supposant qu'une copie originale n'est pas autrement conservée ou stockée quelque part en interne).

J'aimerais maintenant jeter un coup d'œil aux différentes notifications et conditions de licence de ChatGPT.

Lorsque vous vous connectez à ChatGPT, une série d'avertissements et de commentaires informatifs s'affichent.

Les voici:

  • "Peut parfois générer des informations incorrectes."
  • "Peut produire occasionnellement des instructions nuisibles ou un contenu biaisé."
  • "Formé pour refuser les demandes inappropriées."
  • "Notre objectif est d'obtenir des commentaires externes afin d'améliorer nos systèmes et de les rendre plus sûrs."
  • «Bien que nous ayons mis en place des mesures de protection, le système peut parfois générer des informations incorrectes ou trompeuses et produire un contenu offensant ou biaisé. Il ne s'agit pas de donner des conseils. »
  • "Les conversations peuvent être examinées par nos formateurs en IA pour améliorer nos systèmes."
  • "Veuillez ne pas partager d'informations sensibles dans vos conversations."
  • « Ce système est optimisé pour le dialogue. Faites-nous savoir si une réponse particulière était bonne ou inutile.
  • "Connaissance limitée du monde et des événements après 2021."

Deux de ces mises en garde sont particulièrement pertinentes dans le cadre de cette discussion. Regardez le sixième point à puce et le septième point à puce.

Déballons ces deux :

"Les conversations peuvent être examinées par nos formateurs en IA pour améliorer nos systèmes."

Ce sixième point explique que les conversations textuelles lors de l'utilisation de ChatGPT peuvent être examinées par ChatGPT via ses "formateurs IA", ce qui est fait pour améliorer leurs systèmes. Ceci est pour vous informer que pour toutes vos invites de texte saisies et les essais correspondants, qui font tous partie de la "conversation" que vous entreprenez avec ChatGPT, cela peut être entièrement vu par leurs employés. La justification avancée est que cela est fait pour améliorer l'application d'IA, et on nous dit également qu'il s'agit d'un type de tâche de travail effectuée par leurs formateurs en IA. Peut-être que oui, mais le résultat est qu'ils vous ont prévenu qu'ils peuvent consulter votre texte. Point, point final.

S'ils devaient faire autre chose avec votre texte, vous demanderiez probablement un avis juridique pour savoir s'ils sont allés au-delà des limites suggérées de la simple révision du texte à des fins d'amélioration du système (en supposant que vous ayez réussi à découvrir qu'ils l'ont fait, lequel des lui-même semble peut-être peu probable). Quoi qu'il en soit, vous pouvez imaginer les querelles juridiques d'essayer de les coincer là-dessus, et leurs tentatives de forger des mots pour éviter d'être arrêtés pour avoir en quelque sorte violé les limites de leur clause de non-responsabilité.

"Veuillez ne pas partager d'informations sensibles dans vos conversations."

Le septième point indique que vous ne devez partager aucune information sensible dans vos conversations. Cela semble relativement simple. Je suppose que vous pourriez ergoter sur la définition de l'information sensible. De plus, le point à puces ne vous dit pas pourquoi vous ne devriez pas partager d'informations sensibles. Si vous devez un jour essayer d'expliquer pourquoi vous avez bêtement saisi des données confidentielles, vous pourriez essayer d'affirmer que l'avertissement n'était pas spécifique, par conséquent, vous n'en avez pas compris la signification. Retenez votre souffle sur celui-là.

Dans l'ensemble, j'ose dire que la plupart des gens que j'ai vus utiliser ChatGPT ont tendance à ne pas lire les points à puces, ou ils survolent les précautions à puces et hochent simplement la tête comme si c'était le jargon juridique habituel que vous voyez tous les temps. Rares sont ceux qui semblent prendre les avertissements au sérieux. Est-ce une faute du vendeur pour ne pas avoir rendu les précautions plus prononcées ? Ou devrions-nous supposer que les utilisateurs doivent être responsables et avoir lu attentivement, compris et ensuite agir judicieusement sur la base des avertissements ?

Certains prétendent même que l'application AI devrait vous avertir à plusieurs reprises. Chaque fois que vous entrez une invite, le logiciel devrait afficher un avertissement et vous demander si vous souhaitez appuyer sur le retour. Encore et encore. Bien que cela puisse sembler une précaution utile, il est vrai que cela irriterait énormément les utilisateurs. Un compromis épineux est impliqué.

D'accord, ce sont donc les mises en garde évidentes telles que présentées pour que tous les utilisateurs puissent les voir facilement.

Les utilisateurs qui pourraient être plus curieux pourraient choisir de suivre certaines des stipulations de licence détaillées qui sont également publiées en ligne. Je doute que beaucoup le fassent. Mon intuition est que peu de gens regardent sérieusement les points à puces lors de la connexion, et encore moins par une énorme marge, puis jetez un œil aux détails de la licence. Encore une fois, nous sommes tous un peu insensibles à de telles choses ces jours-ci. Je n'excuse pas le comportement, je note seulement pourquoi il se produit.

Je vais examiner quelques extraits des conditions de licence publiées.

Tout d'abord, voici une définition de ce qu'ils considèrent comme du "contenu" associé à l'utilisation de ChatGPT :

  • "Votre contenu. Vous pouvez fournir une entrée aux Services (« Entrée ») et recevoir une sortie générée et renvoyée par les Services en fonction de l'entrée (« Sortie »). L'entrée et la sortie sont collectivement le « contenu ». Entre les parties et dans la mesure permise par la loi applicable, vous êtes propriétaire de toutes les Entrées, et sous réserve de votre respect des présentes Conditions, OpenAI vous cède par la présente tous ses droits, titres et intérêts dans et sur les Sorties. OpenAI peut utiliser le Contenu si nécessaire pour fournir et maintenir les Services, se conformer à la loi applicable et appliquer nos politiques. Vous êtes responsable du contenu, y compris de vous assurer qu'il ne viole aucune loi applicable ou les présentes conditions.

Si vous examinez attentivement cette définition, vous remarquerez qu'OpenAI déclare qu'elle peut utiliser le contenu comme elle le juge nécessaire pour maintenir ses services, y compris en se conformant aux lois applicables et en appliquant ses politiques. C'est un fourre-tout pratique pour eux. Dans une prochaine de mes colonnes, je discuterai d'un sujet différent mais connexe, en particulier sur les droits de propriété intellectuelle (PI) que vous avez concernant les invites de texte saisies et les essais produits (je le signale ici depuis la définition du Le contenu porte sur ce sujet).

Dans une autre partie des termes, intitulée section c, ils mentionnent cette facette : « L'un des principaux avantages des modèles d'apprentissage automatique est qu'ils peuvent être améliorés au fil du temps. Pour aider OpenAI à fournir et à maintenir les Services, vous acceptez et nous indiquez que nous pouvons utiliser le Contenu pour développer et améliorer les Services. » Cela s'apparente à l'avertissement d'une ligne discuté précédemment qui apparaît lorsque vous vous connectez à ChatGPT.

Un document séparé qui y est lié fournit quelques aspects supplémentaires sur ces questions importantes :

  • « Dans le cadre de cette amélioration continue, lorsque vous utilisez des modèles OpenAI via notre API, nous pouvons utiliser les données que vous nous fournissez pour améliorer nos modèles. Non seulement cela aide nos modèles à devenir plus précis et à mieux résoudre votre problème spécifique, mais cela contribue également à améliorer leurs capacités générales et leur sécurité. Nous savons que la confidentialité et la sécurité des données sont essentielles pour nos clients. Nous prenons grand soin d'utiliser des contrôles techniques et de processus appropriés pour sécuriser vos données. Nous supprimons toute information personnellement identifiable des données que nous avons l'intention d'utiliser pour améliorer les performances du modèle. Nous n'utilisons également qu'un petit échantillon de données par client pour nos efforts visant à améliorer les performances du modèle. Par exemple, pour une tâche, le nombre maximum de requêtes API que nous échantillonnons par client est plafonné à 200 tous les 6 mois » (extrait du document intitulé « Comment vos données sont utilisées pour améliorer les performances du modèle »).

Notez que la stipulation indique que la disposition s'applique au utilisation de l'API comme moyen de se connecter et d'utiliser tous les modèles OpenAI. Il est quelque peu flou de savoir si cela s'applique également aux utilisateurs finaux qui utilisent directement ChatGPT.

Dans un document encore différent, celui qui contient leur liste de diverses FAQ, ils fournissent une série de questions et réponses, dont deux semblent particulièrement pertinentes pour cette discussion :

  • "(5) Qui peut voir mes conversations ? Dans le cadre de notre engagement envers une IA sûre et responsable, nous examinons les conversations pour améliorer nos systèmes et nous assurer que le contenu est conforme à nos politiques et exigences de sécurité.
  • "(8) Pouvez-vous supprimer des invites spécifiques ? Non, nous ne sommes pas en mesure de supprimer des invites spécifiques de votre historique. Veuillez ne pas partager d'informations sensibles dans vos conversations.

Il existe un document supplémentaire qui couvre leur politique de confidentialité. Il dit ceci: "Nous collectons des informations qui, seules ou en combinaison avec d'autres informations en notre possession, pourraient être utilisées pour vous identifier ("Informations personnelles")", puis expliquent qu'ils peuvent utiliser des données de journal, des données d'utilisation, des informations de communication, informations sur l'appareil, cookies, analyses et autres informations potentiellement collectables vous concernant. Assurez-vous de lire les petits caractères.

Je pense que cela fournit à peu près un aperçu de certaines considérations sous-jacentes à la manière dont vos données pourraient être utilisées. Comme je l'ai mentionné au début, je ne vais pas parcourir laborieusement toutes les stipulations des licences.

J'espère que cela vous mettra dans un état d'esprit sur ces questions et restera au top de votre esprit.

Conclusion

Je l'ai déjà dit et je le répète, n'entrez pas de données confidentielles ou privées dans ces applications d'IA génératives.

Considérez quelques astuces ou options pratiques sur ce sage conseil :

  • Réfléchissez avant d'utiliser l'IA générative
  • Enlevez des trucs à l'avance
  • Masquez ou truquez votre entrée
  • Configurez votre propre instance
  • Autre

J'indiquerai ensuite en quoi consiste chacun d'entre eux. La configuration de votre propre instance a déjà été abordée ici. L'utilisation de "autre" dans ma liste est due à la possibilité d'autres moyens de faire face à la prévention de l'inclusion de données confidentielles, ce que je couvrirai plus en détail dans une future colonne.

Examinons ceux-ci :

  • Réfléchissez avant d'utiliser l'IA générative. Une approche consiste à éviter complètement d'utiliser l'IA générative. Ou du moins réfléchissez-y à deux fois avant de le faire. Je suppose que l'avenue la plus sûre consiste à ne pas utiliser ces applications d'IA. Mais cela semble aussi assez grave et presque exagéré.
  • Enlevez des trucs à l'avance. Une autre approche consiste à supprimer les informations confidentielles ou privées de tout ce que vous entrez comme invite. En ce sens, si vous n'y entrez pas, il n'y a aucune chance qu'il soit infusé dans le Borg. L'inconvénient est que peut-être que la suppression de la partie confidentielle réduit ou sape d'une manière ou d'une autre ce que vous essayez d'obtenir de l'IA générative pour vous.
  • Masquez ou truquez vos entrées. Vous pouvez modifier votre proposition de texte en changeant les informations afin que tout ce qui semblait confidentiel ou privé soit maintenant représenté différemment. Par exemple, au lieu d'un contrat mentionnant la Widget Company et John Smith, vous modifiez le texte pour faire référence à la Specious Company et à Jane Capone. Un problème ici est de savoir si vous ferez un travail suffisamment exhaustif pour que tous les aspects confidentiels et privés soient entièrement modifiés ou truqués. Il serait facile de manquer certains des nuages ​​et de laisser des choses qui ne devraient pas être là.

Voici une tournure supplémentaire intéressante qui pourrait faire en sorte que votre caboche percole davantage sur ce sujet. Si vous pouvez vous assurer qu'aucune de vos invites de saisie ne contient d'informations confidentielles, cela signifie-t-il que vous n'avez pas à vous soucier des essais produits contenant également l'une de vos informations confidentielles ?

Cela semblerait axiomatiquement vrai. Pas d'entrée confidentielle, pas de sortie confidentielle.

Voici votre torsion hallucinante.

L'IA générative est souvent configurée pour se recycler par calcul à partir des invites textuelles fournies. De même, l'IA générative est fréquemment conçue pour se recycler par calcul à partir des essais produits. Tous ces recyclages visent à améliorer les capacités de l'IA générative.

J'ai décrit dans une de mes autres chroniques l'expérience suivante que j'ai entreprise. Un avocat essayait de découvrir un nouveau moyen de résoudre un problème juridique. Après un regard exhaustif sur la littérature juridique, il nous a semblé que tous les angles déjà évoqués avaient été trouvés. En utilisant l'IA générative, nous avons obtenu que l'application AI produise une nouveauté d'une approche juridique qui n'avait apparemment pas été identifiée auparavant. On croyait que personne d'autre n'avait encore atterri sur cette position juridique. Une pépite d'or légale, en quelque sorte. Cela pourrait être une aubaine juridique concurrentielle stratégiquement précieuse qui, au bon moment, sera exploitée et exploitée.

Cet essai produit constitue-t-il une forme d'information confidentielle, telle qu'elle a été générée par l'IA pour cette personne particulière et contient quelque chose de spécial et apparemment unique ?

Aha, cela nous amène à l'autre sujet lié et entrelacé sur la propriété et les droits de propriété intellectuelle associés à l'IA générative. Restez à l'écoute pour voir comment cela se passe.

Une dernière remarque pour le moment.

Sophocle a fourni cette sagesse : « Ne faites rien en secret ; car le temps voit et entend tout, et révèle tout. Je suppose que vous pourriez moderniser le libellé et soutenir que l'IA générative et ceux qui conçoivent et maintiennent l'IA sont susceptibles de tout voir aussi.

C'est un conseil modestement symbolique qui mérite d'être rappelé.

Source : https://www.forbes.com/sites/lanceeliot/2023/01/27/generative-ai-chatgpt-can-disturbingly-gobble-up-your-private-and-confidential-data-forewarns-ai- ethique-et-ai-loi/