Un regard sur le nouvel Al Generative Art

Al Art Génératif est un type d'art, le plus souvent visuel, qui repose sur la coopération entre un être humain et un système autonome. Un « système autonome » est défini comme un Intelligence artificielle logiciel, algorithme ou modèle capable d'effectuer des opérations complexes sans nécessiter l'intervention d'un programmeur.

Des juxtapositions bizarres d'images créées par Dall-E Mini à la NFT marché, les images générées par les algorithmes d'IA entrent de plus en plus dans l'imaginaire grand public. En fait, deux projets importants sur le sujet qui méritent d'être analysés sont : À mi-parcours ainsi que DALL-E2.

Bien sûr, la nouvelle a également fait son chemin sur Twitter. Le commentant, entre autres, est Charles Hoskinson, qui a écrit :

Al Generative Art: premières expériences et fonctionnalités

Après avoir compris ce qu'est l'Art Génératif, il est important de souligner l'un de ses principes fondateurs : aléatoire. Ce qui est une propriété fondamentale de l'Art Génératif.

En effet, selon le type de logiciel, le système autonome est capable de traiter des résultats toujours différents et uniques à chaque exécution de la commande de génération, ou il peut renvoyer un nombre variable de résultats en réponse à l'entrée de l'utilisateur.

Les premières expérimentations en Art Génératif remontent aux années 1960 avec les expérimentations de Harold Cohen et ses AARON programme. Cohen a d'abord utilisé un logiciel autonome pour générer des œuvres abstraites inspirées des sérigraphies Pop Art. Les œuvres de Cohen sont maintenant exposées à la Tate Gallery de Londres.

Un autre attribut de l'Art Génératif, mais qui est de moins en moins une prérogative, est la répétition de motifs ou d'éléments abstraits fournis par le programmeur et implémentés dans le code logiciel.

De plus, le développement de réseaux de neurones de plus en plus complexes fonctionnant sur l'association texte-image a permis le développement de modèles génératifs capables de créer des images de plus en plus réalistes et précises. L'exemple le plus connu de cette catégorie d'art génératif est Lui donner.

Dall-E est un réseau de neurones multimodal basé sur la GPT-3 modèle d'apprentissage en profondeur de OpenAI, la même société qui a également récemment développé ChatGPT, le chatbot lancé en novembre 2022 et optimisé avec "surveillé" et les techniques d'apprentissage par renforcement.

En revenant à Dall-E, nous voyons que ce système est capable de générer des images à partir d'une description textuelle, appelée un "rapide," basé sur un ensemble de données de paires texte-image.

La première version de Dall-E, qui a été présentée au public en janvier 2021 et est restée l'apanage d'un petit nombre de professionnels du domaine, a représenté une véritable révolution en termes de ce type de modèle génératif, dépassant les innovations de GPT- 3 lui-même.

Il est également important de noter que la précision des résultats traités par Dall-E s'est avérée être le cadre idéal pour une autre solution OpenAI : CLIP (Pré-formation Langage Contrastant-Image).

Un réseau de neurones de classification et de classement d'images formé sur la base d'associations texte-image, telles que des légendes trouvées sur Internet. Grâce à l'intervention de CLIP, qui réduit à 32 le nombre de résultats proposés à l'utilisateur par invite, Dall-E s'est avéré renvoyer des images satisfaisantes dans la plupart des cas.

À mi-parcours : conception, infrastructure humaine et intelligence artificielle

Comme anticipé, À mi-parcours est un projet important qui fait partie du concept émergent d'Al Generative Art. Plus précisément, Midjourney est un laboratoire de recherche indépendant qui explore de nouveaux modes de pensée et développe les pouvoirs imaginatifs de l'espèce humaine.

Son utilisation est simple : il faut d'abord créer un compte sur Discorde, une plateforme qui héberge diverses communautés, dont Midjourney fait partie. Au sein de l'application se trouvent les différents salons de discussion dans lesquels on peut participer activement ou non aux discussions.

Il est important de souligner que pour essayer d'utiliser l'Intelligence Artificielle pour la première fois, il faut se rendre sur le "débutants" canaux, où 25 rendus gratuits sont disponibles.

Un rendu correspond à la génération de quatre variantes différentes générées à partir de la même entrée textuelle.

Ainsi, les 25 rendus font référence à 25 tâches de traitement effectuées par le bot Midjourney. Par conséquent, générer l'image nécessite d'interagir avec le bot Midjourney via un message texte appelé "invite", dans lequel il y aura des mots-clés décrivant l'image que l'utilisateur a en tête.

Vous pouvez ajouter autant de détails que vous le souhaitez, l'important étant de séparer les mots clés par une virgule. Une fois le rendu terminé, l'ordinateur renvoie quatre images différentes en fonction des descriptions au choix.

De plus, une fois que le programme a terminé le rendu, vous pouvez communiquer vos préférences en fonction des images et, si vous le souhaitez, faire générer à nouveau quatre versions supplémentaires.

DALL-E 2 : le nouveau système d'IA pour les œuvres d'art

En plus de Midjourney, DALL-E 2 est également le nouveau système d'IA capable de créer des images et des œuvres d'art réalistes à partir d'une description en langage naturel. Non seulement cela, DALL-E 2 peut également combiner des concepts, des attributs et des styles.

La force du nouveau système d'IA réside également dans sa capacité à étendre les images au-delà de ce qui se trouve dans la toile d'origine, en créant nouvelles compositions expansives. De plus, il peut apporter des modifications réalistes aux images existantes à partir d'une légende en langage naturel et peut ajouter et supprimer des éléments en tenant compte des ombres, des reflets et des textures.

Les capacités de DALL-E 2 incluent également la prise d'une image et la création de plusieurs variantes inspirées de l'original. DALL-E 2 a appris la relation entre les images et le texte utilisé pour les décrire.

Il utilise un processus appelé "la diffusion," qui commence par un motif de points aléatoires et modifie progressivement ce motif vers une image lorsqu'il reconnaît des aspects spécifiques de cette image.

Ainsi, après l'introduction de DALL-E par OpenAI en janvier 2021, le système le plus récent, DALL-E 2, génère des images plus réalistes et précises avec une résolution quatre fois supérieure.

DALL-E 2 a commencé comme un projet de recherche et est maintenant disponible en tant que version bêta. Les atténuations de sécurité que le système a développées et continue d'améliorer incluent : la limitation de la capacité du système à générer des images violentes, haineuses ou adultes, et un déploiement progressif basé sur l'apprentissage.

Source : https://en.cryptonomist.ch/2023/02/02/ai-generative-art/