Le fondateur de Midjourney, David Holz, parle de l'impact de l'IA sur l'art, l'imagination et l'économie créative

À mi-parcours est l'un des principaux moteurs de la technologie émergente d'utilisation de l'intelligence artificielle (IA) pour créer des images visuelles à partir d'invites de texte. La startup basée à San Francisco a récemment fait la une des journaux en tant que moteur de l'œuvre d'art qui a remporté un prix lors d'un concours équitable dans l'État du Colorado, et il est peu probable que ce soit le dernier problème compliqué auquel l'art de l'IA sera confronté dans les années à venir.

Midjourney se différencie des autres dans l'espace en mettant l'accent sur l'esthétique picturale dans les images qu'il produit. La plate-forme n'essaie pas de créer des images photoréalistes qui peuvent être confondues avec des photographies, et le PDG David Holz dit qu'il est personnellement très mal à l'aise avec la qualité étrange des deepfakes et d'autres travaux qui simulent trop étroitement la réalité. Au lieu de cela, Holz dit que Midjourney est conçu pour libérer la créativité des gens ordinaires en leur donnant des outils pour faire de belles images simplement en les décrivant.

Mais malgré l'orientation humaniste et orientée vers le consommateur de l'entreprise, il y a inévitablement des questions sur les implications pour l'art commercial et les artistes professionnels. J'ai interviewé Holz pour une article plus large sur les perturbations potentielles que l'art de l'IA est susceptible de causer dans la production d'images pour le divertissement, les jeux vidéo et l'édition. Voici un extrait plus long de notre conversation où Holz fournit plus de profondeur et de contexte alors qu'il aborde ces problèmes et expose sa vision de l'entreprise, de l'industrie et de la technologie. L'interview a été modifiée pour plus de longueur et de clarté.

Rob Salkowitz, Forbes Contributor : Quels sont votre rôle et votre titre ?

David Holz, À mi-parcours. Je suis le fondateur et PDG. Je préfère généralement être appelé le fondateur, cependant, parce que le PDG a l'air très commercial, et nous ne sommes pas très commerciaux. Nous sommes un laboratoire de recherche appliquée qui fabrique des produits.

Quelle est la mission de Midjourney ?

Nous aimons dire que nous essayons d'étendre les pouvoirs imaginatifs de l'espèce humaine. L'objectif est de rendre les humains plus imaginatifs, pas de créer des machines imaginatives, ce qui, à mon avis, est une distinction importante.

Pouvez-vous donner un bref historique de l'entreprise à ce jour?

Nous avons commencé à travailler sur la partie imagination de notre entreprise il y a environ un an et demi. Il y a eu des percées sur les modèles de diffusion, les gens comprenant le clip, l'openAI, ce genre de choses. Presque toutes les personnes impliquées dans tout cela sont de San Francisco et nous avons tous réalisé que cela allait devenir sérieux, que c'était différent de beaucoup d'autres choses.

Quels sont, selon Midjourney, les avantages de cette technologie de conversion de texte en image pour les entreprises et la société ?

Je suis certainement plus préoccupé par la société que par les affaires. Nous sommes un produit de consommation, mais peut-être que 30 % à 50 % de nos utilisateurs sont actuellement des professionnels. La majorité ne le sont pas. Les artistes de la plateforme nous disent que cela leur permet d'être plus créatifs et exploratoires au début, en proposant beaucoup d'idées en peu de temps.

À l'heure actuelle, nos utilisateurs professionnels utilisent la plate-forme pour la conception. La partie la plus difficile [d'un projet d'art commercial] se situe souvent au début, lorsque la partie prenante ne sait pas ce qu'elle veut et doit voir des idées auxquelles réagir. Midjourney peut aider les gens à converger beaucoup plus rapidement vers l'idée qu'ils souhaitent, car itérer sur ces concepts est très laborieux.

Un autre avantage pour les artistes est que cela donne confiance aux gens dans des domaines dans lesquels ils ne sont pas confiants. La plupart des artistes, sinon tous, ont l'impression qu'il y a une partie de l'art qu'ils ne peuvent pas bien faire. Il peut s'agir de couleurs, de composition, d'arrière-plans. Nous avons un créateur de personnages célèbre qui utilise notre produit et les gens lui demandent pourquoi utiliseriez-vous une IA puisque vous êtes déjà si bon. Et il a dit, « eh bien, je ne suis bon que pour la partie personnage. Cela m'aide avec le reste, le monde, l'arrière-plan, les schémas de couleurs.

Environ combien de personnes utilisent le produit ?

Des millions l'utilisent. Notre Discord dépasse les deux millions. C'est de loin le plus gros serveur Discord actif.

La licence de Midjourney autorise-t-elle l'utilisation commerciale des images générées par la plateforme ?

Oui. Mais si vous travaillez pour une entreprise dont le chiffre d'affaires annuel dépasse le million de dollars, nous vous demandons d'acheter une licence d'entreprise.

Comment le jeu de données a-t-il été construit ?

C'est juste une grosse éraflure d'Internet. Nous utilisons les ensembles de données ouvertes qui sont publiés et formons à travers ceux-ci. Et je dirais que c'est quelque chose que 100% des gens font. Nous n'étions pas difficiles. La science évolue vraiment rapidement en termes de quantité de données dont vous avez vraiment besoin, par rapport à la qualité du modèle. Il va falloir quelques années pour vraiment comprendre les choses, et à ce moment-là, vous aurez peut-être des modèles que vous entraînerez avec presque rien. Personne ne sait vraiment ce qu'ils peuvent faire.

Avez-vous demandé le consentement d'artistes vivants ou travaillé encore sous copyright ?

Non. Il n'y a pas vraiment de moyen d'obtenir cent millions d'images et de savoir d'où elles viennent. Ce serait cool si les images contenaient des métadonnées sur le titulaire du droit d'auteur ou quelque chose du genre. Mais ce n'est pas une chose; il n'y a pas de registre. Il n'y a aucun moyen de trouver une image sur Internet, puis de la retracer automatiquement jusqu'à son propriétaire, puis de faire quoi que ce soit pour l'authentifier.

Les artistes peuvent-ils refuser d'être inclus dans votre modèle de formation aux données ?

Nous examinons cela. Le défi consiste maintenant à découvrir quelles sont les règles et comment déterminer si une personne est vraiment l'artiste d'une œuvre particulière ou si elle met simplement son nom dessus. Nous n'avons rencontré personne qui souhaite que son nom soit retiré de l'ensemble de données.

Les artistes peuvent-ils refuser d'être nommés dans les invites ?

Pas tout de suite. Nous examinons cela. Encore une fois, nous devrons trouver un moyen d'authentifier ces demandes, ce qui peut devenir compliqué.

Que dites-vous aux artistes commerciaux inquiets que cela détruise leur gagne-pain ? À un certain moment, pourquoi un directeur artistique embaucherait-il un illustrateur pour produire des travaux tels que l'art conceptuel, la conception de la production, les arrière-plans - ce genre de choses - alors qu'il peut simplement saisir des invites et obtenir une sortie utile beaucoup plus rapidement et à un coût bien moindre ?

C'est encore beaucoup de travail. Ce n'est pas juste comme "faites-moi un arrière-plan". C'est peut-être dix fois moins de travail, mais c'est beaucoup plus de travail que ce qu'un manager va faire.

Je pense qu'il y a en quelque sorte deux façons de procéder. Une façon consiste à essayer de fournir le même niveau de contenu que les gens consomment à un prix inférieur, n'est-ce pas ? Et l'autre façon de procéder est de créer un contenu extrêmement meilleur aux prix que nous sommes déjà prêts à dépenser. Je trouve que la plupart des gens, s'ils dépensent déjà de l'argent, et que vous avez le choix entre un contenu incroyablement meilleur ou un contenu moins cher, choisissent en fait un contenu extrêmement meilleur. Le marché a déjà établi un prix que les gens sont prêts à payer.

Je pense que certaines personnes essaieront d'éliminer les artistes. Ils essaieront de faire quelque chose de similaire à moindre coût, et je pense qu'ils échoueront sur le marché. Je pense que le marché ira vers une qualité supérieure, plus de créativité et un contenu beaucoup plus sophistiqué, diversifié et approfondi. Et les personnes qui sont réellement capables d'utiliser comme les artistes et d'utiliser les outils pour le faire sont celles qui vont gagner.

Ces technologies créent en fait une appréciation et une alphabétisation beaucoup plus profondes dans le médium visuel. Vous pourriez en fait avoir la demande, dépasser la capacité de produire à ce niveau, et alors peut-être augmenterez-vous les salaires des artistes. Ça pourrait être bizarre, mais c'est ce qui va se passer. Le rythme de cette augmentation de la demande pour la qualité et la diversité conduira à la réalisation de projets merveilleux et inattendus.

Une génération d'étudiants diplômés des écoles d'art, dont beaucoup étaient lourdement endettés, comptant sur des emplois relativement bien rémunérés dans la production de divertissement, la production de jeux vidéo, l'art commercial, etc. Comment l'émergence des plateformes d'IA text-to-image impacte-t-elle leur avenir ?

Je pense que certaines personnes essaieront de réduire les coûts, et certaines personnes essaieront d'élargir leurs ambitions. Je pense que les gens qui élargissent leurs ambitions paieront toujours tous ces mêmes salaires, et les gens qui essaient de réduire les coûts, je pense, échoueront.

Ai est généralement utilisé à grande échelle pour des choses comme les centres d'appels ou la vérification des bagages dans les aéroports et le genre d'emplois que les gens ne se soucient pas vraiment de faire. Et la proposition de valeur est que cela libère les gens pour qu'ils puissent faire des types d'emplois plus gratifiants et plus intéressants. Mais les métiers de l'art sont enrichissants et intéressants. Les gens travaillent toute leur vie et développent leurs compétences pour obtenir ce genre d'emplois. Pourquoi désigneriez-vous cette technologie à ce niveau de l'économie comme une sorte d'objectif commercial et de priorité pour ce que vous faites ?

Personnellement, je ne le suis pas. Mes trucs ne sont pas faits pour les artistes professionnels. S'ils aiment l'utiliser, c'est très bien. Mes trucs sont faits pour des gens comme, genre, il y a cette femme à Hong Kong, et elle est venue me voir, et elle m'a dit : « La seule chose à Hong Kong que tes parents ne veulent jamais que tu sois, c'est une artiste, et je » Je suis banquier maintenant. Je vis une bonne vie de banquier. Mais avec Midjourney maintenant, je commence à avoir un avant-goût de cette expérience d'être la personne que je voulais vraiment être. Ou un gars au relais routier qui fabrique ses propres cartes de baseball avec des images sauvages, juste pour le plaisir. C'est fait pour ces gens, parce que, comme la plupart des gens, ils n'ont jamais l'occasion de faire ces choses.

Il est important de souligner qu'il ne s'agit pas d'art. C'est une question d'imagination. L'imagination est parfois utilisée pour l'art, mais ce n'est souvent pas le cas. La plupart des images créées sur Midjourney ne sont pas utilisées par des professionnels. Ils ne sont même pas partagés. Ils sont simplement utilisés à ces autres fins, ces besoins très humains.

Néanmoins, le résultat de votre produit est l'imagerie, qui a une valeur commerciale dans un contexte professionnel en plus de toutes ces autres propriétés. Et c'est très perturbateur de cette économie.

Je pense que c'est comme si nous faisions un bateau, et quelqu'un peut courir avec le bateau, mais cela ne veut pas dire que le bateau est fait pour la course. Si vous utilisez le bateau pour faire la course, alors peut-être, oui, bien sûr. C'est à ce moment-là. Mais le côté humain compte vraiment, et je pense que nous ne le sommes pas… Nous voulons que les photos soient jolies. Nous ne nous considérons pas comme essayant de créer de l'art dans le cadre de notre truc. Nous voulons que le monde soit plus imaginatif. Nous préférons faire de belles choses que des choses laides.

Croyez-vous qu'un organisme gouvernemental a compétence ou autorité pour réglementer cette technologie ? Et si oui, pensez-vous qu'ils devraient?

Je ne sais pas. La réglementation est intéressante. Vous devez équilibrer la liberté de faire quelque chose avec la liberté d'être protégé. La technologie elle-même n'est pas le problème. C'est comme de l'eau. L'eau peut être dangereuse, on peut s'y noyer. Mais c'est aussi essentiel. Nous ne voulons pas interdire l'eau juste pour éviter les parties dangereuses.

Eh bien, nous voulons être sûrs que notre eau est propre.

Oui c'est vrai.

Source : https://www.forbes.com/sites/robsalkowitz/2022/09/16/midjourney-founder-david-holz-on-the-impact-of-ai-on-art-imagination-and-the- économie-créative/