Que signifie le nouveau texte en 3D de Nvidia pour l'ingénierie et la conception de produits

tl; dr: L'IA générative évolue à un rythme effréné. Le dernier algorithme de Nvidia convertit le texte en maillage 3D deux fois plus vite que les projets publiés il y a à peine 2 mois. Cela signifie que les capacités techniques dépassent déjà notre capacité à travailler avec eux.

Les dernières semaines papier par les scientifiques de Nvidia ont démontré la vitesse exponentielle à laquelle l'espace de l'IA générative évolue. Cette explosion d'activité - particulièrement visible au cours des 9 derniers mois - aura un impact sur tous les aspects de la vie, notamment sur la conception, l'ingénierie et la production des produits. Les changements libéreront l'industrie des contraintes structurelles dans la manière dont les idées sont communiquées, permettront des cycles d'innovation plus rapides et lui permettront finalement de tenir ses promesses de durabilité.

Après avoir entendu pendant des années que l'IA révolutionnerait fondamentalement notre façon de travailler, peu s'attendaient à ce que le secteur créatif soit parmi ses premières victimes. L'avènement du générateur de texte de type humain de GPT-3 en 2020 a mis en évidence les possibilités. Depuis lors, la course a été folle : DALL-E (texte vers image), Whisper (reconnaissance vocale) et, plus récemment, Stable Diffusion (texte vers image) ont non seulement augmenté les capacités des outils d'IA vocale et visuelle, mais aussi réduit les ressources nécessaires à leur utilisation (de 175 milliards de paramètres pour GPT-3 à 900mn pour Stable Diffusion).

La taille de Stable Diffusion signifie moins de 5 Go d'espace disque - capable d'être exécuté sur n'importe quel ordinateur portable. Non seulement que; contrairement à OpenAI (qui est principalement financé par Microsoft et publie GPT-3, DALL-E et Whisper), Stable Diffusion est open source, ce qui signifie que d'autres peuvent s'appuyer sur ses apprentissages beaucoup plus facilement. Cela signifie que nous ne voyons que le début du cycle d'innovation — il y a beaucoup plus à venir, comme le montre maintenant l'article de Nvidia.

Les soutiens de Stable Diffusion (stability.ai) accélèrent encore cette tendance en fournissant des subventions technologiques et financières à d'autres équipes menant l'exploration dans de nouvelles directions. De plus, une pléthore de projets met les outils à la disposition d'un éventail toujours plus large d'utilisateurs. Parmi eux se trouvent des plugins pour Blender, un outil de conception open source, et l'équivalent Photoshop propriétaire d'Adobe. L'accès API complet aux outils est financé avec de gros dollars de capital-risque, ce qui signifie que des centaines de millions de développeurs de logiciels, et pas seulement quelques centaines de milliers d'ingénieurs de données, vont désormais créer leurs propres outils sur ces algorithmes.

La parole, les images et le texte sont parmi les premières verticales à être bouleversées par ces technologies. Mais la 3D n'est pas loin derrière. Au-delà de l'art génératif de niche, les dessins animés sont le premier point d'application évident. Il existe déjà un générateur de Pokémon basé sur Stable Diffusion. Les effets visuels et les films viennent ensuite. Mais de nombreux autres secteurs risquent d'être perturbés, parmi lesquels le design d'intérieur avec Interiorai.com en tête.

Dans toute cette excitation, l'application des innovations à la conception et à l'ingénierie semble être une réflexion après coup. Pourtant, il est probable que ce soit la zone finalement la plus touchée. Bien sûr, il y a des défis initiaux : D'une part, Stable Diffusion et ses compatriotes ne sont pas encore très précis. Ce n'est pas un problème pour les dessins animés, mais c'est un défi majeur pour toute tentative de transformer du texte en géométries 3D complètes utilisées dans des contextes industriels. C'est un domaine qui suscite un intérêt naissant (un projet appelé Bits101 a été lancé en Israël en 2015). C'est peut-être le Saint Graal de l'industrie, mais il existe de nombreux défis intermédiaires qui peuvent être beaucoup plus faciles à résoudre. Celles-ci incluent une meilleure reconnaissance des objets (l'algorithme Yolo est déjà utilisé avec beaucoup d'efficacité), ce qui conduira à une amélioration des citations et des annotations, améliorant ainsi la qualité et réduisant les erreurs. Les plugins devraient également faciliter l'utilisation de l'IA générative pour développer des conceptions de base (Primitives), qui peuvent ensuite être modifiées dans les outils de conception pour améliorer la tolérance selon les besoins. C'est une approche déjà utilisée dans Inspire d'Altair, qui a utilisé l'analyse par éléments finis pour faire de même. Ces Primitives peuvent également servir de base de données synthétique de modèles annotés, ce qui manque dans l'industrie de la CAO 3D. PDG et fondateur de Physna le signale dans un article détaillant leurs propres tentatives d'utiliser ces nouvelles méthodes pour créer des conceptions 3D détaillées, ce qui met également en évidence un certain nombre de pièges dans l'utilisation de données synthétiques pour piloter ces algorithmes. La création de conceptions 3D à partir de dessins 2D est un autre domaine d'application potentiel, tout comme la FAO intelligente - se nourrissant d'un bibliothèque d'usure d'outil pour déterminer les meilleures stratégies d'usinage.

Ces défis sont importants et lucratifs à relever en eux-mêmes et pour eux-mêmes. Pourtant, leur principal impact sera d'aider à faire évoluer le cheminement de l'idée à la conception en réduisant à terme la dépendance à l'égard des conceptions 3D pour communiquer l'intention. Les conceptions, qu'elles soient en 2D ou en 3D, ont été le principal moyen de traduire les besoins des clients en produits finaux. Cela limite l'industrie car ces conceptions servent de boîte noire dans laquelle toutes ces précieuses informations sur les clients, les contraintes de fabrication et les objectifs de l'entreprise sont stockées, impossibles à démêler, mais seules identifiées. Cela signifie que lorsque quelque chose change, il est presque impossible d'ajuster simplement la conception. C'est la raison pour laquelle les innovations de fabrication telles que l'impression 3D mettent si longtemps à être adoptées et déçoivent systématiquement les investisseurs à court terme. Les composants qui composent un avion sont « réglés » dès leur conception, malgré une durée de vie productive de plus de 20 ans. Il n'y a presque aucune marge d'innovation – celles-ci doivent attendre le lancement de la prochaine génération.

Pouvoir changer une seule contrainte et permettre à un algorithme tel que Stable Diffusion de reconstituer les paramètres de conception et de production accélérera considérablement l'adoption de nouvelles innovations et nous permettra de construire des produits plus légers, plus performants, plus rapidement. Comme ils le font en Formule 1 ou en Conception de Systèmes, les futurs ingénieurs agiront comme des gestionnaires de contraintes capables d'exprimer par des mots et en référence à des sources de données quels sont l'objectif et les limites du produit.

Sans accélérer ainsi le processus d'ingénierie des produits nouveaux et existants, nous n'avons presque aucun moyen d'atteindre les objectifs de durabilité ambitieux que nous devons nous fixer. Pour ce faire, nous devons d'abord nous mettre d'accord sur un langage que nous pouvons utiliser pour communiquer au-delà des conceptions. Ce nouveau modèle sémantique est la lacune évidente dans les innovations décrites ci-dessus. Un certain nombre d'entreprises ont déjà commencé à l'expérimenter, telles que nTopologie avec ses concepts de Champs. Et pourtant, le rythme des changements est lent, contrairement aux algorithmes que va nourrir le modèle sémantique. Le nouvel algorithme de Nvidia serait plus de deux fois plus rapide que RêveFusion, publié il y a moins de 2 mois. Les entreprises de produits et d'ingénierie doivent maintenant s'efforcer de capturer leurs idées de manière nouvelle et pérenne afin de tirer le meilleur parti des possibilités que recèle cette explosion d'IA générative. La vitesse d'évolution des algorithmes a montré, une fois de plus, que la loi de Morse s'applique partout où les outils sont numérisés. Le défi reste notre incapacité humaine à embrasser ce changement et à déployer de nouvelles méthodes de communication capables de libérer leur potentiel, malgré l'urgence de la tâche.

Source : https://www.forbes.com/sites/andrewegner/2022/11/24/what-nvidias-new-text-to-3d-means-for-engineering–product-design/