Des abonnements
pour l'enrichissement
02 mai 2023 | La Revue POLYTECHNIQUE | Intelligence artificielle

Créer des visuels à l’aide de l’intelligence artificielle. Ça c’est de l’IArt !

Stefan Tschanz Designer UX/I, paru dans le blog de Atipik SA

Dernièrement, Jason Allen, fondateur d’une entreprise de conception de jeux vidéo, a participé à la Colorado State Fair. Son oeuvre, “Théâtre D’opéra Spatial”, eut un tel succès qu’il gagna le concours dans la catégorie des photographies manipulées numériquement. Allen n’indiqua que par la suite qu’il avait utilisé l’intelligence artificielle pour l’élaboration de son oeuvre, créant ainsi un scandale au sein des communautés d’artistes. Chaque semaine, un nouvel article sort sur l’intelligence artificielle et son usage. Mais comment fonctionne-t-elle ? Pourquoi son utilisation est-elle controversée ?

Comment les IA créatrices d’images fonctionnent-elles ?

DALL-E, Crayion, Midjourney, Dream, Stable Diffusion sont des IA conçues dans le but de générer des images selon une “prompt”, une instruction textuelle de la part de l’utilisateur. Dans cette instruction, on écrit des phrases ou des mots-clés décrivant avec plus ou moins de précision l’image qu’on s’imagine mentalement. L’IA, qui a été entrainée sur des millions d’images, va analyser ce texte pour s’inspirer de ce qu’elle a pu “voir” et ainsi proposer des résultats. Ces derniers peuvent varier selon la base de données de l’IA et on peut se retrouver avec des résultats parfois très différents.

"un arbre surplombant une forêt en montagne, vue générale, style renaissance"

Face à face, Midjourney et Crayion ont tous deux compris que je voulais un plan d’ensemble (moins pour Crayion sur certaines itérations) composé d’un arbre surplombant une forêt dans un environnement montagneux. Midjourney a considéré le style que je lui ai imposé, DALL-E et Crayion non. Là, on découvre comment l’IA a été entraînée.

Autre exemple, encore plus complexe :

Batman::0.5, Portrait, Large and imposing figure, Black Armor, Cinematic lighting, Volumetric lighting, Epic composition, Photorealism, Bokeh blur::1, Very high detail, ISO1900, Character design, Unreal Engine, Octane render, HDR, Subsurface scattering

Deux directions opposées. Crayion fait office de bon élève, un portrait de Batman dont le costume est assez détaillé tout comme son expression sur un arrière-plan flouté… il propose des résultats auxquels je m’attendais. DALL-E2 est également bon élève en répondant à mes critères avec justesse.

Midjourney propose une variété beaucoup plus en adéquation en prenant en compte au maximum chaque élément de ma demande. Cette dernière va même comprendre les rapports d’importances indiqués après le marquage “::”.

Et, si on approfondit la recherche en entraînant l’IA avec ses propres variations, on augmente en précision dans le rendu de l’image et là… Ses suggestions surpassent de loin les autres en proposant de la matière concrète à retravailler ! Rien ne nous empêcherait d’exploiter cette base pour illustration !

En effectuant plusieurs tests, je remarque que DALL-E2 peut mieux s’en sortir, comme dans l’exemple ci-dessous.

A panda mad scientist mixing chemicals, digital art

Même si les sources disponibles à l’entraînent des IA se croisent très vraisemblablement, chaque intelligence artificielle est entraînée différemment et génère ce qu’elle a appris à sa manière, d’où les résultats différents.

Qu’en est-il de l’utilisation de l’IA dans l’art ?

Plagiat, solution de facilité, impersonnel… De nombreux créatifs critiquent l’utilisation de l’IA dans la conception d’œuvres. Au jour où j’écris cet article, son utilisation est critiquée. Après le dernier scandale à la Colorado State Fair, des plateformes de communautés d’artistes interdisent totalement ou partiellement la publication de travaux réalisés avec l’intelligence artificielle. D’autres commencent à créer une catégorie à part, ce qui est sans doute la solution la plus flexible. Derrière leurs dires, une crainte s’est installée, celle d’être remplacé par les machines, d’être battus par elles alors que l’art appartient à l’humain.

“On ne fait qu’appuyer sur un bouton”.

Cela vous rappelle quelque chose ? À ses débuts, la photographie n’était pas considérée comme un art, car on ne faisait qu’appuyer sur un bouton… Aujourd’hui, on part du postulat que c’est l’humain qui a jugé de prendre la photo à tel endroit avec telle lumière, telle composition et tel sujet afin de répondre à son intention. C’est alors devenu un art.

Dans le processus d’utilisation d’une intelligence artificielle, le créatif va devoir réfléchir sur son intention, puis écrire une instruction cohérente, la développer et l’affiner jusqu’à obtenir une image qu’il utilisera totalement ou partiellement selon son jugement. Personnellement, je retrouve là un processus similaire à n’importe quel créatif qui passerait du temps sur Pinterest, dans les musées ou même en pleine nature à la recherche d’inspiration ou de modèles pour répondre à son intention initiale.

Peut-être est-ce à cause des derniers bonds technologiques, mais ce n’est que récemment que certains créateurs assument pleinement l’intégration d’intelligences artificielles dans leurs processus de création. Ursala V., illustratrice, explique avoir expérimenté Midjourney, et aussi un peu de DALL-E, pour concevoir une bande dessinée (entièrement accessible sur son Twitter). Elle y exprime tant les complications confrontées — à devoir réitérer mois après mois ses expériences — tout comme ses avis positifs envers l’IA.

Est-ce que tout ça serait mieux si je l'avais dessiné à la main ? Peut-être, mais c'est un point discutable parce que je ne l'aurais pas terminé. Je suis fondamentalement paresseuse. - Ursala V.

Jusqu’où pourrions-nous aller avec les IA spécialisées dans l’image ?

L’usage de l’intelligence artificielle moderne offre de nouvelles perspectives jusqu’à alors très expérimentales ou aléatoires. Les graphistes utilisent des outils de détourage automatique perfectionnés, les photographes disposent d’outils de correction d’images intelligents, les scénaristes créent des planches d’intentions sur la base de leurs scénarios ou même la police peut créer un portrait-robot plus aisément ! Les applications quotidiennes sont de plus en plus nombreuses et en constante évolution.

Bien entendue, son utilisation à son lot de dérives comme la falsification de documents ou d’informations, l’usurpation d’identité, des créations dites “négatives” destinées à alimenter des controverses ou présentant un caractère contraire aux bonnes mœurs. Aujourd’hui, aucune limitation ne s’applique et les communautés se retrouvent submergées par du contenu qui devient difficilement discernable du vrai. Se dirigera-t-on vers des restrictions légales ?

Alors, pourquoi ne pas s’aider d’une IA ?

Pour créer ce qu'on leur demande, les intelligences artificielles doivent apprendre d'artistes et de créateurs d’images de chair et d'os. Elles doivent donc se nourrir de ce qui existe. Des problématiques de droit d'auteur et de légitimité de l'existence des créateurs d’image se posent en plus de la peur d’être remplacé par ces dernières.

Cependant, s’inspirer de ce qui nous entoure et des autres fait partie du quotidien d’un créatif. Notre cerveau agit comme une grande base de données avec toutes ses références que l’on construit et déconstruit. L’intelligence artificielle fait pareil, mais plus rapidement, et peut-être même mieux. Tout cela dans le but d’aider la personne qui lui présente des exigences.

À garder en tête : l’IA n’a pas le dernier mot, le créateur l’a.

Atipik SA

26 Avenue de la Praille

CH-1227 Carouge

Tél. +41 22 548 12 13

www.atipik.ch

À propos de Atipik

Atipik n’est ni une agence, ni une société de développement traditionnelle, ni une énième entreprise de consultants en informatique. Depuis 11 ans, l'entreprise genevoise conçoit et construit des produits numériques pour leurs clients.

Applications web ou mobiles, d’entreprise ou grand public, pour jeunes pousses ou grands groupes, les solutions de cette société sont uniques, faites pour un seul client. Elles collent au besoin comme une combinaison de plongée.

À ce jour, la conception et le lancement de plus de 150 applications mobiles et 60 plateformes web (portail, site et application web) utilisées par des millions d’utilisateurs à travers le monde à permis à leurs équipes d’acquérir une expérience hors pair dans de nombreux secteurs technologiques.

Agile de nature, sincère par essence, ingénieuse par définition et locale par principe, l'équipe dit ce qu'elle pense et fait ce qu'elle dit, sans compromis, si si !

Comme tout bon studio de produit, Atipik conçoit des solutions et des services dans différents secteurs, dont la santé, les villes intelligentes et connectées et l’immobilier. Pour l'entreprise, la numérisation est une chance de faire la différence et non de suivre une tendance. Dès lors, l'entreprise n'a pas peur de faire les choses différemment pour créer un impact positif.