Créer des visuels à l’aide de l’Intelligence Artificielle. Ça c’est de l’IArt !
Chaque semaine, un nouvel article sort sur l’intelligence artificielle et son usage. Mais comment fonctionne-t-elle ? Pourquoi son utilisation est-elle controversée ?
Dernièrement, Jason Allen, fondateur d’une entreprise de conception de jeux vidéo, a participé à la Colorado State Fair. Son oeuvre, “Théâtre D’opéra Spatial”, eut un tel succès qu’il gagna le concours dans la catégorie des photographies manipulées numériquement. Allen n’indiqua que par la suite qu’il avait utilisé l’intelligence artificielle pour l’élaboration de son oeuvre, créant ainsi un scandale au sein des communautés d’artistes.
Comment les IA créatrices d’images fonctionnent-elles ?
DALL-E, Crayion, Midjourney, Dream, Stable Diffusion sont des IA conçues dans le but de générer des images selon une “prompt”, une instruction textuelle de la part de l’utilisateur. Dans cette instruction, on écrit des phrases ou des mots-clés décrivant avec plus ou moins de précision l’image qu’on s’imagine mentalement. L’IA, qui a été entrainée sur des millions d’images, va analyser ce texte pour s’inspirer de ce qu’elle a pu “voir” et ainsi proposer des résultats. Ces derniers peuvent varier selon la base de données de l’IA et on peut se retrouver avec des résultats parfois très différents.
a tree overlooking a forest in the mountains, general view, renaissance style
Face à face, Midjourney et Crayion ont tous deux compris que je voulais un plan d’ensemble (moins pour Crayion sur certaines itérations) composé d’un arbre surplombant une forêt dans un environnement montagneux. Midjourney a considéré le style que je lui ai imposé, DALL-E et Crayion non. Là, on découvre comment l’IA a été entraînée.
Autre exemple, encore plus complexe :
Batman::0.5, Portrait, Large and imposing figure, Black Armor, Cinematic lighting, Volumetric lighting, Epic composition, Photorealism, Bokeh blur::1, Very high detail, ISO1900, Character design, Unreal Engine, Octane render, HDR, Subsurface scattering
Deux directions opposées. Crayion fait office de bon élève, un portrait de Batman dont le costume est assez détaillé tout comme son expression sur un arrière-plan flouté… il propose des résultats auxquels je m’attendais. DALL-E2 est également bon élève en répondant à mes critères avec justesse.
Midjourney propose une variété beaucoup plus en adéquation en prenant en compte au maximum chaque élément de ma demande. Cette dernière va même comprendre les rapports d’importances indiqués après le marquage “::”.
Et, si on approfondit la recherche en entraînant l’IA avec ses propres variations, on augmente en précision dans le rendu de l’image et là… Ses suggestions surpassent de loin les autres en proposant de la matière concrète à retravailler ! Rien ne nous empêcherait d’exploiter cette base pour illustration !
En effectuant plusieurs tests, je remarque que DALL-E2 peut mieux s’en sortir, comme dans l’exemple ci-dessous.
A panda mad scientist mixing chemicals, digital art
Même si les sources disponibles à l’entraînent des IA se croisent très vraisemblablement, chaque intelligence artificielle est entraînée différemment et génère ce qu’elle a appris à sa manière, d’où les résultats différents.
Qu’en est-il de l’utilisation de l’IA dans l’art ?
Plagiat, solution de facilité, impersonnel… De nombreux créatifs critiquent l’utilisation de l’IA dans la conception d’œuvres. Au jour où j’écris cet article, son utilisation est critiquée. Après le dernier scandale à la Colorado State Fair, des plateformes de communautés d’artistes interdisent totalement ou partiellement la publication de travaux réalisés avec l’intelligence artificielle. D’autres commencent à créer une catégorie à part, ce qui est sans doute la solution la plus flexible. Derrière leurs dires, une crainte s’est installée, celle d’être remplacé par les machines, d’être battus par elles alors que l’art appartient à l’humain.
“On ne fait qu’appuyer sur un bouton”.
Cela vous rappelle quelque chose ? À ses débuts, la photographie n’était pas considérée comme un art, car on ne faisait qu’appuyer sur un bouton… Aujourd’hui, on part du postulat que c’est l’humain qui a jugé de prendre la photo à tel endroit avec telle lumière, telle composition et tel sujet afin de répondre à son intention. C’est alors devenu un art.
Dans le processus d’utilisation d’une intelligence artificielle, le créatif va devoir réfléchir sur son intention, puis écrire une instruction cohérente, la développer et l’affiner jusqu’à obtenir une image qu’il utilisera totalement ou partiellement selon son jugement. Personnellement, je retrouve là un processus similaire à n’importe quel créatif qui passerait du temps sur Pinterest, dans les musées ou même en pleine nature à la recherche d’inspiration ou de modèles pour répondre à son intention initiale.
Peut-être est-ce à cause des derniers bonds technologiques, mais ce n’est que récemment que certains créateurs assument pleinement l’intégration d’intelligences artificielles dans leurs processus de création. Ursala V., illustratrice, explique avoir expérimenté Midjourney, et aussi un peu de DALL-E, pour concevoir une bande dessinée (entièrement accessible sur son Twitter). Elle y exprime tant les complications confrontées — à devoir réitérer mois après mois ses expériences — tout comme ses avis positifs envers l’IA.
Est-ce que tout ça serait mieux si je l'avais dessiné à la main ? Peut-être, mais c'est un point discutable parce que je ne l'aurais pas terminé. Je suis fondamentalement paresseuse. - Ursala V.
Jusqu’où pourrions-nous aller avec les IA spécialisées dans l’image ?
L’usage de l’intelligence artificielle moderne offre de nouvelles perspectives jusqu’à alors très expérimentales ou aléatoires. Les graphistes utilisent des outils de détourage automatique perfectionnés, les photographes disposent d’outils de correction d’images intelligents, les scénaristes créent des planches d’intentions sur la base de leurs scénarios ou même la police peut créer un portrait-robot plus aisément ! Les applications quotidiennes sont de plus en plus nombreuses et en constante évolution.
Bien entendue, son utilisation à son lot de dérives comme la falsification de documents ou d’informations, l’usurpation d’identité, des créations dites “négatives” destinées à alimenter des controverses ou présentant un caractère contraire aux bonnes mœurs. Aujourd’hui, aucune limitation ne s’applique et les communautés se retrouvent submergées par du contenu qui devient difficilement discernable du vrai. Se dirigera-t-on vers des restrictions légales ?
Alors, pourquoi ne pas s’aider d’une IA ?
Pour créer ce qu'on leur demande, les intelligences artificielles doivent apprendre d'artistes et de créateurs d’images de chair et d'os. Elles doivent donc se nourrir de ce qui existe. Des problématiques de droit d'auteur et de légitimité de l'existence des créateurs d’image se posent en plus de la peur d’être remplacé par ces dernières.
Cependant, s’inspirer de ce qui nous entoure et des autres fait partie du quotidien d’un créatif. Notre cerveau agit comme une grande base de données avec toutes ses références que l’on construit et déconstruit. L’intelligence artificielle fait pareil, mais plus rapidement, et peut-être même mieux. Tout cela dans le but d’aider la personne qui lui présente des exigences.
À garder en tête : l’IA n’a pas le dernier mot, le créateur l’a.