"Un book de graphiste en ligne avec des galeries ? Mais c'est totalement has-been, mon pauvre ami... Fais plutôt un blog !"

Les IA vont-elles vraiment mettre les artistes au chômage ?

Les IA vont-elles vraiment mettre les artistes au chômage ?

Sujets :
Intelligence Artificielle, Machine Learning, Générateurs d'images, Prompts, Tuto, Graphisme, Arts visuels et création.

Temps de lecture :
2 paninis fromage.

Niveau d'intérêt public :
Passionnant/20

Navigation rapide :


Rarement une avancée technologique n'aura autant agité le public et les médias sur un laps de temps aussi court, avec des centaines d'articles, vidéos, podcasts, sur le sujet des IA.
Si ChatGPT-3 est au coeur des polémiques, les modèles d'IA dédiés à la génération d'images à partir de texte suscitent également de fortes réactions.

En préambule : Attention aux imitations !

Puisque j'en suis à parler de la vitesse fulgurante du phénomène "IA", les fraudeurs n'auront pas mis longtemps à occuper le terrain. On voit ainsi fleurir de nombreux sites et applications qui, au mieux, sont des sous-versions des IA originales, au pire, des applications ou des sites malveillants.

Renseignez-vous donc attentivement avant de cliquer sur le premier truc qui se présentera, juste parce qu'il porte un nom proche de "Chat GTP3", "MidJourney", etc...

2017 : l'année où je prends la première "claque IA"

La claque "IA et Machine Learning", je l'ai reçue en 2017, quand les applications graphiques des IA commençaient déjà à faire frémir la sphère créative, et que j'ai découvert Deep Dream Generator :

deepdreamgenerator.com

La version proposée à l'époque fonctionnait sur le principe de soumettre 2 images de références à l'IA, et de lui demander de les traiter dans un style visuel prédéfini (façon vitraille, à la Van Gogh, en mode psychedelic...).

Voici quelques essais, qui sont assez proches du résultat que je visais, ce qui rend donc cet outil viable dans un workflow quotidien de graphiste :


Un outil que je vais d'ailleurs probablement réutiliser à l'avenir, car relativement bien controlable quand on a compris la formule gagnante :

  • Une image principale passée en noir et blanc, avec de bons contrastes et un sujet visuellement très lisible
  • + Une image secondaire constituée d'éléments qui se répètent et qui vont servir de texture.

Le tout est de judicieusement choisir ses images de départ et de bien les préparer.

Dans le même ordre d'idée, j'avais découvert par le biais de l'excellent Defakator, le site thispersondoesnotexist.com, qui génère des portraits photographiques de personnes... qui n'existent pas !

thispersondoesnotexist.com

Référence : DEFAKATOR - Les gens qui n'existent pas (2020)

DALL-E, MidJourney, Stable Diffusion...

Mais revenons au sujet de cet article : la création artistique est-elle menacée par les IA / générateurs d'images ?

Alors que le débat autour de ChatGPT-3 fait rage, dans la sphère des créatifs, ce sont les IA qui permettent de générer des images, mais aussi de la musique et des vidéos, qui sont un sujet d'inquiétude.

En tant qu'infographiste de métier, illustrateur et musicien à mes heures perdues, il fallait que je me fasse ma propre expertise afin de voir si j'allais réellement devoir envisager une reconvertion professionnelle...

Ressource complémentaire :
IA, machine learning, deep learning : quelles différences ?

Le mieux, avant d'en parler, c'est d'essayer.

Direction instantart.io, un site qui propose de s'essayer à la génération d'images à partir de texte ("text to image"), et qui s'appuie sur le modèle Stable Diffusion (et propose également d'émuler d'autres modèles).

instantart.io

J'ai choisi instantart.io car il permet de tester rapidement et sans aucune restriction (pour le moment). La seule petite contrainte et de devoir s'incrire avec une adresse e-mail avant de pouvoir commencer à s'amuser. À vous de voir.

NOTE : J'ai l'impression que l'expérience proposée par instantart.io est une "version light" de ce que peuvent réellement faire les versions "officielles" des modèles d'IA actuellement populaires. Il est donc très probable que mon impression générale actuelle soit biaisée par le fait que j'utilise une "sous-version" du produit original.

Le "Prompt Art"

Le principe de ces générateurs d'images est de saisir du texte pour décrire ce que l'on voudrait que l'IA nous produise, comme par exemple : "un cheval noir au galop, sur une plage, au clair de lune".

Dans cette descrition, chaque chaîne de mots comprise entre deux virgules constituent ce qu'on appelle un "prompt" (mot anlais, qui peut être traduit ici par "réplique", et donc par extension "souffler une réplique" à l'IA). On parle de "Prompt Art" car, en effet, la manière de rédiger vos prompts va fortement influencer le résultat obtenu.

IMPORTANT :

À titre personnel, je ne considère PAS comme une forme d'art le fait de simplement générer une image avec une IA. Néanmoins, si cela est intégré dans un processus créatif plus large, et dans lequel la production de l'IA ne constitue pas une fin, mais un moyen qui fourni une matière première, qui sera retravaillée, là on peut en discuter.

Dans tous les autres cas, c'est l'IA qui est l'artiste, et PAS l'utilisateur !

Les bases du Prompt

Règle N°1 : "In english, please !"

Tout d'abord, le processus de "Machine Learning" des IA s'alimentant principalement de ce qui est présent sur le web, et le language international du web étant l'anglais, le tout supervisé par des programmeurs vont faire apprendre à l'IA en anglais... Les prompts se font donc de préférence ... en anglais ;)

Règle N°2 : dans le bon ordre

L'ordre de vos prompts est capital. En effet, l'IA va traiter les prompts de manière descendante, en priorisant les tous premiers mots.
Par exemple, si j'écris :

Galopping black horse, on a beach by night, with full moon > J'aurai probablement une image dans laquelle le cheval, montré en entier, occupera presque toute l'image, et avec un peu de chance, j'aurai peut-être une lune en arrière plan.

Mais si je change l'ordre comme ceci :

On a beach by night, with full moon, galopping black horse > J'aurai probablement cette fois-ci un paysage, avec une plage clairement identifiable, une belle pleine lune, et peut-être un cheval au galop, au loin.

Il est donc important de bien réfléchir à ce qui doit être prépondérant dans le résultat que vous souhaitez obtenir.

Vous verrez assez vite que vous allez commencer à "penser en cascades" dans la façon de décrire vos images, ce qui est à la fois ludique et enrichissant (car vous allez devoir entamer, pour chaque image souhaitée, un processus préalable de décomposition de celle-ci avec des mots et une hiérarchie "logique").

Règle N°3 : les Negatives

Je ne sais pas si cette fonctionnalité est présente dans toutes les IA de génération d'images, mais c'est le cas sur Stable Diffusion.

Les Negatives sont, comme leur nom l'indique, l'opposé de vos Prompts. C'est une manière de rendre vos instructions plus précises, en interdisant certains termes ou paramètres à l'IA.

Par exemple, j'ai constaté assez vite que par défaut, Stable Diffusion avait tendance à produire des images très symétriques, et des visages presque toujours de face. Du coup, en lui indiquant les Negatives "symmetry, facing camera, front view, full-face", l'IA a commencé à me produire quelque chose de plus proche de l'image que j'avais en tête, en lui retirant l'option de produire un sujet trop symétrique et présenté de face.

Avec ces 3 règles, ça y est : vous êtes prêts à vous lancer !

Si vous souhaitez en savoir plus, vous trouverez facilement un tas de tutos sur l'art d'affiner vos prompts ;)

Règle N°4 : Le "style"

Et là on arrive déjà sur une utilisation des prompts qui ouvre au débat.

instantart.io permet en effet de voir les créations des autres utilisateurs, et, surtout, les prompts qu'ils ont utilisés, ce qui est très instructif.

En effet, des utilisateurs ont très rapidement compris que les IA ayant été entrainées avec des images provenant du web, il y avait de forte chances que plus un prompt correspond à un terme très spécifique et très présent sur le web, plus l'IA disposera de matière / références pour produire des résultats fins et précis.

Et puisqu'on parle d'art, dans ce cas-là, quoi de mieux que des prompts composés... de noms d'artistes mondialement célèbres, ou mieux encore, du nom de sites web qui recensent des milliers d'oeuvres d'artistes professionnels !

Et c'est ainsi que les prompts de l'infamie ont fait leur apparition, tels que "trending on ArtStation, trending on CGSociety" (deux gros sites de référence au niveau mondial qui héberge les travaux d'artistes professionnels), et d'une manière plus générale, le fait de mentionner le nom d'un artiste et d'une oeuvre précise car, dans ces cas-là, l'IA va clairement fortement s'inspirer/se nourrir de la référence principale, et à ce stade-là, on peut donc déjà se poser des questions en termes de droits de la propriété intellectuelle.

Règle N°5 : Ne PAS utiliser de noms d'artistes ou d'oeuvres d'art !

Conséquence du problème expliqué ci-dessus, si vous voulez vous revendiquer comme "IA artist", il n'y a pas mille solutions : bannissez les prompts faisant référence à des artistes ou oeuvres d'art (sauf si l'idée est de produire une image étant ouvertement un détournement).

Soyer inventif, mixez les techniques, trouvez des manières originales de détourner et vous réapproprier l'environnement créatif proposé par les IA.

Quelques tests...

Ci-dessous une sélection de quelques-uns des tests que j'ai réalisés sur instantart.io.

  • Chaque test a fait l'objet de 2 itérations, mais je n'ai pas forcément toujours présenté ici les deux images générées par chaque essai.
  • J'ai également remis en page les images pour pouvoir y indiquer les prompts utilisés, le moteur d'IA appliqué, et le niveau de "guidance" (de 1 à 12 : plus la valeur est basse, plus l'IA aura de liberté pour interpréter vos prompts, et plus la "guidance" est haute, plus l'IA va devoir respecter vos prompts).

Le constat est sans appel pour moi : dès qu'un prompt fait référence à un artiste, à une oeuvre ou à un site web d'art connu, on obtient des résultats très beaux, mais totalement impersonnels, et qui sont pour ainsi dire... une forme de vol ! Là où ça me semble un peu plus légitime et intéressant, c'est quand on utilise l'IA pour générer des choses simples, avec peu de prompts et aucune référence précise, ou quand on laisse carrément l'IA produire de l'aléatoire avec des prompts n'ayant aucune cohérence.

BONUS : le style minimaliste

Parce que quelque part, le but de tout ça est justement de s'amuser à voir comment l'IA va produire des choses de manière aléatoire, je vous invite aussi à essayer des prompts ultra simples et laconiques, voire-même totalement absurdes, comme par exemple, raconter votre journée...

L'artiste, c'est l'IA.

À ce jour, parmi toutes les images que j'ai pu voir et qui ont été produites avec ces IA, un premier constat s'impose :

Vous aurez beau faire des prompts de malade, l'IA fera toujours un peu ce qu'elle voudra.

Ce que je veux dire par là, c'est qu'arrivé à un certain point, l'IA ne sera pas (pour l'instant) en mesure d'occuper chaque centimètre carré de l'image de la manière dont un artiste / illustrateur / photographe le ferait, et notamment pour une raison essentielle :

Au-delà de la maitrise purement technique, une oeuvre d'art se définit par les intentions que son créateur va y mettre. Par ailleurs, une IA ne pourra jamais remplacer le contrôle complet qu'offre le fait de créer "physiquement" soi-même ses images de A à Z, sans être dépendant d'un outil spécifique.

"Même le créateur d'art numérique le plus hardcore peut toujours faire de l'art avec rien de plus qu'un crayon, ou tout ce qui permet de tracer une marque." (Chris Beatrice)

Le vrai problème...

Encore une fois, 90% de ce que j'ai pu voir produit avec ces IA est certes très joli, mais également très générique. C'est beau, mais... roulement de tambour...

...c'est parce que l'IA s'est fortement appuyée sur des oeuvres pré-existantes et qui lui ont été indiquées dans les premiers prompts !

C'est d'ailleurs peut-être la raison pour laquelle Jason Allen (un artiste qui a récemment gagné un prix à la "Colorado State Fair’s annual art competition" avec une peinture qui a été générée avec MidJourney puis imprimée sur une toile), n'a, si je ne m'abuse, toujours pas dévoilé les prompts qu'il avait utilisés pour aboutir au résultat final...

Dans le débat qui oppose défenseurs et détracteurs des IA génératrices de contenus, et plus particulièrement d'images, un des principaux points de friction se situe autour de l'affirmation suivante :

"Ce n'est qu'un outil. Tout dépend de ce qu'on en fait."

MidJourney, DALL-E, StableDiffusion, etc... ne sont PAS "juste" des outils.

Je vais ici paraphraser en partie l'artiste Chris Beatrice, qui l'a très bien expliqué dans un post Facebook récent (février 2023) :

"Utiliser les IA telles que MidJourney et vous déclarer "artiste" du jour au lendemain, c'est vite oublier que quand vous utilisez les IA, vous ne faites pas VOTRE art, vous faites l'art qui a servi à l'apprentissage de l'IA, ou au mieux, vous faites l'art de l'IA. (...) La raison pour laquelle les utilisateurs de ces IA ne réalisent pas qu'ils ne font pas leur propre art, est due à une petite chose appelée l'effet Dunning-Kruger (un biais cognitif par lequel les moins qualifiés dans un domaine ont tendance à surestimer leur compétence).

Un artiste qui pratique, et qui apprend continuellement depuis des années, est parfaitement conscient de la tonne de choses qu'il ne sait pas sur la création artistique.

(...) À l'opposé, les "artistes IA" n'ont généralement aucune idée de comment cela fonctionne, et n'ont aucune compréhension des processus techniques et théoriques sous-jacents à la création visuelle, musicale, cinématographique, etc...Donc, si ce qui sort d'un système d'IA est une image impressionnante, c'est parce que l'IA, et pas vous, a appris (ou du moins appris à imiter) les principes abstraits de la création artistique en s'appuyant sur le travail d'autres artistes.

Au final, l'IA sait comment créer des images et vous, vous ne le savez toujours pas.

Alors, qui ou quoi est l'"outil ?"

Une société où tout le monde est artiste ?

L'écriture de cet article m'amène à glisser inévitablement sur une des problématiques connectée directement à ce sujet, à savoir la façon dont, au cours des dernières années, la prolifération d'outils numériques donnant accès à la possibilité de créer des visuels, sans avoir besoin d'aucune connaissance technique ou théorique, à fait naître dans l'esprit du public l'idée que tout le monde pouvait faire de la création visuelle "comme un pro".

Attention, je ne sous-entends pas ici qu'il est interdit de vouloir s'adonner au plaisir de créer. Au contraire, j'encourage tout le monde à s'y essayer, et à s'exprimer par ce moyen !

Mais il y a une différence entre pratiquer une activité artistique comme un loisir, et la pratiquer dans un cadre professionnel.

Le problème survient quand cette frontière devient floue.

Canva et compagnie...

Canva est un site de conception graphique en ligne qui connaît un grand succès, notamment grace à la mise à disposition de modèles prédéfinis, et qui vont aider à "harmoniser" le style du document que vous allez produire (une affiche, une présentation, un flyer, etc...).

Le hic, c'est qu'utiliser Canva sans avoir la moindre idée de ce que sont les règles de compositon graphique et typographique, ou encore le principe de hiérachie des informations, par exemple, ne produira PAS un résultat professionnel, ni conçu sur-mesure. Au mieux ça donnera un résultat propre mais très quelconque, au pire (ce qui est généralement le cas), ça donnera un résultat très amateur. Ce type de services en ligne, dont l'argument principal est qu'il n'est plus nécessaire d'être un exert pour réaliser votre site Internet / carte de visite, flyer... / montage vidéo / photos, etc... a énormément dévalorisé les métiers qui y sont liés au cours des dernières années.

Wix pour les sites web, Vistaprint pour les travaux d'impression, les smartphones dernière génération pour la photo et la retouche d'images... L'offre d'outils couvre aujourd'hui presque toutes les disciplines !

Bonne nouvelle !

Il y a là-dedans quelque chose de paradoxalement positif pour les professionnels des arts visuels.

Dans le cadre de mon activité en agence de communication, il m'est arrivé de voir des clients qui pensaient pouvoir faire les choses eux-mêmes (et donc éviter de payer un professionnel pour accomplir le travail), finir par revenir vers nous après s'y être cassé les dents (et avoir perdu du temps et de l'argent).

Je pense que la même chose va se produire avec les IA génératrices d'images.

Personnellement, je ressens déjà une grosse lassitude face au manque d'originalité, de puissance narrative, de capacité à évoquer des choses précises et surtout, avec une intention, de la plupart des images produites avec ces outils.

D'autre part, je n'accorde AUCUNE valeur aux images produites par ce biais, particulièrement quand des "prompts de l'infamie" ont été utilisés.

Et d'ailleurs, puisqu'on parle de "valeur", le fait que sur certains sites (comme NightCafé, par exemple), les images produites sont directement générées en tant que NFT (Non Fungible Token), qui viennent ainsi alimenter le "bad market" des NFT me paraît un signe assez révélateur de la toxicité de la production d'images par IA.

Il est indéniable que l'écosystème de la création artistique professionnelle va continuer à subir de profondes mutations, mais au final, c'est probablement le public qui tranchera la question.

Les créatifs ont toujours su rebondir et s'adapter, c'est d'ailleurs le propre de l'artiste que de savoir s'emparer de son époque est d'essayer d'en orienter la direction à travers son art.

Restera tout de même à voir comment la législation va se positionner dans les années à venir par rapport à ces technologies.

Dernières réflexions sur le sujet...

Le calcul des rendus : un problème de taille et pourtant invisible dans le débat public !

Il convient ici d'appuyer sur "pause", et de rappeler que derrière chaque service dématérialisé, il y a des serveurs informatiques qui tournent non-stop. Quand vous allez générer une image avec une IA, elle va devoir la "calculer". C'est le fameux "temps de rendu", bien connu de ceux qui pratique la 3D, la post-prod, la vidéo ou la MAO...

Vous savez, c'est ce moment inoubliable pendant lequel vous regarder fixement une barre de progression, qui va monter d'abord très rapidement, puis qui va rester bloquée à 99% pendant 3 heures...

Et donc, derrière cette bonne blague, ce sont des milliers de serveurs qui tournent à plein régime. Donc de l'énergie et des ressources consommées, etc... Bref, vraiment pas top-top sur le plan "éco-responsable".

Hyper GIGA BONUS : Le goût d'écrire !

Ah oui, jallais oublier un point qui me paraît non négligeable, et qui permet de conclure sur une note positive, c'est que tous ces outils vont peut-être redonner au grand public le goût de l'écriture...

Ce serait bien ça, non ?


Compléments, ressources à consulter...

Merci à Guigui le Gentil pour ses apports sur ce sujet (statut des artistes indépendants, AGESSA, polémiques artistes VS IA...).

En complément, je vous invite à écouter l'excellent podcast de "C'est toi la Radio" animé par Mara Vega, dans lequel l'auteurice Magali Villeneuve livre un très bon état des lieux de la situation des artistes, et du public, face à "la révolution IA" :

Écouter le podcast "Artistes, auteurs, et IA" (Janvier 2023)


POUR ALLER PLUS LOIN

Comprendre pourquoi les crypto-monnaies, et plus particulièrement les NFT (tels qu'utilisés actuellement) sont une MAUVAISE chose :

https://fstoppers.com/fine-art/nfts-are-terrible-6-reasons-why-should-avoid-them-599287

 

https://www.diversetechgeek.com/why-nft-collectibles-bad-thing/


Auteur : ©Solynk - Nicolas-Thonney - 2023