J’aimerais aborder dans cet article le sujet de l’immersion sous un angle différent (d’ici) : celui des sciences cognitives. Je vais vous parler de la théorie de l’embodiement (déjà évoquée ici), et de ses possibles connections avec l’immersion et la façon dont le MJ pourra faire ses descriptions et interagir avec les joueurs.
Définition
Qu’est-ce que la théorie de l’embodiement ? « Embodied cognition », que l’on pourrait traduire par « la cognition incarnée » s’intéresse à comment le fait d’avoir un corps physique façonne nos capacités cognitives. Je ne vais pas me lancer dans un article précis et sourcé qui ennuierait tout le monde, et surtout qui me demanderait trop de travail 🙂 ! Vous pourrez faire vos propres recherches si le sujet vous intéresse. Je vais plutôt donner quelques exemples qui illustrent l’idée générale.
On retrouve selon moi certains précurseurs de cette idée chez Piaget et ses théories de l’apprentissage, qui stipulent que la connaissance humaine prend source dans les interactions sensori-motrices de l’enfant avec le monde. En gros, les concepts abstraits d’espace, de temps, de nombre, les lois élémentaires de la physique, tout cela s’appuie sur des connaissances antérieures que l’enfant acquiert en manipulant ses jouets et en explorant son environnement.
La théorie de l’embodiement va plus loin, puisque ce n’est pas seulement la connaissance, mais les processus cognitifs eux-mêmes (donc notre pensée) qui reposent sur des schémas sensori-moteurs. Alors que dans les approches plus classiques, la cognition consiste en la manipulation de représentations mentales indépendantes du corps (un peu comme un programme informatique manipule des données). Je ne connais pas trop l’état de l’art en sciences cognitives, mais je sais qu’en intelligence artificielle et en robotique, l’embodiement change pas mal la façon d’appréhender le problème de l’intelligence, mais je digresse…
Prenons quelques exemples illustrant l’idée générale :
Rotation mentale
Dans ce type d’expérience, on présente aux sujets des paires d’images et on leur demande de dire s’il s’agit ou non des mêmes objets. Et on chronomètre le temps qu’ils mettent à répondre. Ce qui est intéressant, c’est que le temps de réponse est exactement proportionnel à la différence angulaire entre les deux objets, ce qui suggère l’idée que l’esprit effectue une rotation « physique » des objets, car si le cerveau effectuait des opérations symboliques à la manière d’un ordinateur, le temps de réponse devrait être le même quelle que soit la différence d’angle.
Compréhension du langage
La compréhension du langage n’a a priori rien à voir avec le corps, pourtant :
Après avoir trempé son pied dans l’eau, Faboo l’essuie avec sa serviette.
Après avoir trempé son pied dans l’eau, Faboo l’essuie avec ses lunettes.
Il y a un truc qui cloche dans la deuxième phrase. S’essuyer avec des lunettes ne marche pas bien : en général ce sont plutôt les lunettes qu’on essuie avec quelque chose. Oui mais comment votre cerveau détecte-t-il cette incohérence : par une analyse grammaticale et sémantique de la phrase, ou par une simulation mentale de votre corps en train d’effectuer l’action suggérée ? Ou bien si je vous dis :
Tous les hommes sont mortels, Socrate est un homme. Socrate est-il mortel ?
Par quel processus répondez-vous à la question ? Vous appliquez une règle d’inférence logique, ou bien vous vous représentez mentalement un espace des hommes mortels (un cercle), et Socrate comme un point à l’intérieur de cet espace ? Comment connaissez-vous la notion « être à l’intérieur de » ? Ne faut-il pas posséder un corps physique pour vraiment comprendre cette notion ?
Vision
Le processus de vision est un processus sensori-moteur complexe, plus proche en réalité d’un processus tactile, c’est-à-dire qu’on utilise nos yeux un peu comme l’aveugle utilise ses doigts pour reconnaître un objet ou un visage. Nous avons l’impression de percevoir notre environnement comme un tout stable et cohérent, alors que la rétine ne capture avec acuité qu’une toute petite partie de notre champ de vision : si vous fixez cette lettre « F« , vous distinguerez à peine les mots environnants. En réalité, nos yeux scannent très rapidement l’environnement de manière saccadée en s’arrêtant sur les endroits saillants (contrastés, brillants, …) ou bien de manière à confirmer des hypothèses sur l’objet perçu (par exemple après avoir reconnu la tête du chameau, on ira vérifier si le dos comporte une ou deux bosses). Imaginez que vous fassiez bouger une caméra à cette vitesse et que vous regardiez le film après… Mais notre cerveau reconstitue une image cohérente à partir de tout ça 🙂 .
Au-delà de ces exemples, il faut savoir que des études sérieuses ont été menées, qui indiquent que beaucoup de processus mentaux (mémoire, représentation, empathie, raisonnement moral, etc.) s’expliquent avec élégance dans le cadre théorique de l’embodiement. Les neurosciences viennent également appuyer cette théorie, notamment avec la découverte des neurones miroirs.
Neurones miroirs
Les neurones miroirs sont une catégorie de neurones du cerveau qui présentent une activité aussi bien lorsqu’un individu (humain ou animal) exécute une action que lorsqu’il observe un autre individu (en particulier de son espèce) exécuter la même action, ou même lorsqu’il imagine une telle action, d’où le terme miroir.
Wikipedia
La particularité de ces neurones tient au fait qu’ils déchargent des potentiels d’action pendant que l’individu exécute un mouvement (c’est le cas pour la plupart des neurones du cortex moteur et prémoteur) mais aussi lorsqu’il est immobile et voit (ou même entend) une action similaire effectuée par un autre individu, voire seulement quand il pense que ce dernier va effectuer cette action.
Wikipedia
Ce qui suggère que la reconnaissance d’une action (processus cognitif complexe) utiliserait (au moins en partie) les mêmes réseaux neuronaux que ceux utilisés pour planifier/exécuter cette même action.
Oui, et alors ?
Que peut-on tirer comme enseignements de tout ça pour nos parties ? Précédemment dans cet article on nous expliquait comment certaines techniques cinématographiques exploitent ce lien entre embodiement et immersion, notamment à travers les résonances motrices.
Le principe des résonances motrices nécessite une boucle action-perception en temps réel. Cela est possible au cinéma (le mouvement de la caméra change immédiatement l’image), ou dans les jeux vidéos (l’action sur la manette se répercute instantanément à l’écran). Mais c’est plus difficile à mettre en œuvre en JDR, car le délai entre action et réaction est allongé par l’usage de la parole. Mais est-ce que ça ne peut pas quand même marcher un petit peu 🙂 ?
Les boucles sensori-motrices
Dans certaines scènes, on pourra mettre en place une boucle PJ-action / MJ-description aussi fluide que possible, dans laquelle chaque action du PJ provoquera un retour immédiat d’information sensorielle par le MJ. Prenons par exemple une petite scène d’exploration, avec les « questions-réponses » classiques :
– Ok donc tu es devant la maison. Aucune lumière aux fenêtres. La porte d’entrée est légèrement ouverte, en t’approchant un peu, tu distingues des marques d’effraction. Une odeur de moisi émane de l’intérieur. Que fais-tu ?
– Je sors mon arme et je vérifie que je suis bien seul : j’observe les environs, j’écoute. Après j’entre prudemment et je referme la porte derrière moi.. [jet] [jet]
– Tu ne vois rien de spécial aux alentours, à part les arbres qui ondulent au gré du vent dans l’obscurité. Aucun bruit venant de la maison. Tu entres prudemment, et te retrouves dans un couloir au fond duquel tu aperçois vaguement des portes. Tu refermes la porte, et te retrouves dans l’obscurité.
– Je me dirige à tâtons vers une des portes.
– Ok, en marchant dans le couloir, à mi-chemin, tu mets le pied dans un truc poisseux. Tu n’arrives pas à voir ce que c’est.
– J’allume une allumette.
– Ça marche pas ! Avec la pluie, les allumettes ont dû prendre l’eau. Tu en prends une autre. Ça fonctionne ! On dirait du sang… Alors que tu contemples ta semelle, tu entends un grincement au fond du couloir, et là… tu vois une silhouette qui marche dans ta direction, un couteau de cuisine à la main !
Maintenant la même scène, en mode « boucle sensori-motrice ». Le dialogue devra être aussi fluide que possible, en utilisant des questions-réponses courtes et précises :
– Ok, tu es face à la maison.
– Il y a de la lumière ?
– Non, mais la porte est entrouverte.
– Je m’approche.
– Tu es à deux mètres de la porte. Tu vois des marques d’effraction.
– Je jette un œil autour de moi. [jet]
– Rien que les arbres sombres qui ondulent au gré du vent.
– Je continue d’approcher prudemment.
– Ok, une odeur de moisi semble émaner de l’intérieur.
– J’entends quelque chose ? [jet]
– Non, tout semble calme.
– Je pousse doucement la porte, revolver prêt à tirer.
– Hiiiiinnn… La porte grince.
– Je continue, je rentre.
– Tu passes le seuil. Devant toi, un couloir sombre.
– Pas de portes ?
– Si, tu en distingues vaguement au fond.
– Je referme la porte derrière moi.
– Tu te retrouves dans le noir.
– Pas grave. Je me dirige vers une des portes.
– Ok, tu fais quelques pas… Sprouitch !
– C’est quoi ?
– Tu as marché dans un truc poisseux.
– Je regarde ce que c’est.
– Tu es dans le noir.
– J’allume une allumette.
– Pas de chance, elle a pris l’humidité.
– J’en allume une autre !
– Tchhhh ! Tu éclaires le sol, on dirait du sang et… [silence]
– Quoi ?
– Un grincement au fond du couloir !
– Je lève la tête !
– Tu n’es plus tout seul dans ce couloir…
– Hein ! Comment ca !?
– Il y a une silhouette…
– Heu…
– à quelques pas de toi ! Elle marche vers toi, un couteau à la main !
L’avantage de la première approche, c’est que le MJ transmet toutes les informations qu’il souhaite au joueur, alors que dans la deuxième, si le joueur ne pose pas les bonnes questions, il risque de passer à côté de certains détails. Accessoirement, la deuxième méthode permet d’éviter que le MJ répète ce que le joueur vient de dire, genre « donc tu fais ceci et… », « en faisant cela tu… », « au moment où tu fais ça… », etc.
Mais plus fondamentalement, le joueur est plus passif dans la première approche. Avec la deuxième approche, plutôt que de laisser le MJ faire la description, c’est le joueur qui balaye la scène avec son œil imaginaire et à travers les actions de son PJ. Le joueur participe de manière active à la visualisation de la scène, et contrôle son PJ au plus près. Il est donc plus impliqué dans l’exploration de son environnement, enfin il me semble. Cela me parait donc plus immersif. Dites-moi ce que vous en pensez en commentaire.
Utilisation des maps : 2D3P vs. 3D1P
Les maps sont très utiles pour les combats tactiques ou les combats dans des jeux tactiques. J’étais moi-même très friand de maps pour le moindre endroit que les PJ pourraient visiter, mais j’en suis revenu. Pas que ça soit contre-immersif en soi, mais plutôt que ça produit une immersion en « 2D à la 3ème personne« , qui n’est pas compatible avec le type d’expérience que je veux faire vivre à mes joueurs. Par exemple, si les PJ sont poursuivis par un monstre dans une forêt, je veux qu’ils ressentent les obstacles qui ralentissent leur course, les branches dans les yeux, la bestiole juste derrière eux qui rugit en arrachant les arbres, etc.
Il me semble que la map va venir ruiner toutes ces sensations « 3D à la 1ère personne« , ou en tout cas en briser la continuité. Est-ce pour autant moins immersif que la 2D1P ? Je ne sais pas, pas forcément. De toute façon, on peut passer d’un mode à l’autre assez facilement me semble-t-il.
Le corps comme cadre de référence
Si vous décrivez un manoir où se rendent les PJ, le point de vue que vous utilisez pour vos descriptions n’est pas très important. Vous pourrez dire que son aile gauche a été détruite par un incendie, qu’il y a un verger à l’arrière et une magnifique fontaine à mi-chemin entre le portail d’entrée et le manoir. Mais lorsqu’il s’agit du PJ en action, je préfère donner l’information au joueur avec le corps du PJ comme cadre de référence. Par exemple pour localiser les éléments environnants (derrière toi, deux pas sur ta gauche, etc.), mais aussi pour évaluer les chances de succès d’une action donnée. Par exemple :
– Est-ce que je peux sauter sur le toit adjacent ?
–Il se situe à environ 4 mètres
– C’est chaud, mais en prenant de l’élan c’est jouable. Au pire, tu penses pouvoir t’agripper au rebord et te hisser sur le toit.
ou bien :
– Physiquement, il est balèze le gars ?
–Il a 95 en Force, 1d6 bd.
– Il te dépasse d’une tête et doit peser deux fois ton poids. Ses bras sont comme tes cuisses. Tu te dis que s’il t’en colle une, tu vas t’envoler !
ou encore :
– Combien de dégâts si je chute ?
–2D6 si tu réussi ton jet d’Athlétisme, 3D6 sinon.
– Ça fait haut ! En admettant que tu retombes sur tes pieds, tu sens que tu pourrais y laisser une cheville…
Parfois le joueur voudra des chiffres pour pouvoir prendre sa décision (les points de dégâts pour la chute par exemple). Donnez-lui afin qu’il puisse évaluer les risques. Mais donnez-lui aussi l’information de manière « corporelle » afin de lui faire ressentir physiquement la situation et à quoi il s’expose 😈 .
Le corps et les émotions
Les émotions du PJ résultent de sa réaction face à un événement ou une situation donnés de l’histoire. Le joueur en a une compréhension intellectuelle / empathique, à partir de sa propre expérience, mais les émotions donnent aussi lieu à des effets physiques sur le corps. Il a été observé expérimentalement que ces effets bassement physiques influencent notre jugement, voire notre façon d’interpréter une situation donnée. Par exemple, le stress diminue notre capacité à l’auto-critique (métacognition), car en situation de danger imminent, il est préférable de ne pas trop réfléchir et d’agir rapidement.
Décrire les symptômes physiques peut-il favoriser le ressenti des émotions associées (grâce aux neurones miroirs) ? Dites-moi ce que vous en pensez en commentaire. Quelques exemples :
- La tristesse, ou même une joie intense provoquent une boule dans l’estomac ou la gorge. Les premières larmes viennent remplir les yeux et troubler la vue, puis coulent sur nos joues après qu’un battement de paupières les en ait chassées. Le goût salé des larmes nous rappelle à notre enfance. Une fois l’abcès crevé, cette boule au ventre explose dans un flot de larmes libérateur.
- La colère, le stress, la peur, entraîneront aussi une boule anxiogène à l’estomac ou la gorge, une accélération du rythme cardiaque, le cœur qui tape violemment dans la poitrine, au point que la respiration en devient difficile. Frissons sur l’échine, mains moites, yeux exorbités, champ visuel rétréci, certains muscles (mâchoire ?) qui se contractent involontairement, et que sais-je encore !
- Le choc psychologique sera abasourdissant, peut-être une sensation de nausée, de vertige. Un sifflement dans les oreilles. Des mouvements involontaires (balbutiements, repli fœtal, incontinence). Les jambes sont faibles, flageolantes, il faudra s’agripper à quelqu’un ou quelque chose pour ne pas tomber, ou mettre un genou à terre, voire deux, pour laisser à l’esprit, au cerveau (et donc au corps) le temps de retrouver leur cohérence.
- La joie provoquera une sensation de légèreté et… Bon en fait la joie c’est plutôt rare à l’Appel de Cthulhu… on parlera plutôt du soulagement ressenti par contraste avec les émotions négatives susmentionnées 😈 .
Conclusion
Voilà, je voulais vous présenter cette théorie de l’embodiement, et partager mes réflexions à ce sujet par rapport à l’immersion en JDR. Je vais de mon côté continuer de creuser le sujet. Qu’en pensez-vous ? Voyez-vous d’autres possibilités, d’autres connexions ? 🙂