Show cover
Couverture de Les Terrains du cyberharcèlement et de la haine en ligne (Edul, 2025) Show/hide cover

Chapitre 2

« Arrêtez de me péter en deux ! »

Cyberviolence et émotions dans la diffusion de jeux vidéo sur Twitch

Depuis une dizaine d’années, la diffusion de parties de jeux vidéo via des plateformes de webdiffusion (live streaming) se popularise. Si la pratique consistant à être spectateur ou spectatrice d’une diffusion en direct devient ordinaire, sa production reste une pratique partagée par une infime minorité de vidéastes (Ter Minassian et al., 2021, p. 115). Il n’est pas rare que ces vidéastes voient leur performance entachée par le comportement de participantes et de participants qui empruntent diverses formes de transgression, voire de cyberviolence, dans l’interface de dialogue (chat).

Ces interventions participent à une forme de violence ordinaire dans les pratiques ludiques que de nombreux chercheurs et chercheuses ont documentée, notamment Kishonna L. Gray (2013 ; Gray et al., 2017). Selon elle, l’élite dominante des cultures vidéoludiques, très majoritairement masculine et blanche, perpétuerait une « violence symbolique contre les corps marginalisés, notamment les femmes [et les personnes racisées]. En tant que tels, ces petits actes, parfois négligeables, renforcent et maintiennent les frontières cachées et invisibles des hiérarchies sexuées et racialisées » (Gray et al., 2017, notre traduction). De ce fait, notre contribution s’intéresse à celles et ceux qui subissent des agressions et non pas aux agresseurs. Plus spécifiquement, elle porte sur des exemples d’interactions où deux vidéastes de Suisse romande, qui jouent en direct et en public, ont eu à subir, pour l’une des attaques sexistes, pour l’autre des allusions racistes de la part d’internautes assistant à leur performance. Le chapitre propose une description des stratégies déployées par les vidéastes pour y faire face en cours de webdiffusion, en particulier par le travail des émotions. Partant de là, en suivant les travaux de Louis Quéré (2018 ; 2021), qui s’opposent à ceux de Arlie Russell Hochschild (2003 ; 2012) à ce sujet, nous considérons que les émotions sont au service de l’achèvement des activités engagées dans le traitement d’une situation et proposons de décrire sous quelles formes elles y participent.

D’un point de vue méthodologique, notre analyse mobilise une sociologie interactionniste, qui s’intéresse à la fragilité de toute situation, croisée avec une sociologie pragmatiste. Les outils de ce deuxième courant permettent de documenter comment des activités et des actes de discours se comprennent comme « autant d’accomplissements, pratiques et situés » (Quéré et Terzi, 2015). Le corpus de notre analyse est composé de vidéos produites en situation de webdiffusion en direct.

Le chapitre répond à deux objectifs. Premièrement, il s’agit de détailler les propriétés situationnelles de la diffusion en direct d’une partie de jeu vidéo sur la plateforme de streamingTwitch. Deuxièmement, cette opération de description est doublée d’une analyse du travail que font les émotions dans l’organisation de l’expérience et le traitement des situations tels que déployés par ces vidéastes, pour gérer le compagnonnage fragile qui les lie à leur public dans des situations de cyberviolence.

Transgression, agression, cyberviolence : les émotions saisies par le pragmatisme

Notre analyse s’appuie sur la littérature consacrée à la transgression dans et par le jeu, entendue comme le « fait d’enfreindre les limites ou le cadre définis par convention » (Jørgensen et Karlsen, 2019, p. 1, notre traduction). Les recherches s’accordent à dire que les « rencontres de jeu » (gaming encounters ; Goffman, 1961) sont précaires, dans le sens où elles « doivent se poursuivre de manière ininterrompue, tout en étant constamment remises en question et mises en péril afin de rester engageantes » (Linderoth et Mortensen, 2015, p. 6, notre traduction). Les comportements transgressifs possèdent de ce fait un statut particulier dans les rencontres de jeu, parce qu’ils viennent mettre en tension le contexte ludique. À titre d’exemples, les actions de sabotage (griefing), les insultes et les comportements qui s’apparentent à des pratiques toxiques sont monnaie courante dans ces rencontres, qu’elles se fassent en ligne ou en co-présence (Consalvo, 2012 ; Gray, 2013).

Les interactions transgressives peuvent également être le fait de spectateurs ou de spectatrices de webdiffusion, recourant à diverses formes de trolling. Une définition séminale du terme est proposée par Anne Revillard, dans l’une des premières recherches francophones consacrées aux interactions sur Internet, en l’occurrence sur les forums de discussion :

Le troll est quelqu’un qui […] participe aux débats dans le but de perturber ceux-ci. Il se fait passer pour un participant honnête et en profite pour donner de faux conseils, ou pour se moquer insidieusement des autres membres, à travers des messages provocateurs. Son but est d’être pris au sérieux, pour que des débats se lancent autour de ses interventions. [Revillard, 2000, p. 113]

Si les usages et les lieux du trolling ont depuis évolué et se sont largement diversifiés, nous observons une constante dans le fait de vouloir faire dérailler l’interaction de son cours. Dans un précédent texte, nous avons formulé que « l’intentionnalité communicationnelle des trolls est de produire des énoncés ou des actions qui sont inappropriés aux situations et aux circonstances pour lesquelles ils ont été conçus » (Perret, 2021, p. 320).

Ces différents comportements participent à ce que d’autres nomment la cyberviolence, à savoir des actes de violence exercés « par le biais d’un outil numérique » (Stassin, 2019, p. 47). Elle peut prendre plusieurs formes. On notera parmi celles-ci l’attaque vulgaire (trash-talking), l’emploi d’énoncés potentiellement « inflammables » visant à susciter l’ire d’autrui (flaming) (Cook et al., 2019, p. 295), ainsi que le défi (challenging) ciblant soit des énoncés, soit l’autorité de la personne incriminée (Paakki et al., 2021, p. 444‑446) dans le but de lui faire perdre la « face » (Goffman, 1974). Les internautes confrontés à ce type de transgression doivent alors trouver un moyen de « rétablir l’équilibre rituel » de l’interaction (1974) pour assurer sa continuation, notamment en adoptant des « stratégies adaptatives »1 (Stassin, 2019, p. 42). Enfin, la cyberviolence confine au cyberharcèlement dès lors que les attaques se font de manière répétée, anonymement, et qu’il y a un « déséquilibre des forces [et une] relation asymétrique entre harcelé et harceleur » (p. 94).

Partant de là, c’est surtout le travail des émotions des personnes qui diffusent des parties de jeux vidéo, tout en subissant des agressions, qui nous intéresse. Celui-ci peut se comprendre comme le travail « que font les émotions dans l’organisation de l’expérience et le traitement des situations » (Quéré, 2021, p. 75). Ainsi, l’émotion est « une force de sélection et de composition des éléments pertinents pour son développement continu, orienté vers un point final » (p. 116). John Dewey emploie le terme de « travail » pour caractériser l’opérativité de l’émotion :

L’énergie émotionnelle […] réalise un vrai travail ; elle accomplit quelque chose. Elle évoque, assemble, accepte, ou rejette souvenirs, images, observations, et les incorpore dans un tout de part en part harmonisé par un même sentiment émotionnel immédiat. En résulte un objet complètement unifié dans sa différence. [Dewey, 2010, p. 190]

L. Quéré précise que ce travail est « réalisé par les émotions elles-mêmes, et non pas par le sujet qui a à gérer ses émotions et leur expression, voire à les cacher et les supprimer » (2021, p. 114). En ce sens, cette conception du travail des émotions s’oppose à celle de A. R. Hochschild (2003 ; 2012), qui emploie davantage une approche normativiste, justifiant la genèse des émotions par une conformité à des règles ou à des normes : « Ce travail requiert d’un individu qu’il déclenche ou refoule une émotion dans le but de maintenir extérieurement l’apparence attendue, apparence qui doit produire sur les autres l’état d’esprit adéquat » (Hochschild, 2012, p. 27). De plus, A. R. Hochschild distingue le travail des émotions (emotion work) du travail émotionnel (emotional labor), le premier étant une affaire de gestion de ses émotions par le sujet en fonction de « règles de sentiments » (2003) et ayant valeur d’usage ; le second désignant la « manière de gérer ses émotions pour se donner une apparence physique correspondant à ce qui est attendu socialement […] et [ayant] donc une valeur d’échange » (2012, p. 27). La notion de travail émotionnel de A. R. Hochschild diffère de celle de J. Dewey, la première renvoyant « à la problématique […] de la gestion individuelle des émotions dans l’interaction » (Quéré, 2018, p. 58), la seconde au travail que font les émotions dans la situation. C’est donc bien la perspective de J. Dewey, prolongée par L. Quéré, que nous retenons pour l’analyse.

D’un vidéaste l’autre

Les deux vidéastes2 qui nous intéressent présentent des caractéristiques fort différentes, tant en matière de genre et d’origine ethnique que de degré d’engagement dans l’activité de webdiffusion, ce qui génère des activités de transgression distinctes à leur égard.

Pixelle est une jeune femme d’origine caucasienne, née au début des années 1990, aux longs cheveux teints en rouge vif, qui joue en ligne et diffuse des streams de manière régulière de 2014 à 2016 en amateur. Fréquemment confrontée à des remarques et sollicitations sexuées dans le chat de Twitch, qui mettent à mal le « contrat de communication » (Verón, 1985) complice et ludique qu’elle s’est efforcée d’établir avec sa communauté, elle arrête son activité à la suite du piratage de sa webcam par un internaute. Dans un dernier message publié publiquement sur sa page Facebook en mai 2016, elle exprime son dégoût face à ce type d’acte malveillant, et suggère à son public de « ne fai[re] confiance à personne sur Internet ». Sa présence sur le Web en tant que streameuse s’interrompt après cette publication.

Kinstaar est un jeune homme d’origine vietnamienne, né en 2000, qui joue en tant que professionnel depuis 2018 au sein de l’équipe française Solary3. En octobre 2020, après deux ans d’une intense activité qui lui a permis de se faire un nom dans le monde du e-sport, en particulier dans le jeu Fortnite (Epic Games, 2017), il annonce interrompre son activité en raison de ce qu’il décrit comme du harcèlement raciste répété subi sur les réseaux sociaux numériques, en premier lieu sur X (anciennement Twitter)4. Il reprend pourtant rapidement sa pratique de jeu et de streaming à titre individuel et maintient son activité jusqu’en janvier 2023, avant d’annoncer son retrait de la compétition5.

Ces deux vidéastes ont ainsi en commun d’avoir fait face tous deux à de la cyberviolence durant leurs retransmissions, mais également d’avoir subi du cyberharcèlement en dehors de leur activité de webdiffusion. Leurs activités respectives en matière de streaming sont néanmoins très différentes, tant par leur « style de jeu » (Boutet, 2012) que par la taille de leurs communautés de spectateurs. Pixelle en cumulait quelque 200 à 300 par diffusion, tandis que Kinstaar jouissait d’une popularité plus grande, avec parfois des milliers de spectateurs.

La rencontre de jeu – propriétés situationnelles

La webdiffusion, qui plus est de jeux vidéo, est une production complexe, selon T. L. Taylor (2018, p. 73‑80), qui présente des « propriétés situationnelles » pouvant être décrites6 (Goffman, 2013). Une de ces premières propriétés revient à la comprendre comme une « rencontre de jeu » (Goffman, 1961), qui comporte une « interaction focalisée » entre des participants se rassemblant « ouvertement et [s’orientant] vers un foyer […] d’attention visuelle » (Goffman, 2013, p. 78). Ce faisant, la webdiffusion est une interaction multimodale entre la personne qui diffuse et les participants au stream (soit les autres personnes qui jouent ou regardent) (Recktenwald, 2017). La première a généralement une « position exposée » (Goffman, 2013, p. 109), ce qui suppose qu’elle « doit se tenir prêt[e] à être approché[e] par des inconnus » (p. 109).

Environnement communicationnel

L’environnement communicationnel de Twitch joue un rôle important dans l’« engagement » des vidéastes, au sens d’Erving Goffman (2013), dans la diffusion de leurs parties pour un public. Plus particulièrement, les conditions physiques et matérielles participent de ce qui peut être considéré, durant le stream, comme un engagement principal (une activité qui retient l’essentiel des efforts des vidéastes) ou latéral (une activité qui ne retient qu’une petite partie de leurs efforts).

Comme le montre la figure 1 ci-dessous, au centre de la page Web se trouve la diffusion vidéo. Elle contient d’une part la séquence de jeu (video stream) et l’enregistrement intégré de la webcam d’autre part. Sur la droite se trouve l’écran de chat de Twitch7. Le public peut y communiquer par messages écrits, tout en employant des émoticônes spécifiques à la plateforme. Il n’y a pas de limite maximale au nombre de personnes s’exprimant dans un chat. Certaines chaînes sont très actives et disposent de milliers de spectateurs, ce qui signifie que les messages ne sont parfois visibles qu’entre deux et trois secondes avant d’être évincés par de nouveaux messages.

Schéma dessiné rindiquant sur toute la largeur gauche la barre de navigation, en haut le nom de la diffusion en court, au centre le flux vidéo de Twitch (avec la rediffusion de ce qui est filmé ainsi qu'un emplacement pour la webcam), et à droite le flux des messages sur le chat.

Source : Recktenwald, 2017, p. 70

De plus, il est fréquent que les vidéastes disposent d’une configuration avec deux écrans (Recktenwald, 2017), où l’écran principal est dédié au jeu tandis que le chat est affiché sur un écran secondaire. Ce dernier est disposé à proximité de l’écran principal, mais nécessite que les vidéastes réorientent leur regard ou leur corps pour se focaliser sur l’un ou l’autre des écrans (p. 71). Ce faisant, l’orientation de leur corps rend compte de leur attention changeante. Ainsi, comme l’illustre la figure 2, Pixelle fait face à sa webcam et au jeu sur son écran principal, et doit se tourner de 45° pour voir le chat de Twitch. Kinstaar, quant à lui, doit se tourner de 90° pour voir le chat sur un écran secondaire, sur lequel est posée la webcam, car il est majoritairement orienté vers ce qui se passe sur l’écran principal, c’est-à-dire dans le jeu.

Voir texte.

Source : Michael Perret, Thomas Jammet et Pierre-Yves Moret

Selon Daniel Recktenwald (2017), le contenu des webdiffusions peut être retranscrit dans un tableau contenant les énoncés des vidéastes ainsi que leurs « agissements corporels » (embodied conduct), les messages écrits dans le chat ainsi que la saisie des événements dans le jeu. Une telle retranscription renseigne sur le « niveau d’engagement des joueurs dans le jeu, mais aussi avec leur environnement » (Ter Minassian et al., 2021, p. 133). En appliquant cette méthode au cas de Pixelle, la figure 3 consigne tout à la fois un extrait des événements dans le jeu Grand Theft Auto V (Rockstar Games, 2013) et dans le chat du jeu, les événements qui se produisent sur la webcam et les énoncés de la joueuse. Nous proposons de signifier par deux pictogrammes l’objet de focalisation de la vidéaste (symbolisé par le symbole d’œil) et ce à propos de quoi elle produit un commentaire oral (symbolisé par le symbole de phylactère).

Voir texte.

Source : Michael Perret, Thomas Jammet et Pierre-Yves Moret

Dans l’extrait ci-dessus, la vidéaste passe d’une attention au chat (répondant à certains commentaires) à la résultante des actions dans le jeu, où d’autres joueurs détruisent sa voiture pendant une course automobile. Elle réagit alors à la mort de son personnage en criant : « Arrêtez de me péter en deux ! ». Cette réaction est effectuée sur un mode « hyperbidimensionnel » (Barnabé, 2022), qui caractérise une « relation ambivalente, mi-sérieuse mi-ironique, avec ce qu’elle fait et ce qu’elle dit, dans le jeu et avec son public, [inscrivant] ses activités dans un deuxième degré permanent » (Perret, 2021, p. 272).

L’environnement communicationnel de la webdiffusion sur Twitch ne saurait se défaire du fait que celle-ci se conçoit comme une expérience pratique « bavarde » (Coavoux et Roques, 2020), à savoir qu’elle doit atteindre les exigences d’intérêt du public tout en la distinguant d’autres formes d’« être au jeu » plus silencieuses.

La personne qui streame est tenue d’effectuer une performance vidéoludique et scénique digne d’être regardée (Brouard, 2020). Cela suppose qu’elle comporte une dimension spectatorielle, d’une part dans ce qui est joué à l’écran (playability) d’autre part, dans ce qui mérite d’être raconté (tellability ; Sacks, 1992, p. 779). T. L. Taylor (2018) observe en effet que les actions qui se passent dans le jeu sont généralement accompagnées d’un commentaire de la vidéaste, qui consiste à énoncer à voix haute son processus de pensée alors qu’elle interagit avec le système de jeu.

Styles de jeu et interactions

Un autre aspect à prendre en compte est celui des « styles de jeu » distincts (Boutet, 2012) des deux vidéastes et de leur « attitude ludique » différenciée (Genvo, 2013). Non seulement il et elle ne jouent pas aux mêmes jeux, mais Pixelle affronte seule des concurrents tandis que Kinstaar évolue en équipe dans des jeux multijoueurs. Pixelle n’accorde qu’une importance sommaire à sa performance vidéoludique, qu’elle méjuge souvent : elle reconnaît elle-même, durant les parties qu’elle diffuse, vouloir jouer pour le fun ainsi que pour l’interaction et la complicité avec son public. En conséquence, elle s’intéresse fortement à ce qui se passe dans le chat de Twitch lors de ses sessions de webdiffusion. À l’inverse, Kinstaar accorde une grande importance à sa performance de e-sport et semble maîtriser son jeu, prodiguant à maintes reprises des conseils à ses coéquipiers. Sa focalisation sur ce qui se passe dans le jeu lui laisse peu de temps pour jeter un œil au chat de ses diffusions. Il n’y prête attention qu’entre deux manches ou lorsque son personnage meurt.

Cette manière de procéder de la part de Kinstaar corrobore des observations similaires, qui stipulent que les échanges sur le chat, au cours de la webdiffusion en direct, ne ressemblent pas à une conversation ordinaire ou à d’autres formes de communication numérique. En effet, de telles inscriptions sont parfois comprises comme du « crowdspeak » (Ford et al., 2017 ; Barnabé et Bourgeois, 2022), soit les « clameurs de la foule », qui n’ont dès lors pas besoin d’être continuellement attestées. De plus, certaines occurrences dans les échanges peuvent être caractérisées d’« insulaires » (Recktenwald, 2017, p. 76), à savoir que de nombreux commentaires ne donnent lieu à aucune réaction de la personne qui streame. L’« insularité » de certains énoncés dans le chat de webdiffusion en direct est à relier à l’engagement différencié des participantes et des participants à l’interaction (Goffman, 2013), qui explique que certains commentaires restent, discursivement parlant, sans suite.

Ceci tranche avec d’autres formes d’interactions numériques, telles que celles des community managers chargés d’animer des espaces de marques sur les réseaux sociaux numériques, souvent confrontés à des incivilités ou des comportements agressifs de la part de clients, qui doivent tenir compte des sollicitations adressées à l’organisation qu’ils et elles représentent et s’efforcer de satisfaire leurs interlocuteurs (Jammet, 2019 ; Alloing et Pierre, 2021). S’agissant de Twitch, la gestion des interactions numériques dans le chat passe principalement par la modération, qualifiée de « communautaire », puisqu’elle est assurée par des modératrices et modérateurs majoritairement bénévoles8. Cette manière de procéder correspond à ce que les principaux réseaux sociaux, tels Facebook, Instagram, X ou YouTube, ont développé. De par la massification de leurs usages, ceux-ci font face à un problème croissant de modération des contenus indésirables, en particulier ceux relevant de la désinformation et des discours de haine (Gillespie, 2018). Face aux limites de la modération automatique, confiée à des algorithmes, ces plateformes tendent à déléguer une part importante de la régulation des publications à leurs utilisatrices et utilisateurs. Si celles-ci et ceux-ci « participent peu aux prises de décision ayant trait aux règles de publication », ils et elles « jouent en revanche un rôle central dans leur application » (Badouard, 2021, p. 242). Dans le cas de Twitch, la modération consiste surtout à bannir a posteriori les auteurs de propos violant les règles communautaires.

De quoi les émotions sont-elles l’accomplissement ?

Dans une approche pragmatiste, les émotions fonctionnent comme une modulation de la conduite. Partant du principe qu’elles opèrent un rétablissement de la situation en y intégrant ce qui surgit dans le but de recouvrer une forme d’harmonie, il est possible de s’interroger sur le travail qu’elles effectuent dans des situations de cyberviolence. Selon J. Dewey, « les émotions (quand elles ont un sens) sont des attributs d’une expérience [complète] qui progresse et évolue » (Dewey, 2010, p. 90). Dans une perspective similaire, L. Quéré (2021) estime qu’il n’y a pas d’émotion sans mouvement. Il considère que le développement de l’émotion est un flux dans lequel la phase cognitive et la phase affective sont constituées ensemble sur la base d’une activité sensori-motrice et exploratoire première. Par ailleurs, ce même développement de l’émotion est lié à la dynamique des changements qui se produisent aussi bien dans l’organisme que dans le milieu environnant, à leur concordance comme à leur discordance. Partant de là, nous allons présenter et discuter deux descriptions de séquences de jeu où Pixelle et Kinstaar subissent des agressions en ligne pour voir comment les émotions œuvrent à restaurer la situation.

Ces descriptions visent d’une part à expliciter la clause « quand elles ont un sens » (Dewey, 2010, p. 90) par des exemples. Ainsi, le comportement émotionnel peut être saisi comme la résultante d’une « dis-coordination » entre deux dynamiques (Quéré, 2021). Il s’agit d’insérer les émotions dans le caractère sériel des activités, en concevant leur développement comme un circuit dont la phase d’ouverture est une tension ou un déséquilibre dans des activités, et la phase de clôture une intégration restaurée de l’organisme et de l’environnement. D’autre part, nous interrogeons la façon dont les émotions peuvent contribuer à « une expérience complète » (« a complex experience »9) dans la manière dont elles prennent place dans « une série d’actes orientés vers un accomplissement et y [jouent] un rôle » (p. 76), tout en ayant en ligne de mire les actes de cyberviolence que subissent les vidéastes.

L’exclusion bruyante d’un troll sexiste

Commençons par un exemple issu d’un stream de Pixelle. À l’issue d’une course de voitures dans GTA V, durant laquelle elle se classe quatrième sur six, la joueuse s’attarde sur les commentaires laissés dans le chat de Twitch10. Elle constate l’arrivée d’abonnés (followers) qu’elle connaît et demande de leurs nouvelles. Puis, elle lit à voix haute le commentaire d’un nouvel abonné : « “Salut, les filles ne savent pas jouer à GTA.” Ouh, comme ça pue le macho ! C’est pas gentil, hein. Pourtant, il followe. Mais pourquoi tu followes quelqu’un qui sait pas jouer ? Merci quand même mais je comprends pas, y’a pas de logique, hum ».

La lecture à voix haute du message ainsi que la condamnation qu’en fait la vidéaste indiquent l’ouverture du développement d’une émotion par un déséquilibre, que Pixelle va essayer de renverser temporairement par une fermeture de ce sujet de conversation. Dans un même mouvement, la deuxième partie de l’énoncé comporte une proposition de rétablissement du lien, après que la joueuse a réprouvé le commentaire du nouvel abonné. Le fait qu’elle poursuive ensuite la webdiffusion en réagissant à d’autres commentaires indique qu’elle cherche à rétablir l’équilibre de l’interaction avec l’ensemble des spectateurs.

Une nouvelle course est lancée. L’abonné revient visiblement à la charge un peu plus tard, Pixelle s’amuse de ce qu’il écrit en disant : « Oh il est fâché. De toute façon les gens fâchés je les lis pas, je m’en bats les ovaires ». Puis elle ajoute : « Mais ça me fait rire les petits merdeux qui viennent ici ». Lorsque son bolide franchit la ligne d’arrivée, elle est pleinement attentive à ce qui a été produit dans le chat. Son propos atteste le fait que le nouvel abonné semble avoir publié un commentaire désobligeant, avec l’appui d’un autre spectateur, et a été banni du chat par un modérateur :

[rire] C’est trop mignon ! En fait, [abonné], du coup comme il était fâché, et en plus il a une petite quéquette, ben il est allé chercher son copain pis ben il a dit : « Vas-y, euh, on va lui dire du mal, on va la faire pleurer, cette fille », euh mais il me fait trop rire. Euh, hum, euh, c’est GTA, c’est comme ça. En tout cas merci au modérateur. Hop là, victime… Suce ma bite !

Pixelle rit en interprétant ce qui vient de se passer et remercie le modérateur d’avoir éjecté le fauteur de troubles. Elle relativise la violence des propos de l’abonné en les indexant au contexte du jeu (« C’est GTA, c’est comme ça »), ce qui lui permet de contrer les attaques sexistes du spectateur par d’autres remarques du même ordre (comme avoir une « petite quéquette »), et conclut en parodiant ses propos sexistes, avant de revenir au chat pour saluer ses followers fidèles. Ce faisant, le caractère sériel des réactions atteste du rétablissement du cours normal de l’activité. On a ici, pour le travail que font les émotions de Pixelle, la joie de voir le spectateur éjecté et le rétablissement de la concordance entre l’organisme et l’environnement. L’exclusion de l’abonné est certes « bruyante », puisque la joueuse revient plusieurs fois sur ses agissements afin de le dégrader publiquement, mais le fauteur de troubles a été écarté et la situation est rétablie.

Empêcher l’embrasement de commentaires racistes

Concernant Kinstaar, nous prenons l’exemple d’une partie du jeu de tir Valorant (Riot Games, 2020), dont il a réglé l’interface en coréen11. Les commentaires déferlent à un rythme soutenu dans le chat, et plusieurs d’entre eux portent sur la langue du jeu. En pleine manche, à la faveur d’une mort de son personnage, le joueur se tourne vers le chat de Twitch. Il soupire en voyant certains commentaires relatifs à la langue de l’interface du jeu et s’exclame : « ’Tain n’empêche c’est dingue quand même le réflexe de certaines personnes de se dire que le jeu il est en chinois, quoi ! Genre c’est… Dès qu’ils voient des caractères qu’ils savent pas c’que c’est, c’est leur premier réflexe, c’est chinois, quoi. C’est dingue quand même, ça ».

Puis il revient immédiatement au jeu en commentant le prix trop élevé d’une arme qu’il veut acheter. Deux minutes plus tard, pendant que son personnage court derrière les autres membres de son équipe, il regarde de nouveau le chat et réagit au commentaire d’un spectateur qui conteste son jugement en déclarant que « c’est normal » de se poser des questions sur la langue de l’interface du jeu. Il lit ce commentaire à voix haute et s’agace encore une fois : « Comment ça c’est normal, frère ? À quel moment tu te dis, quand tu vois des caractères comme ça tu te dis, le premier réflexe tu te dis que c’est chinois, genre ? À quel moment c’est normal, en fait ? ».

Pourtant, il verrouille aussitôt la séquence polémique pour empêcher l’embrasement (flaming) (Cook et al., 2019) qui pourrait en émerger, en affirmant d’une voix plus calme : « Bref, on va pas en parler, j’ai pas envie de partir dans ce débat-là, ça va me mettre dans de… ça va déjà me mettre dans les mauvaises humeurs, là ». Le joueur se concentre dès lors sur la partie en cours et ne se tourne plus vers l’interface de dialogue. Sa prise en compte du chat relève clairement d’un « engagement latéral » (Goffman, 2013). En l’occurrence, bien qu’affecté par les multiples commentaires dans le chat, Kinstaar ne cherche pas à résoudre la situation qu’il vit comme problématique, reprenant son activité sans se préoccuper « du lien qui relie un incident à ce qui le précède et à ce qui le suit » (Dewey, 2010, p. 88). À l’inverse, les émotions de Pixelle lui permettent véritablement de commencer et de clore l’interaction, aidée en cela par un modérateur du chat.

Conclusion

Notre analyse traite de conduites transgressives qui génèrent des dérangements dans les situations de webdiffusion, auxquels la joueuse et le joueur réagissent de manière différenciée. D’une part, Kinstaar est dérangé dans son activité principale, qui vise à gagner la partie, par des interpellations s’apparentant, selon les réactions du vidéaste, à du challenging. Face à ce qu’il interprète vraisemblablement comme l’amorce d’une controverse raciste, il exprime brièvement son ressenti, mais choisit aussitôt de verrouiller la séquence, signifiant ainsi son refus de voir son engagement dans le jeu déséquilibré par le surgissement d’émotions négatives.

Pour Pixelle, d’autre part, le trolling sexiste participe pleinement de son expérience de jeu. Un spectateur cherche à provoquer une réaction, y parvient et devient le sujet d’une brève cérémonie de dégradation de statut (Garfinkel, 1956), qui fait de lui le bouc émissaire du collectif, littéralement exclu de l’espace de l’interaction par l’intervention d’un modérateur. Cette manière de procéder ressemble à ce que K. L. Gray (2013) nomme du « sabotage de résistance » (resistance griefing), à savoir le fait d’utiliser les ressources disponibles pour faire dérailler les « expériences négatives et lutter contre les structures dominantes au sein de l’espace [du jeu] » (2013, notre traduction).

La comparaison des deux types de rencontres de jeu permet d’appuyer l’idée que la diffusion en direct est un accomplissement pratique qui comporte une bonne part de « jeu en tandem » (Scully‑Blaker et al., 2017), tant parce que les vidéastes jouent pour le public, que parce qu’ils jouent également avec le public (2017), à différents degrés. Ainsi, par l’importance qu’elle accorde aux interactions avec les spectateurs qui s’expriment dans le chat et par les émotions qu’elle exprime à leur égard, Pixelle semble davantage jouer avec son public en adoptant une « attitude ludique » (Genvo, 2013) tandis que Kinstaar joue pour celui-ci en accordant la priorité à sa performance de e-sport, dans laquelle les réactions des spectateurs et les affects qu’elles provoquent sont relégués au second plan.

L’approche adoptée permet de montrer que les émotions ne sont pas seulement les signes d’une rupture de coordination, mais accomplissent quelque chose par elles-mêmes dans le traitement de situations incertaines, comme ici lorsqu’il s’agit de cyberviolence. En ceci, les outils de la sociologie pragmatiste s’avèrent particulièrement féconds pour saisir le travail des émotions dans la complétude des activités ordinaires en contribuant à conférer son unité à l’expérience. Cette analyse contribue au champ du cyberharcèlement en soulignant l’importance des émotions dans le façonnement de l’expérience vidéoludique en contexte de webdiffusion. En montrant que les émotions servent non seulement d’indicateurs de perturbations, mais aussi d’outils pratiques de régulation sociale, elle offre un cadre pour mieux comprendre l’usure émotionnelle et ses effets durables. À ce titre, les outils de la sociologie pragmatiste gagneraient à être mis au service d’une étude longitudinale consacrée aux effets dommageables du cyberharcèlement, dans son caractère répétitif, anonyme et asymétrique. Une telle étude permettrait de vérifier dans quelle mesure l’accumulation d’expériences vidéoludiques comportant des émotions négatives influence la décision de cesser les activités de webdiffusion.

Références
  • Alloing Camille et Pierre Julien, 2021, « Le travail émotionnel numérique : faire de ses clics un moyen d’éviter les claques » [en ligne], Questions de communication, 40, p. 233‑256. Disponible sur : https://doi.org/10.4000/questionsdecommunication.26990.
  • Badouard Romain, 2021, « Participer à la modération sur les réseaux sociaux : définir, appliquer et contester les règles » [en ligne], Participations, 1, p. 239‑247. Disponible sur : https://doi.org/10.3917/parti.029.0239.
  • Barnabé Fanny, 2022, « Jeu et second degré : fonctions médiatrices de l’ironie dans le streaming de jeu vidéo » [communication orale], La Frontière vidéoludique : ce que le jeu vidéo fait au réel, Rouen, 9 juin.
  • Barnabé Fanny et Bourgeois Nicolas, 2022, « “Dans le chat, personne ne vous entendra crier ?” : Fonctions pragmatiques du bruit dans le streaming vidéoludique sur Twitch » [en ligne], Sciences du jeu, 18. Disponible sur : https://doi.org/10.4000/sdj.4703.
  • Boutet Manuel, 2012, « Jouer aux jeux vidéo avec style. Pour une ethnographie des sociabilités vidéoludiques » [en ligne], Réseaux, 173‑174, p. 207‑234. Disponible sur : https://doi.org/10.3917/res.173.0207.
  • Brouard Pauline, 2020, « Les pratiques intermédiales du streaming de jeu vidéo : d’une culture du spectateur à une autre ? » [en ligne], Télévision, 11, p. 141‑158. Disponible sur : https://doi.org/10.3917/telev.011.0141.
  • Coavoux Samuel et Roques Noémie, 2020, « Une profession de l’authenticité. Le régime de proximité des intermédiaires du jeu vidéo sur Twitch et YouTube » [en ligne], Réseaux, 224, p. 169‑196. Disponible sur : https://doi.org/10.3917/res.224.0169.
  • Consalvo Mia, 2012, « Confronting Toxic Gamer Culture: A Challenge for Feminist Game Studies Scholars » [en ligne], Ada: A Journal of Gender, New Media, and Technology, 1. Disponible sur : https://scholarsbank.uoregon.edu/xmlui/handle/1794/26289 [consulté le 20 févr. 2025].
  • Consalvo Mia, 2019, « Kaceytron and Transgressive Play on Twitch.tv » [en ligne], dans Jørgensen Kristine et Karlsen Faltin (dirs), Transgression in Games and Play, Cambridge, MIT Press, p. 83‑98. Disponible sur : https://doi.org/10.7551/mitpress/11550.003.0009.
  • Cook Christine L., Conijn Rianne, Schaafsma Juliette et Antheunis Marjolijn, 2019, « For Whom the Gamer Trolls: A Study of Trolling Interactions in the Online Gaming Context » [en ligne], Journal of Computer-Mediated Communication, 24 (6), p. 293‑318. Disponible sur : https://doi.org/10.1093/jcmc/zmz014.
  • Dewey John, 2010 [éd. orig. 1934], L’Art comme expérience, traduit de l’anglais par J.‑P. Cometti, Paris, Gallimard, collection « Folio. Essais ».
  • Ford Colin, Gardner Dan, Horgan Leah Elaine, Liu Calvin, Tsaasan A. M., Nardi Bonnie et Rickman Jordan, 2017, « Chat Speed OP PogChamp: Practices of Coherence in Massive Twitch Chat » [en ligne], CHI Conference on Human Factors in Computing Systems, New York, mai, p. 858‑871. Disponible sur : https://doi.org/10.1145/3027063.3052765.
  • Garfinkel Harold, 1956, « Conditions of Successful Degradation Ceremonies » [en ligne], American Journal of Sociology, 61 (5), p. 420‑424. Disponible sur : https://doi.org/10.1086/221800.
  • Genvo Sébastien, 2013, « Penser les phénomènes de ludicisation à partir de Jacques Henriot » [en ligne], Sciences du jeu, 1. Disponible sur : https://doi.org/10.4000/sdj.251.
  • Gillespie Tarleton, 2018, Custodians of the Internet: Platforms, Content Moderation, and the Hidden Decisions that Shape Social Media [en ligne], New Haven, Yale University Press. Disponible sur : https://doi.org/10.12987/9780300235029.
  • Goffman Erving, 1961, « Fun In Games », dans Id., Encounters: Two Studies in the Sociology of Interaction, Indianapolis, Bobbs-Merrill, p. 15‑81.
  • Goffman Erving, 1974 [éd. orig. 1967], Les Rites d’interaction, traduit de l’anglais par A. Kihm, Paris, Les Éditions de Minuit, collection « Le Sens commun ».
  • Goffman Erving, 2013 [éd. orig. 1963], Comment se conduire dans les lieux publics : notes sur l’organisation sociale des rassemblements, traduit de l’anglais par D. Cefaï, Paris, Économica, collection « Études sociologiques ».
  • Gray Kishonna L., 2013, « Collective Organizing, Individual Resistance, or Asshole Griefers: An Ethnographic Analysis of Women of Color in Xbox Live » [en ligne], Ada: A Journal of Gender, New Media, and Technology, 2. Disponible sur : https://scholarsbank.uoregon.edu/server/api/core/bitstreams/0ba7f495-a5e9-4d45-b1ea-473890c3ffbf/content [consulté le 27 mars 2025].
  • Gray Kishonna L., Buyukozturk Bertan et Hill Zachary G., 2017, « Blurring the Boundaries: Using Gamergate to Examine “Real” and Symbolic Violence against Women in Contemporary Gaming Culture » [en ligne], Sociology Compass, 11 (3). Disponible sur : https://doi.org/10.1111/soc4.12458.
  • Hochschild Arlie Russell, 2003, « Travail émotionnel, règles de sentiments et structure sociale » [en ligne], Travailler, 9 (1), p. 19‑49. Disponible sur : https://doi.org/10.3917/trav.009.0019.
  • Hochschild Arlie Russell, 2012 [éd. orig. 1983], Le Prix des sentiments. Au cœur du travail émotionnel, traduit de l’anglais par S. Fournet‑Fayas et C. Thomé, Paris, La Découverte, collection « Laboratoire des sciences sociales ».
  • Jammet Thomas, 2019, « Calmer le râleur. Contribution à l’étude de la relation client sur le Web 2.0 » [en ligne], Terrains & travaux, 34, p. 137‑161. Disponible sur : https://doi.org/10.3917/tt.034.0137.
  • Jørgensen Kristine et Karlsen Faltin, 2019, « Introduction: Playful Transgressions » [en ligne], dans Jørgensen Kristine et Karlsen Faltin (dirs), Transgression in Games and Play, Cambridge, MIT Press, p. 1‑9. Disponible sur : https://doi.org/10.7551/mitpress/11550.003.0002.
  • Linderoth Jonas et Mortensen Torill Elvira, 2015, « Dark Play: The Aesthetics of Controversial Playfulness » [en ligne], dans Mortensen Torill Elvira, Linderoth Jonas et Brown Ashley M. L. (dirs), The Dark Side of Game Play. Controversial Issues in Playful Environments, New York, Routledge, p. 3‑12. Disponible sur : https://doi.org/10.4324/9781315738680-1.
  • Paakki Henna, Vepsalainen Heidi et Salovaara Antti, 2021, « Disruptive Online Communication: How Asymmetric Trolling-like Response Strategies Steer Conversation off the Track » [en ligne], Computer Supported Cooperative Work, 30 (3), p. 425‑461. Disponible sur : https://doi.org/10.1007/s10606-021-09397-1.
  • Perret Michael, 2021, Expériences d’un problème public : de l’interdiction des jeux vidéo violents à la réglementation des contenus [en ligne], thèse de doctorat en sciences sociales, Université de Lausanne. Disponible sur : https://serval.unil.ch/fr/notice/serval:BIB_AF2284E64540 [consulté le 14 août 2023].
  • Quéré Louis, 2018, « L’émotion comme facteur de complétude et d’unité dans l’expérience. La théorie de l’émotion de John Dewey », Pragmata, 1, p. 10‑59.
  • Quéré Louis, 2021, La Fabrique des émotions, Paris, Presses universitaires de France.
  • Quéré Louis et Terzi Cédric, 2015, « Pour une sociologie pragmatiste de l’expérience publique. Quelques apports mutuels de la philosophie pragmatiste et de l’ethnométhodologie » [en ligne], SociologieS. Disponible sur : https://doi.org/10.4000/sociologies.4949.
  • Recktenwald Daniel, 2017, « Toward a Transcription and Analysis of Live Streaming on Twitch » [en ligne], Journal of Pragmatics, 115, p. 68‑81. Disponible sur : https://doi.org/10.1016/j.pragma.2017.01.013.
  • Revillard Anne, 2000, « Les interactions sur l’Internet (note critique) » [en ligne], Terrains & travaux, 1, p. 108‑129. Disponible sur : https://doi.org/10.3917/tt.001.0108.
  • Sacks Harvey, 1992, Lectures on Conversation, Cambridge, Blackwell.
  • Scully‑Blaker Rainforest, Begy Jason, Consalvo Mia et Ganzon Sarah, 2017, « Playing along and Playing for on Twitch: Livestreaming from Tandem Play to Performance » [en ligne], Hawaii International Conference on System Sciences 2017 (HICSS‑50), janv. Disponible sur : https://doi.org/10.24251/HICSS.2017.246.
  • Stassin Berengère, 2019, (Cyber)harcèlement. Sortir de la violence, à l’école et sur les écrans, Caen, C&F éditions, collection « Les Enfants du numérique ».
  • Taylor T. L., 2018, Watch Me Play: Twitch and the Rise of Game Live Streaming [en ligne], Princeton, Princeton University Press. Disponible sur : https://doi.org/10.1515/9780691184975.
  • Ter Minassian Hovig, Berry Vincent, Boutet Manuel, Colónde Carvajal Isabel, Coavoux Samuel, Gerber David L. J., Rufat Samuel, Triclot Mathieu et Zabban Vinciane, 2021, La Fin du Game ? Les jeux vidéo au quotidien, Tours, Presses universitaires François‑Rabelais.
  • Verón Eliseo, 1985, « L’analyse du contrat de lecture », dans Touati Émile (dir.), Les Médias : expériences, recherches actuelles, applications, Paris, Institut de recherches et d’études publicitaires (IREP), p. 203‑229.