La voix et ses vertus

La voix et ses vertus

« 

Si l’audio digital a aujourd’hui le vent en poupe, cela n’était pas forcément le cas il y a quelques années.
Ainsi nous demandait-on souvent pourquoi Saooti faisait de l’audio et non pas de la vidéo.

Il existait alors un préjugé tenace qui perdure encore, associant à chaque média : écrit, audio et vidéo un âge du web.
Ainsi, aux âges farouches de la préhistoire du web, dont seuls quelques anciens chenus à la voix chevrotante se souviennent encore, apparut HTML, puis les blogs.
Ce fut ensuite l’avènement de l’audio, avec Skype le héraut pourfendeur des compagnies téléphoniques, dragons de ces âges héroïques.
Enfin apparut la vidéo, avec Youtube, puis la vidéo en direct avec Youtube livestreaming, periscope et facebook live video comme derniers avatars.

Désormais donc, depuis que la technologie et les réseaux permettaient de faire de la vidéo de bonne qualité, la vidéo serait le média ultime – appelé seulement a évoluer vers plus de qualité ou de la 3D – les autres modes de communication – écrit et audio – n’étant que des ersatz bon marché ou des reliquats d’un autre âge.

Il n’en est rien.

Chacun de ces médias a ses propres vertus, et l’avenir n’est pas à l’hégémonie d’un média unique, mais à l’utilisation judicieuse de chacun de ces médias là où il est le plus pertinent.

Pour commencer, faisons donc

Une petite histoire subjective des médias.

Nous allons survoler dans ce chapitre 3 chronologies :

  • Celle des différentes techniques d’enregistrement, de reproduction et de diffusion des médias
  • Celle des différents médias sur le web
  • Et celle des modes de communication sous-jacents

Les techniques d’enregistrement, de reproduction et de diffusion des médias

L’écriture.

Pas de question, évidemment, en ce qui concerne les techniques d’enregistrement de l’écriture, puisqu’il s’agit en soi d’une technique d’enregistrement du langage oral.

La reproduction en masse de l’écriture est pour sa part liée à l’imprimerie, inventée en Europe par Gutemberg en 1451, et existant en Chine depuis le XIème siècle.

Quant à sa diffusion, signalons simplement 2 dates : le télégraphe optique Chappe en 1794, et surtout le télégraphe de Samuel Morse en 1840.

L’image

La reproduction de l’image est concomitante de l’imprimerie. Un bémol néanmoins : il faut graver spécifiquement les plaques d’illustrations des ouvrages. Les reproductions doivent donc être faites par un artiste.

La reproduction fidèle de la réalité va être permise tout d’abord par Nicéphore Niépce en 1825, puis surtout par Talbot qui invente en 1840 le procédé de négatif qui permet la reproduction des images en multiples exemplaires. L’intégration des photos à l’imprimerie se fera progressivement par différentes techniques. Sans rentrer dans les détails, on peut évoquer l’héliogravure, qui permet de transférer une image sur une plaque métallique par insolation. Ces techniques vont se perfectionner à la fin du XIXème siècle.

Enfin, la diffusion à distance d’une photo – la « téléphotographie » – est mise au point au début du XXème siècle, avec en particulier l’invention du bélinographe en 1913, permettant de transmettre par téléphone une photo avec demi-teintes et dégradés.

L’audio

Le phonographe, permettant d’enregistrer et de rejouer un son est inventé par Thomas Edison en 1877.

Emile Berliner améliore cette invention avec le gramophone (1889) qui permet en outre la reproduction en masse des enregistrements.

Le téléphone, pour sa part, est inventé par Graham Bell en 1876.

La vidéo

Le premier film des frères Lumière « Sortie de l’usine Lumière à Lyon » est diffusé en 1895.

S’appuyant largement sur les techniques photographiques, le cinéma bénéficie d’emblée de moyens de reproduction. L’invention de la « piste optique », permettant d’enregistrer le son de façon synchrone avec l’image va ouvrir la porte au cinéma parlant. Le premier film parlant, « le chanteur de jazz », est réalisé en 1927.

Enfin, la première démonstration de télévision est faite en 1926 par John Baird.

Comme on le voit la chronologie des techniques de reproduction et de diffusion des médias

  • l’écriture – il y a 2000 ans en Europe –
  • la photo au milieu de 19ème siècle
  • la radio au début du XXème siècle
  • et la télévision dans la seconde moitié du XXème siècle

est conforme à l’ordre instinctif que l’on évoquait au début de cet article : d’abord l’écriture, puis l’image, l’audio et enfin la vidéo.
C’est cette chronologie qui induit la hiérarchie que nous appliquons inconsciemment aux médias.

Comme nous allons le voir par la suite, cette chronologie ne s’applique ni sur le web, ni et surtout aux modes de communications sous-jacents.

Les médias sur le web

Plutôt que de faire une chronologie précise et exhaustive de l’utilisation ou de la mise en avant des médias sur le net, il me semble plus intéressant de regarder la date d’apparition de certaines entreprises ou technologies emblématiques du web 2.0 :

Blogs : fin des années 1990. Blogger : 1999. Tumblr 2007.

Picasa : 2002. Flickr : 2004. Instagram, Pinterest 2010

Napster, Icecast : 1999. Skype 2003. Spotify 2006. Soundcloud : 2007. Radionomy 2008. Saooti 2009

Youtube : 2005, Vine 2013, Periscope 2015, Facebook live 2016

Comme on le voit, les innovations d’usage ou techniques s’appliquent indifféremment aux différents médias. Il y a eu des innovations récentes, y compris pour le blogging.

Les frontières entre ces différents médias tendent d’ailleurs à s’estomper : un blog est aujourd’hui bien plus que du texte et quelques images. Youtube est aujourd’hui la première plateforme musicale du monde avec de très nombreux contenus qui sont en fait de fausses vidéos : un vrai contenu audio plaqué sur une image de fond ou un carrousel de photos.

L’audio a quant à lui connu une popularité très précoce (on pense en particulier au phénomène Napster en 1999) mais pour des usages qui étaient en réalité du partage ou de l’écoute – plus ou moins légale – de musique en ligne. Vint ensuite l’avènement de la voix sur IP, avec en particulier Skype. Les véritables plateformes 2.0 de CGU (Contenus Générés par les Utilisateurs) audio ne sont apparues que tardivement, à partir de 2007, soit après les premières plateformes 2.0 de vidéo.

Les modes de communication

Il est amusant de constater que la hiérarchisation instinctive des médias est strictement l’inverse de ce que fut l’évolution du langage. Dans un premier temps en effet, il y eut le mime (agrémenté de cris), puis la parole et le langage, enfin, l’écriture ; en synthèse si la même chronologie s’était appliquée aux médias correspondants, nous aurions eu d’abord la vidéo, puis l’audio puis l’écrit.

Selon cette chronologie, donc, le moyen de communication le plus évolué serait l’écrit et le plus primitif la vidéo avec l’audio en position intermédiaire.
C’est absurde, n’est-ce pas ?
Bien sûr, mais pas plus en fait que d’établir une hiérarchie inverse.

Du langage

C’est à homo habilis que nous devrions l’invention du langage articulé, il y a plus de 2 millions d’années.

Comme son nom l’indique, homo habilis était un gars plutôt dégourdi puisque c’est également lui qui a inventé les premiers outils en pierre taillée. On lui doit donc deux des plus remarquables traits de l’humanité : le langage et la technologie. Il mérite bien vos plus chaleureux applaudissements…

On présume que le langage est une évolution de la gestuelle, ce n’est pas une hypothèse gratuite : elle s’appuie sur des études des zones cérébrales impliquées dans la gestuelle et le langage ; et pourtant, point remarquable : les langages humains sont presque tous oraux. D’où, d’ailleurs, l’étymologie du mot « langage ».

Il existe certes des langues gestuelles : les langues des signes pour sourds, quelques langues gestuelles traditionnelles dont la plus célèbre, grâce aux westerns, est la langue des signes des indiens des plaines en Amérique du Nord et enfin quelques systèmes restreints de communication silencieux spécifiques : « langues » de chasse, de guerre etc. qui ne peuvent prétendre au statut de langue car au champs d’application bien trop restreint. Les langues gestuelles des sourds sont des langues complètes, mais il s’agit de créations relativement récentes, les premières formalisations des langues par signes pour sourds datant en gros du XVIIème siècle (une évocation en est faite dans le film « Ridicule » de Patrice Leconte). Les langues gestuelles traditionnelles, des indiens d’Amérique, des aborigènes ou des bochimans par exemple, sont quant à elle des langues auxiliaires qui viennent en complément, et non en remplacement de langues orales. La langue des signes des indiens des plaines avait ainsi 2 rôles : accompagner la voix dans les rituels, et, particularité tout à fait unique, elle servait d’esperanto pour la communication entre des tribus de groupes de langues parfois radicalement différents. Elle ne pouvait néanmoins prétendre à la richesse d’une vraie langue : inutile d’essayer de traduire la « critique de la raison pure » en langue des signes des indiens des plaines.

Pourquoi donc, si elles sont une évolution de la gestuelle, les langues sont-elles devenues orales ? A priori, parce qu’une langue orale présente des avantages significatifs sur une langue gestuelle. Premier avantage : elle fonctionne de jour comme de nuit, et ça, c’est super important pour homo habilis qui va devoir encore patienter plus d’un million et demi d’années avant la domestication du feu et l’éclairage de nuit. De même, une langue orale fonctionne à bonne distance dans tous les milieux : forêt dense, hautes herbes, grottes… Enfin, elle n’accapare pas un sens qui est essentiel pour l’homme : la vue, et lui laisse également les mains libres. Ainsi, les groupes humains, quand ils sont à la guerre par exemple, peuvent se coordonner sans déposer leurs armes ni perdre de vue l’ennemi. Et c’est bien là une des caractéristiques essentielles de la langue orale : elle utilise sans l’accaparer un sens relativement secondaire, l’ouïe, ne sollicite ni la vue ni les mains et a ses circuits cérébraux dédiés de façon à vous permettre de communiquer tout en conservant l’essentiel de vos ressources et capacités pour une autre activité.

Par ailleurs, le langage est caractéristique de l’homme. Il est le fruit de sa pensée, mais réciproquement, la pensée humaine est largement le fruit du langage. En réalité, pensée et langage sont si étroitement imbriqués qu’ils sont indissociables.

La langue est l’interface de communication incontournable pour exprimer ou alimenter la pensée. Elle permet de décrire des situations concrètes tout autant que des concepts abstraits, avec pour seule vraie limite le fait que certaines expériences, certains concepts, ne peuvent être compris par un auditeur que si son expérience personnelle le lui permet : c’est ce qu’on appelle l’indicible. C’est ainsi par exemple qu’il est difficile, sinon impossible, de faire comprendre ce qu’est la vue à un non-voyant de naissance. Hormis ces rares cas, lorsqu’on a du mal à exprimer sa pensée, c’est soit que la pensée en question est confuse, soit que l’on maîtrise mal le langage. Cela relève rarement des limites intrinsèques de la langue. La langue est d’ailleurs un outil flexible, qui s’enrichit de nouveaux mots et de nouveaux sens lorsque le besoin d’exprimer de nouveaux concept se fait sentir.

La gestuelle originelle, quant à elle, perdure et accompagne le langage verbal ; mais l’appellation de « langage corporel » qu’on lui donne parfois est largement abusive. La gestuelle est plus ou moins importante selon les cas, mais elle est aussi plus ou moins consciente et pas toujours contrôlable.
À ce titre, elle n’est pas un langage : un langage doit permettre à un locuteur d’exprimer des concepts complexe, y compris des concepts abstrait. La gestuelle, lorsqu’elle est consciente, appuie le propos, et lorsqu’elle est inconsciente, révèle l’état émotionnel du locuteur.

Dans son livre « Sapiens », Yuval Noah Harari défend de manière très convaincante la thèse que l’essor de l’humanité est lié à une « révolution cognitive ». Cette révolution cognitive est la capacité du langage à véhiculer des concepts abstraits, des mythes, des valeurs.
Un grand nombre d’espèces sont dotées d’un mode de communication permettant aux autres membres de l’espèce ou de la colonie de connaître les dispositions de chaque individu : est-il amical, menaçant, disposé à s’accoupler ? C’est là typiquement le rôle du langage non verbal.
Un certain nombres d’espèces disposent d’un langage restreint, aux objectifs très concrets : danse des abeilles pour indiquer l’emplacement d’un gisement de pollen, sifflement des marmottes pour avertir d’un danger, cris de certains singes pour avertir non seulement la colonie d’un danger, mais préciser la nature de celui-ci : s’agit-il d’un oiseau de proie ou d’un prédateur au sol ?
Mais seul Sapiens est doté d’un langage permettant de véhiculer des concepts abstraits et en particulier des mythes, des religions, des valeurs. Or c’est cette capacité qui permet de faire coopérer un très grand nombre d’individus, de clans différents, ne se connaissant parfois même pas, en œuvrant à un but commun. D’après Harari, cette capacité serait d’ailleurs spécifique à Sapiens Sapiens : ce bon vieux Néandertal en aurait été dépourvu et c’est une des explications de sa défaite dans la compétition qui l’a confronté à nos ancêtres.
Ce qui est intéressant, entre autres, dans cette théorie, c’est que la « révolution cognitive » relève exclusivement du langage, pas du « langage corporel ».

La « communication non verbale » a ainsi un rôle tout à fait essentiel pour l’expression des émotions et de l’empathie, mais elle est beaucoup moins importante, voire peut parasiter d’autres types de communication. Nous y reviendrons.

De l’image

L’ambition de ce chapitre n’est pas de faire un abrégé d’histoire de l’art pictural mais simplement de refixer quelques grandes dates et quelques réflexions sur l’image.

Les plus anciennes peintures rupestres datent d’environ 40000 ans. Il s’agit de simples points de couleurs (site d’El Castillo en Espagne) et de mains au pochoir (île de Sulawesi, Indonésie). La grotte Chauvet, qui date de 35000 ans environ, nous livre quant à elle des représentations animales qui sont déjà stupéfiantes de maîtrise :

Il est intéressant de noter que si l’écriture a d’abord été dictée par des besoins utilitaires (les premiers écrits sont souvent des livres de comptes), la représentation picturale semble, quant à elle, avoir été de prime abord le fruit d’une démarche artistique.

Jusqu’à l’avènement de la photographie, ce sont des artistes (dessinateurs, peintres ou graveur) qui auront la charge de faire la représentation de la réalité. Dans cette recherche de la ressemblance et de l’exactitude, les techniques ne vont cesser de s’améliorer, en particulier à la renaissance avec la formalisation des règles de perspectives et des études théoriques sur les proportions, pour culminer au début du XIXème siècle avec des portraitistes comme Claude-Marie Dubufe dont la précision photographique des portraits est tout à fait impressionnante. Néanmoins, réalisme, flatterie, partit-pris artistique et imagination participent à des degrés divers de ces représentations, et le réalisme de ces dernière peut être sujet à caution. L’arrivée de la photographie au milieu du XIXème siècle bouleverse cela et amène progressivement les artistes à se désintéresser du réalisme strict, à l’exception de quelques-uns comme Ron Mueck qui réalise au contraire des sculptures hyper-réalistes.

À partir du milieu du XIXème siècle, donc, la représentation fidèle de la réalité est confiée à la photographie.

La photo semble d’une objectivité implacable, mais il n’en est rien. Si elle représente la réalité (en admettant qu’elle ne soit pas truquée) elle peut être retouchée, posée, composée, le choix du cadrage peut en changer complètement la portée, elle ne représente qu’un instant sans en présenter le contexte (de nombreuses fake news sur internet sont ainsi construites en utilisant de vraies photos, mais avec des légendes mensongères)… Sans compter que le seul choix du sujet peut être un parti-pris.

Nous reviendrons un peu plus tard sur l’objectivité d’une photographie d’actualité.

Enfin ajoutons que l’image aujourd’hui fait désormais la part belle à l’infographie pour tout ce qui est des schémas explicatifs.

De l’écriture

Il y a quatre berceaux indépendants d’invention de l’écriture, avec par ordre d’apparition : la Mésopotamie (-3300), l’Égypte (-3200), la Chine (-2000) et les mayas (-300).

Il est évident pour nous autres occidentaux que la langue écrite est une transcription de la langue orale, puisque que notre écriture est constituée de phonèmes : les caractères représentent les sons de la langue orale. Cela n’a pourtant rien d’obligatoire : ainsi, les caractères chinois, qui sont des logogrammes – un caractère représente un mot, un concept – sont également utilisés en japonais et en coréen, deux langues pourtant complètement différentes. Un japonais peut donc en théorie lire un texte chinois sans savoir le parler, alors qu’il est impossible de comprendre un texte anglais sans connaître l’anglais. De la même façon, des langues très différentes ont utilisé les mêmes logogrammes cunéiformes (pour la petite histoire, l’écriture cunéiforme, les hiéroglyphes égyptiens et les glyphes mayas utilisent des phonèmes ET des logogrammes).

Quoi qu’il en soit, qu’elle soit une transcription stricte d’une langue orale par le biais d’un alphabet, ou indirecte via des logogrammes qui portent un sens, mais ne définissent pas leur propre prononciation, une écriture est bien toujours l’enregistrement d’une langue orale : elle est faite pour être lue.

Pour autant, l’écriture n’est pas simplement la stricte retranscription de l’oral : l’oral et l’écrit ont chacun leurs propres forces.

Ainsi, l’écriture est simplificatrice. Elle n’affiche pas toujours les nuances de prononciations (c’est particulièrement le cas en français où bien des mots ne s’écrivent pas comme ils se prononcent), les accents toniques, mais surtout, elle est bien pauvre en moyens de transcrire les nuances d’intonation, de vitesse de diction, de force. Les quelques signes de ponctuation dont elle dispose (, ; : ! ?. -) n’y suffisent pas.
Cette lacune est d’ailleurs mise en lumière par les stratagèmes qui ont dû être inventés pour la combler. Ainsi, les fontes et lettrages utilisés en bande dessinée :

Et plus récemment, les smileys, les emojis.

Malgré ces expédients, celui qui lit un texte écrit à voix haute un texte a toujours une part importante de création personnelle en ce qui concerne la diction : il n’y a qu’une seule tirade des nez dans Cyrano de Bergerac, mais on peut en faire une infinité d’interprétations.
L’écriture peine donc à transcrire de manière précise et synthétique les nuances de la diction, et par là même peine à transmettre l’émotion de façon directe. Or l’émotion, outre sa valeur intrinsèque, a deux pouvoirs particuliers :
• Elle permet, par l’empathie, de réduire la distance entre le narrateur et l’auditeur.
• Elle est la trempe, le fixateur qui permet de marquer durablement les mémoires : ainsi, je ne me rappelle plus quelles musiques j’ai entendues à la radio hier, mais je me souviens parfaitement de la musique sur laquelle j’ai dansé pour la première fois avec ma femme il y a plus de 20 ans.

Sur d’autres aspects, l’écriture présente bien des avantages ; nous y reviendrons dans le prochain chapitre.

Des forces et limites respectives des médias

Ce chapitre découle pour une bonne partie des réflexions que nous avons pu mener dans le chapitre précédent.

Un mot sur l’image

L’image est un mot-valise qui recouvre en fait des choses radicalement différentes, voire opposées, tant dans les procédés de réalisation que dans leurs impacts. Visitons brièvement les 2 extrêmes du spectre.

La photo, quintessence de l’émotion

Qu’est ce qui rend une photo marquante ? Ni sa justesse, ni sa beauté, mais son impact émotionnel.

Dans ce registre, voici peut-être les 2 photos les plus emblématiques de la guerre du Vietnam :

Toutes deux ont puissamment contribué à l’image de « sale guerre » du conflit auprès de l’opinion publique tant mondiale qu’américaine et in fine au désengagement des États-Unis.

Arrêtons-nous plus un peu sur la première de ces deux photos. Elle est particulièrement intéressante à 2 titres :

  • Primo, presque tout le monde ou connaît cette photo, mais peu de gens savent que cette scène a été également filmée. Comment expliquer que le film n’ait pas acquis le statut iconique de la photo ?

     

    • Une première raison est la simplicité de diffusion et de reproduction d’une photo par rapport à celle d’une vidéo, du moins à l’époque. Cette photo a été reproduite dans de très nombreux journaux et livres. La vidéo pour sa part, a fait le tour du monde, mais uniquement à la télévision.
    • L’autre raison, bien plus intéressante car toujours d’actualité à l’heure d’internet, est que la photo a capturé l’instant décisif. La vidéo dilue l’impact émotionnel dans la durée, là où la photo le délivre tout entier dans l’instant.
      Il me semble également que la mémoire est plus photographique que cinématographique : une image forte s’imprime dans notre mémoire plus vite et plus durablement qu’une séquence filmée, qui elle même est de toute façon mémorisée sous forme d’images-clés.
  • Secundo, Eddie Adams, le photographe qui a pris ce cliché a lui même publiquement regretté que sa photo aie caricaturé l’événement. Il déclara ainsi : « Les images fixes sont l’arme la plus puissante du monde. Les gens les croient, mais les photos mentent, même sans manipulation. Elles ne sont que des demi-vérités. Ce que la photo ne disait pas, c’est : qu’est-ce que vous auriez fait si vous aviez été le général au même endroit et au même moment, lors de cette chaude journée, et que vous aviez attrapé ce sale type après qu’il a tué un, deux ou trois soldats américains ? » . Il devint par la suite ami du général Nguyen Ngoc Loan, l’exécuteur de la photo.

À vrai dire, le fait que cette photo ait eu un tel impact, et qu’elle ait – injustement ou non – diabolisé tant le général Nguyen Ngoc Loan que les forces américaines et du sud Vietnam sont en fait les 2 faces d’une même médaille : c’est l’émotion qu’elle suscite qui a déterminé l’impact de cette photo, mais l’émotion peut aussi submerger l’objectivité, la complexité, la nuance.

Pour plus d’information sur cette photo, je vous recommande la lecture de cet article de l’OBS.

Le schéma, support de conceptualisation

Le schéma peut jouer sur des ressorts strictement contraires à ceux des photos ci-dessus : ils permettent de concrétiser et d’expliquer des théories complexes et sont un support précieux à la réflexion. De tel schémas peuvent connaître un succès considérable, marquer les esprits et assurer le succès de la théorie qu’ils illustrent. Pour autant, leur abstraction les vident bien souvent de toute charge émotionnelle.

Notons également l’importance de l’écriture dans ces schémas. Le schéma est un média hybride, mêlant écriture et image.

Le mélange des genres

L’image ne se réduit donc pas à un style, un objectif. Une image peut être porteuse de sens, inciter à la réflexion, émouvoir, faire rire. Elle peut être photo, dessin, schéma.

Mais l’image n’est pas un média complet : elle a besoin d’être complétée par l’écriture : dans un schéma, par une légende, voire s’y mêler plus étroitement encore comme dans la bande dessinée, ou par l’oral (diapos de présentation).
L’image fixe est un média très puissant, mais c’est un média d’appoint qui ne peut se suffire à lui même. Il peut en revanche renforcer voir décupler l’impact de n’importe quel autre moyen de communication.

Irremplaçable écriture

Les limites de l’écriture

Nous avons d’ores et déjà évoqué les limites de l’écriture, pour la transmissions des émotions.

Si je croise ainsi dans la rue une femme qui pleure, je suis ému, même si je ne connais ni cette femme, ni les raisons de son chagrin.

Si j’écris « Une femme pleurait dans la rue », le lecteur aura l’information factuelle, mais il ne ressentira guère d’émotion. Pour transmettre cette émotion, il me faudra :

  • soit expliquer les raisons du chagrin de cette femme à mon lecteur,
  • soit expliquer à mon lecteur la pitié que m’a inspiré ce chagrin,
  • soit décrire en détail les effets de ce chagrin.

Dans tous les cas, il me faudra un talent certain et la complicité active de mon lecteur pour lui faire ressentir ne serait-ce qu’une petite partie de l’émotion que j’ai ressentie, alors que l’émotion se serait imposée d’elle-même s’il avait vu cette femme comme moi.

Mais quelles en sont les forces ?

Tout d’abord, le lecteur est en partie affranchi des contraintes de temps et de la linéarité de la parole. La lecture mentale vous permet en général d’aller un peu plus vite que la diction, mais si une phrase vous pose des problèmes de compréhension, vous pouvez y revenir autant que vous le voulez pour la relire plus lentement. Vous êtes au contraire sur une partie de texte qui ne vous passionne pas ou que vous maîtrisez déjà ? Une petite lecture en diagonale vous permettra d’arriver plus rapidement aux parties qui vous intéressent sans risque de rater une information importante.

De plus, l’écriture s’est dotée de tout un système annexe de structuration, de classement et d’accès à son contenu : titres, chapitres, plans, tables, références… système dont la puissance s’est considérablement accrue encore sur le web avec les liens et le référencement. Ainsi l’écrit, a fortiori sur le web, permet au lecteur d’accéder directement aux informations qui l’intéressent.
Ce système de classement annexe n’est néanmoins pas intrinsèquement limité à l’écrit, et c’est un des enjeux du web sémantique en général, et de Saooti en particulier en ce qui concerne l’audio, que de chapitrer et d’outiller pareillement l’accès aux contenus autres que l’écrit, à savoir l’audio, la vidéo et les images.

Autre point, que nous retrouverons également pour l’audio : l’écrit n’a pas d’autre limite que celles de l’imagination. Il n’y a pas de limite de budget pour les effets spéciaux !

Puissance et servitudes de la vidéo

Depuis l’ajout du son à l’image animée, soit depuis la fin des années 20, la vidéo est en réalité un média bimodal : image + son. On pourrait donc penser que la vidéo est forcément mieux que l’audio seul.
En réalité, il existe de nombreux cas où l’audio peut être préférable à la vidéo.

La question à se poser est : qu’est ce que l’image apporte de plus à l’audio ?

Parfois, la réponse est pas grand-chose, voire rien du tout. C’est typiquement le cas en radio filmée pour certains chroniqueurs qui lisent leur billet très scolairement ; si je connais déjà la tête du chroniqueur, la vidéo ne m’apporte rien.

Parfois, c’est encore pire : l’image dessert carrément propos. Un exemple assez célèbre est Édouard Balladur déclarant son enthousiasme après avoir été nommé premier ministre : sa physionomie montrait qu’il était tout sauf enthousiaste (mais soyons juste : son ton ne transpirait pas non plus l’allégresse : dans ce cas précis, la radio n’eût pas été beaucoup plus convaincante que la télé).
On peut se dire que dans ce cas, du point de vue du téléspectateur, l’image a bien un apport bénéfique puisqu’elle révèle ce qui semble bien être une hypocrisie ; mais ce n’est pas forcément le cas : bien des personnes sont intimidées par la caméra et auront le plus grand mal à avoir un comportement naturel quelle que soit leur sincérité. Même des personnes rompues a l’exercice risquent de manquer de naturel, car trop préoccupées de l’image qu’elles donnent.

Considérons maintenant le cas où image et son sont redondants.
Pour illustrer ce propos, je vais faire un pas de côté et prendre un exemple du côté de la BD. La comparaison entre BD et vidéo a bien sûr ses limites, mais elle est souvent pertinente. Là ou la vidéo cumule son et image animée, la BD cumule écrit et images successives. De fait, beaucoup de procédés cinématographiques (cadrages, transitions, plans, fondus-enchaînés, voix off…) sont utilisés en BD.
Voici une planche de « La marque Jaune » une aventure de Blake et Mortimer signée E P Jabobs.

Une des marques de fabrique de Jacobs est l’usage massif qu’il fait des phylactères explicatifs (l’équivalent des didascalies – dans la planche ci-dessus, il s’agit des phylactères rectangulaires sur fond rose). Dans cette planche, il y en a un par case et c’est le cas sur presque toutes les planches de la marque jaune.
Or ces phylactères ne font que redire ce que l’image montre déjà ; ils chargent les images et ralentissent la lecture. La BD moderne fait une chasse impitoyable à ce type de bulles : les images doivent être suffisamment claires pour ne pas nécessiter d’explication supplémentaire.

En vidéo, pour une séquence donnée, un des 2 modes de communication va en général prendre le dessus sur l’autre.
Ainsi, si c’est la voix qui délivre l’information principale, l’image vient en illustrer le propos ; si c’est l’image qui est primordiale, la voix vient l’expliquer ou la compléter.
Cela dit, si on trouve rarement en vidéo d’exemple de redondance aussi caractéristique que sur dans cette planche de BD, il est courant d’avoir des séquences où image et son apportent quasiment la même information sans réellement s’enrichir mutuellement.
Cela peut sembler un pécher véniel : après tout, d’ailleurs, la marque jaune est considérée à juste titre comme un chef d’œuvre du 9ème art.
Néanmoins il s’agit bel et bien d’une violation du principe qui veut que :

Si l’image n’apporte rien, il est préférable de s’en passer.

Pour des raisons techniques et financières tout d’abord :

  • La vidéo est beaucoup plus coûteuse à produire que l’audio : coût du matériel, de la réalisation et du montage, nécessité d’avoir plusieurs prises de vues pour éviter une image trop statique etc…
  • La vidéo est exigeante également pour la diffusion : débit et qualité de connexion réseau, risque de saturer le réseau d’entreprise, il faut également avoir un terminal suffisamment puissant pour ne pas « ramer » sur le décodage de grosses vidéos
  • Et ce d’autant plus que les exigences en matière de qualité vidéo sont de plus en plus élevées

Et puis également pour les raisons évoquées précédemment :

  • La vidéo peut être intimidante
  • La préoccupation de contrôler son image peut rendre son propos moins naturel et spontané

Il demeure toute une palette d’usages où la vidéo est inégalable et ou audio et image s’enrichissent mutuellement. Mais dans ce cas, elle est un média accaparant : l’attention des spectateurs va être totalement captée. Si on est dans un cadre professionnel, où le temps est de l’argent, son usage doit donc être justifié par l’enjeu, et la vidéo doit être la plus concise possible.

Pour finir rappelons qu’il est un mode de communication qui a largement fait ses preuves dans le domaine de l’éducation et de la com : « audio plus diapos ». C’est une formule très puissante tant du point de vue pédagogique que pour transmettre des émotions, et ce pour un coût et des exigences bien moindres que la vidéo. Les diapos offrent en outre les avantages de l’écrit : vous pouvez les reconsulter a posteriori au rythme qui vous convient.

L’audio

Que découle-t-il de nos observations précédentes ?

Tout d’abord, que l’audio est un média complet :

  • l’audio permet de véhiculer l’émotion, certes dans une moindre mesure que la vidéo, mais en contrepartie d’une façon plus aisément maîtrisable.
  • l’audio permet également d’aborder les concepts les plus abstraits. Pour ce type de sujet, il peut être utilement renforcé par des documents iconographiques (« un petit schéma vaut mieux qu’une longue explication« ) , mais ce n’est pas une nécessité.

L’audio est un média rustique et bon marché.

Nous l’avons déjà abordé au chapitre précédent : l’audio est beaucoup moins exigent en ressources informatiques, en connectivité réseau, en matériel, en coûts d’enregistrement et de montage que la vidéo.

C’est également un média plus simple à maîtriser techniquement et émotionnellement.

L’audio est un média synthétique, voire elliptique.

Vous m’objecterez peut-être qu’il existe de nombreux exemples d’enregistrements d’interminables logorrhées qui n’ont rien de synthétiques, et vous aurez raison : je devrais plutôt dire : « l’audio se doit d’être synthétique ».
Impossible en effet, comme pour l’écrit, de lire en diagonale pour sauter les 3 pages de description qui vous barbent.
Impossible également d’être distrait par les détails annexes qui peuvent fourmiller dans une photo ou un film.
Impossible enfin de confisquer l’attention de vos auditeurs :
si vous ne savez pas être synthétique, vous ne serez tout simplement pas entendus.

Mais la parole est par essence synthétique. Pour s’en convaincre, regardons la photo légendée ci-dessous :

Jack descendit se promener dans les rues bondées autour de Time Square

La photo montre une rue pleine de monde. Quelles sont les informations importantes sur cette photo ? Il me faut lire la légende pour le savoir, et encore… La rue est à Time Square, OK, si je suis familier des lieux, je l’avais peut être déjà remarqué. Par contre qui est Jack ? L’homme en chemise de dos ? Ou au contraire l’homme au milieu de la foule, de face, avec ses lunettes sur le front ? Un autre ? La photo me montre au même niveau les informations importantes et les détails accessoires. Il existe certes des subterfuges pour mettre en emphase les informations importantes : légende, floutage, loupe, cadrage…. mais en définitive rien d’aussi simple et radical que ce que nous dit cette simple phrase :  « Jack descendit se promener dans les rues bondées autour de Time Square » .
En effet, si je m’étais contenté de vous dire cette phrase sans vous montrer la photo, je vous aurais donné toutes les informations importantes et rien que les informations importantes ; votre cerveau se serait chargé tout seul de construire le décor autour (c’est en ce sens que la parole peut-être elliptique).
Contrairement à l’écran de votre télé, d’ailleurs, votre cerveau n’a pas de limite : peut-être, probablement, sans doute, certainement auriez-vous imaginé une rue autrement plus bondée et bigarrée que celle de la photo.

La parole, donc, peut et doit être synthétique. C’est un art qui s’apparente à la sculpture de la glaise : je dois dans un premier temps agréger mes concepts pour construire mon message, puis élaguer consciencieusement mon discours pour le débarrasser de tout le superflu.

L’audio est un média non accaparant :

Vous pouvez l’écouter au volant ou les mains prises.

Pour autant, non accaparant ne signifie pas qu’il ne peut pas être captivant. Tout au contraire l’audio a la capacité de débrider l’imagination :
Revenons sur cette sentence : « Contrairement à l’écran de votre télé, votre cerveau n’a pas de limite« .

Imaginons que dans un film vous ayez le plan suivant :

Gros plan sur le regard de William, qui s’extasie à voix haute.

 

« Bon sang, c’est incroyable ! Cette petit ville grouille de monde… Les chariots des pionniers parcourent la rue principale, les quakers qui se rendent au general store, des cow-boys éméchés sortent du Saloon tandis que d’autres s’y précipitent, le sherif a toutes les peines du monde à maintenir un semblant d’ordre… Quel spectacle ! »

Vous vous diriez alors probablement que le réalisateur était arrivé à cours de budget au moment de tourner son plan et qu’il a donc eu recours à une très, très grosse ficelle pour éviter d’avoir à faire le décor de la ville, les costumes et à payer des figurants. Vous vous diriez aussi que personne ne saurait être dupe d’une ruse aussi grossière et vous auriez certainement raison…

Pourtant, ce même subterfuge est utilisé à tour de bras – et avec succès – dans l’audio ou dans l’écriture. Pour ces médias, en effet, on est bien obligé de mettre l’imagination du lecteur ou de l’auditeur à contribution et les lecteurs comme les auditeurs s’y prêtent de bonne grâce sans même s’en rendre compte.

Il en découle une particularité fondamentale de l’audio et de l’écriture : s’il n’existe guère qu’une version d’un film, il existe autant de variantes d’un livre qu’il y a de lecteurs et chaque auditeur construit sa propre version du conte qu’il entend. L’écoute, comme la lecture, ne sont pas consommées passivement, mais sollicitent la participation active du public.

C’est sans doute à cause de cela que la radio est le média qui inspire le plus confiance : notre cerveau construit la représentation la plus désirable et échafaude les hypothèses qui nous semblent les plus vraisemblables. On est naturellement enclin à se croire soi-même.

Peut-être vous demandez-vous – si c’est la participation active du public lui-même qui contribue à la crédibilité du média audio – pourquoi l’écrit n’inspire-t-il pas autant confiance ? Eh bien tout d’abord sachez qu’en matière de confiance, la presse écrite vient juste après la radio : il s’en est donc fallu de peu ;-). Mais en définitive, je crois que l’avantage de l’audio vient de sa capacité supérieure à transmettre et susciter l’émotion. Ce point a déjà été évoqué, nous n’y reviendrons pas.

En guise de conclusion

Ici s’achève notre petit tour des différents modes de communication, de leur histoire et de leurs vertus respectives.

J’espère vous avoir convaincu, s’il en était besoin, que l’avenir n’est pas à l’hégémonie ou la domination d’un de ces modes de communication sur les autres : comme les instruments d’un orchestre, il faut les utiliser en fonction de leurs avantages et de leurs charmes respectifs, tantôt de concert et tantôt alternativement.

Parmi ces modes de communication, il en est un qui cultive les paradoxes :

  • il est capable d’emprunter le registre des émotions comme celui des idées et des concepts,
  • c’est un média secondaire, non accaparant, que l’on peut écouter en faisant autre chose, mais qui sollicite activement l’imagination et la réflexion des auditeurs,
  • c’est un média sobre, dépourvu d’artifice, mais qui en faisant appel à l’imaginaire des auditeurs s’affranchit des limites.

C’est l’audio.

Si ce média vous intéresse, n’hésitez pas à nous contacter.

Une newsletter par mois pour vous informer sur le marché de l’audio digital.

Juste ce qu’il faut savoir pour prendre vos décisions.

Veuillez activer JavaScript dans votre navigateur pour remplir ce formulaire.

Votre e-mail, avec votre consentement, est utilisé par la société Saooti pour recevoir les newsletters sélectionnées. En savoir plus

Articles recommandés