On se souvient de la fameuse robe qui avait divisé la toile en 2015, selon qu'elle soit perçue comme blanche ou bleue. C'est désormais un enregistrement sonore qui sème la zizanie sur les réseaux sociaux. En effet, là où certains entendent le mot "Laurel" prononcé en anglais, d'autres comprennent "Yanny". Un débat qui a aussi partagé la rédaction de Sciences et Avenir... mais qui peut s'expliquer scientifiquement. En cause ? L'ambiguïté de ce signal auditif, qui peut être interprété par le cerveau de différentes façons. Une illusion qui rappelle le fameux dessin de vase du psychologue Edgar Rubin, où l'on discerne soit le vase, soit deux visages. Dans le cas présent, on peut entendre "Yanny" ou "Laurel"... et l'interprétation varie en fonction de la hauteur du son, mais aussi de votre audition. Explications.
Vase de Rubin
Un son devenu ambigu pour nos oreilles à cause d'un réengistrement
D'où vient cet enregistrement, pour commencer ? Il est donné pour le nom commun "laurel" en anglais (laurier en français) sur le site Vocabulary.com. Le clip est devenu viral lorsqu'une lycéenne américaine a cherché le mot face à sa classe pendant un cours de littérature, et qu'elle se rend compte qu'elle entend "Yanny". Contrairement à ce que spéculaient au départ les internautes, il n'a pas été obtenu par synthèse vocale, mais a été enregistré en décembre 2017 par un chanteur d'opéra new-yorkais, rapportent nos confrère de Wired (en anglais).
L'enregistrement litigieux, reproduit ci-dessus
RÉ-ENREGITREMENT. Or, certains camarades de la lycéenne rapportent (sur Instagram et Reddit) que le son qui s'est retrouvé sur les réseaux sociaux n'a pas été enregistré directement depuis Vocabulary.com... mais avec un dictaphone, à partir des hauts-parleurs de l'ordinateur. De quoi surcharger le signal en bruit parasite dans les hautes fréquences, reproduites de façon exagérées comme le montre les spectrogrammes (type de diagramme représentant l'intensité du signal en fonction de la fréquence sonore et du temps) ci-dessous, établis par le New York Times.
Spectrogramme de l'enregistrement initial, de l'enregistrement litigieux, et de "Yanny"
Les explications de la phonétique
On peut le voir sur les spectrogrammes, l'enregistrement du fameux tweet (au milieu) présente beaucoup de bruit par rapport à l'enregistrement initial de Vocabulary.com (à gauche), surtout dans les hautes fréquences. C'est ce "grain" audio qui expliquerait pourquoi le cerveau croit entendre "Yanny", et ce en l'absence de consonnes nasales. "Le Y/L initial n'est pas vélarisé, c'est à dire que la langue du locuteur ne touche pas le palais, or c'est le cas chez la plupart des anglo-américains", explique à The Atlantic Chelsea Sanker, phonéticienne à l'université Brown, aux États-Unis. Et ce n'est pas tout : "la consonne du milieu n'est pas un N, mais on peut en entendre un car la voyelle qui la précède est particulièrement nasale."
HAUTEUR. Comme si le phénomène n'était pas suffisamment étonnant, les internautes se sont rapidement rendus compte qu'en élevant ou abaissant la hauteur du son (pitch), on pouvait forcer dans un sens ou dans l'autre la perception du son (voir tweet ci-dessous). L'explication peut se lire dans les spectrogrammes : l'intensité du signal est plus forte dans les basses fréquences pour "Laurel", et plus élevée dans les hautes fréquences pour "Yanny".
Ok, so if you pitch-shift it you can hear different things:
— Steve Pomeroy (@xxv) 15 mai 2018
down 30%: https://t.co/F5WCUZQJlq
down 20%: https://t.co/CLhY5tvnC1
up 20%: https://t.co/zAc7HomuCS
up 30% https://t.co/JdNUILOvFW
up 40% https://t.co/8VTkjXo3L1 https://t.co/suSw6AmLtn
L'audiogramme individuel joue aussi sur la perception du son
D'autres facteurs interviennent. Certains sont inconscients, par exemple la première des deux options à avoir été lue à l'écrit, mais l'âge joue aussi : l'audition diminue naturellement dans les aigus avec l'âge, ce qui pourrait orienter la perception vers "Laurel", version davantage concentrée dans les basses fréquences. Ce qui pourrait expliquer pourquoi la jeune Américaine a entendu "Yanny". Faut-il en déduire que l'on entend plus volontiers "Yanny" lorsqu'on est jeune, et "Laurel" lorsqu'on prend de l'âge ? Faites le test, et à vous de voir !