Interview de THXRD sur le sujet « fichier compressé » avec perte ou sans perte, LOSSLESS (FLAC, ALAC) ou LOSSY (MP3, AAC).

Fichier compressés avec ou sans perte, LOSSLESS (FLAC, ALAC) ou LOSSY (MP3, AAC)Bonjour THXRD,

Pouvez vous nous expliquer pourquoi il est difficile d’entendre de réelles différences entre un bon fichier compressé de type AAC ou MP3 et un fichier lossless ?

THXRD :

Tout sera lié à la source et au type de musique.

Les différences ne peuvent pas être entendue si la musique a elle-même été fortement réduite en dynamique et en spectre lors du mixage.

Par exemple : un remix techno / ou une musique, faite à 95 % depuis des synthétiseurs en studio ou encore une « variété » courante actuelle, présente des mixages très ordinaires en terme de dynamique.

Il faut préciser que des traitements sonores, entraînants une réduction drastique de la richesse spectrale et de la dynamique est appliquée, ceci afin de rendre cette musique adaptable à tout type de supports de diffusion.

Dans ces conditions, la compression des fichiers « master » réalisés en sortie de studio vers du MP3 ou autre, est très peu destructive.
Les algorithmes de ces compresseurs « avec perte » sont basés justement sur l’analyse de la richesse spectrale, de la dynamique et du temporel, que ne contient pas ce genre de musique.

HFST:

C’est pour cela que les comparatifs ABX sur ce type de musique n’apportent rien…

THXRD:

Oui, on part d’un signal qui est simpliste au départ…
D’ailleurs les encodeurs réducteurs de débit sérieux, examinent le spectre avant encodage.
Ensuite, ils compressent fortement la dynamique en réduisant le spectre.

HFST:

Donc, les fichiers HD 24/96 ou plus que l’on prétends comme meilleurs qualitativement ne servent à rien ???

THXRD:

Les fichiers HD, en 24/96 (ou plus) sont utiles si votre objectif est de restituer la qualité de la prise de son originale offrant une grande richesse spectrale.

Lorsque l’on enregistre de la musique complexe « naturelle » faite avec de vrais instruments : orchestre symphonique / Jazz / opéra / ou variété « acoustique ». Si la prise de son est faite avec de bons ingénieurs, dans de bons studios, sans réduction de dynamique et sans traitement de spectre, le tout avec des micros bien positionnés et un travail sérieux, là on aura évidemment une différence importante…

Le débit en 24 Bits/96khz pour un signal stéréo est de 4608 kilobits par seconde, comment peut ont imaginer le réduire à 256 kilobit/s sans perdre d’informations ? C’est une réduction par un coefficient de 18 !!!

HFST:

Comment cela se passe en studio ?

THXRD:

Il faut d’abord savoir que l’enregistrement en studio est toujours fait en 24Bits/96 kHz minimum (voir 24/192, ou même DXD 24/384, ou encore en DSD 5.6 megaherz, quoique que le DSD ne permet pas le montage).

Le 24/96 (ou au dessus) est utilisé quasi exclusivement en studio depuis les années 90.

HFST:

Pourquoi dans ce cas avoir normalisé les CD en 16Bits/44kHz ?

THXRD:

Dans les années 80, au début du numérique, on a considéré que 16/44.1 était suffisant.

Suivant le théorème de Shannon / Nysquit, une F sample supérieure de 2,1 fois la plus haute fréquence à transmettre est suffisante, ce qui nous nous donne 21 kHz de Bande Passante théorique, de quoi passer les fréquences les plus basses comme les plus élevées, audible à l’oreille humaine.

Mathématiquement, c’est absolument vrai.
Mais comme toujours, l’univers numérique… est numérique, dans le monde réel c’est plus complexe.
Le filtrage et traitement d’un signal échantillonné à 44,1 introduit des défauts notoires des 9/10 kHz !!

De nos jours pour faire du 16/44.1 final sur le CD, on enregistrera en fait à 88,2 ou 176 kHz sur 24 Bits (pour éviter les problème de filtrage des 9/10 kHz)

Ensuite, le 24 Bits sera réduit en 16 Bits et le 176 ou 88 kHz sera « downsamplé » en 44.1 kHz. Dans ce cas, cette conversion sera non destructive car on est dans le monde numérique, sous multiple direct 176 / 88 /44 kHz.

À la lecture on re-sursamplera en 88 ou 176 kHz dans le DAC pour éviter les problèmes de bruits et de phases. On voit donc une succession de manipulations plus ou moins destructives dans le cas du 44.1 kHz.

HFST:

Et pour les formats HD 24/96 ?

THXRD:

A la conversion AD (Analogique Digitale), le 24/96 kHz est parfait car on est en « natif » et au delà du signal source sur tout les paramètres, on reste « natif » jusqu’au DAC de sortie, donc, aucune conversion.

Faut imaginer ensuite que pour les sources « compressées » (MP3 / AAC etc..) avec pertes, on repart dans 95% des cas, d’un encodage / compression depuis la source en 16/44.1 !! Et quasiment jamais du « master » original en 24/96…

En effet, à l’arrivée, il y a quelques différences avec le fichier « source » master…

HFST:

On comprend bien que les différences en ABX ne sont pas audibles car on ne recherche pas les vrais défauts, les vrais défauts étant la compression de la dynamique !

THXRD:

OUI, la perte à la compression, c’est essentiellement l’échelle dynamique.

Par exemple, la compression serait comparable au travail que fait un compresseur en concert pour ne pas casser les hauts parleurs.
Le compresseur réduit la dynamique dans les pics de pressions, il lisse la musique, il y a moins d’impact…moins de dynamique.

Le résultat, c’est que nous sommes très loin de l’idée de la HiFi qui consistait, à l’origine, à reproduire la réalité de sons naturels, joués par des instruments… le silence quand rien ne joue et beaucoup de pression acoustique quand les musiciens jouent tous ensembles !

HFST:

Donc, ce type de fichiers Mp3 ou AAC compressé n’entache pas trop la transparence, mais la dynamique en prends un coup…

THXRD:

OUI, dans les années 90 – 92, est apparu une nouvelle approche de la musique enregistrée, consistant à utiliser essentiellement l’ordinateur et le synthétiseur. Ces productions étaient souvent réalisées dans des « Home Studio » basiques.

Ces enregistrements, basés sur une culture musicale totalement différente de ce que nous connaissions avant, ou personne ne joue d’un instrument et ou, dans 95% des cas, on remix des sons déjà existant ou resamplés.

Cette musique s’est dirigée essentiellement sur le côté rythmique de sons « nouveaux », des sons créés artificiellement.
C’est un autre monde qui c’est ouvert, une autre culture, tout à fait défendable d’ailleurs…
Ces sons, sans références aucune à une quelconque réalité, n’utilisent que très peu l’espace spectral (sauf dans le grave) et quasiment pas la dynamique.

On ne joue pratiquement exclusivement que sur une « dynamique lente » et sur le niveau sonore pur (ce qui vaut une évolution gravissime des pertes d’audition dans la génération 25/45 ans, principalement à cause des casques de baladeurs)

Tout ceci tombait très bien pour les logiciels de compression de fichier musicaux qui justement, suppriment la dynamique et le spectre…que ne contient pas cette musique. L’avantage est par contre évident, les fichiers sont légers et tiennent sur les petites mémoires des téléphones et autres baladeurs.

Donc, 25 ans de marketing / 25 ans de musique « nouvelle » basée sur le niveau sonore moyen pur (et anormalement élevé) dans un spectre réduit et une dynamique ultra faible.

Par exemple, certaines stations de radio FM poussant dans cette direction, limitent la dynamique autour de 3 à 4 dB, grâce à des traitements avant émission…

En une génération, la notion de dynamique et de « transparence sonore » a largement disparue.

HFST:

La fin de la HiFi…

THXRD:

OUI, le marché HiFi n’existe quasiment plus, mais la mode est aux DAC…
On entends ici ou là, certains vanter la qualité de « DAC » (dans une totale incompréhension de ce que c’est réellement) qui ferait 32 bits (ce qui est totalement faux) et qui rendrait extraordinaire la musique sortant de ces appareils. Les DAC dit « haut de gamme » ne servent à rien si :

– L’enregistrement est complètement limité dès le départ par une trop faible dynamique, enregistrement qui pourrait largement se contenter de travailler en sur 12 bits/ 32 kHz.

– Le fichier de l’enregistrement qui était à l’origine, de bonne qualité, a été repassé à la moulinette de la compression avec pertes !!

HFST:

Que faut il acheter comme fichier musical alors ?

THXRD:

Cela va dépendre du type de musique que vous allez écouter.

Pour retrouver un son spectaculaire, il faut que l’ensemble de la chaîne soit correcte; de la musique jouée avec de la dynamique, comme par exemple, certains orchestres symphoniques, du Jazz, de l’opéra ou de la variété « acoustique ».

Les écarts seront alors considérables en terme de spectre et de dynamique entre un petit fichier audio type MP3 et un bon fichier HD 24/96, pour peu que l’installation audio permette de retranscrire le message sonore et que l’écoute se fasse dans de bonnes conditions.

Une écoute avec un bon casque et un ampli dédié peut aussi se révéler spectaculaire.

HFST:

Quel est le rapport entre la dynamique et le nombre de Bits ?

THXRD:

6 dB par Bits.
En réalité, les meilleurs convertisseurs existants sont capables, au mieux, d’atteindre 20/21 bits théoriques et 19/20 réels, soit 120 dB d’échelle dynamique, mais ça, ce sont les DAC (Digital vers Analogique avant l’ampli et les enceintes).

A l’enregistrement, avant d’être numérique, le son est acoustique.
Il est acquit par des micros puis il est samplé.
Les meilleurs AD (Analogique vers Digital) de capture analogique peuvent atteindre un quantize réel de 19/20 bits, soit, la aussi, 120 dB d’échelle.

Mais pour un CD, on utilise à l’enregistrement une échelle de 16 bits (à partir d’un quantize Analogique vers Digital de 24 bit) soit 96 dB d’échelle…
En théorie, tout va bien de nos jours car, même dans ce cas, les AD sont des 24 Bits.

Dans la pratique c’est bien plus complexe, car la marge de réglage de volume se réduit énormément.
En clair, on à droit à 20/25 dB de réglage de volume (en condition de bruit de salle de studio), alors que sur 24 Bits, on sera plutôt autour de 45/50 dB d’échelle possible de réglage de volume sans perte, ceci toujours en conditions studio, soit un Noise Room de 15/17, condition jamais réalisée en salle domestique (qui est plutôt autour d’un Noise Room de 35/40 voir pire)…

Ça sauve la situation par l’effet de masquage des pertes en niveau faible par le niveau de bruit résiduel de la pièce…

Attention, on doit conserver en mémoire un autre aspect des choses :
Il est clair que si l’on divise une échelle dynamique « réelle » par 60 dB (c’est à dire la musique réelle que capte les micros entre les moments de silences et les moments à SPL maxi) on obtient :
– En 16 bits, 65536 niveaux d’analyse
– En 24 bits, 16 777 216 niveaux d’analyse
La précision du quantize sera évidemment sans rapport entre les 2 !!
Et si en plus, le quantize en 16 Bits est convertit par une source primaire de quantize 24, les erreurs d’approximations s’ajoutent…

En simple si on ne touche à rien ou peu sur le niveau de volume avec des musiques simples dynamiquement, le 16 Bits passera dans un salon / séjour, la ou le Noise Room est à 35/40dB.

Dans un lieu silencieux, traité acoustiquement, avec des musiques à grande échelle dynamique, le 16 Bits sera trop court…

HFST :

Quel est le meilleur format audio ?

THXRD:

Il existe 2 techniques pour réduire la taille des fichiers numériques audios :
1- La compression sans pertes dit LOSSLESS
2- La compression avec pertes dit LOSSY

Pour de l’audio sans perte dit « LOSSLESS », les références connues sont le Flac, le Flac HD, le ALAC Apple, le Dolby trueHD, le DTSHDmaster et quelques autres très peu utilisés.

Ces formats ont un ratio de compression entre 1,5 et 2, soit 10 à 15 mégabits après la compression d’un fichier original de 20 mégabits.

Les fichiers sont simplement compressés par l’algorithme afin d’en réduire la taille sur le support, puis ensuite décompressés à la lecture afin de retrouver un fichier quasi original au fichier master.

Ces algorithmes ont été testés en laboratoire et une décompression pure en PCM montre que l’on retrouve l’intégralité au bit près, Le LOSSLESS est donc une bonne solution.

En fait les algorithmes dits sans pertes sont intéressant mais demandent toujours des capacités de stockage énormes, donc obligation de gros supports domestique comme le BD (BluRay Disc) ou gros disques dur.

Pour l’audio dit « avec pertes » LOSSY :

Ces formats ont un ratio de compression d’environ 5 à 8, soit 3 à 5 mégabits après compression d’un fichier original de 20 mégabits.
L’AAC est une évolution du Mp3, il est théoriquement moins dégradant et également conçu par le Fraunhofer institut.

Les évolutions portent sur plusieurs points, mais restent relativement mineures.

Fraunhofer parle :
– D’une meilleure gestion des jonctions stéréo
– D’une amélioration de la gestion au delà de 16 kHz, mais l’évolution porte surtout en fait, sur le nombre de canaux gérable (48) et la possibilité de traiter du 96 kHz
– D’évolutions au niveau de la méthode d’analyse (qui reste du même principe quelle mp3)
– D’une meilleure gestion des droits (DRM)

Au mieux, on peu attendre une très légère amélioration, mais aucun test sérieux de laboratoire n’est venu démontrer une supériorité auditive nette du AAC sur du MP3 à débit égal.

Toute décompression d’un fichier encodé en MP3 ou AAC (retour en PCM) montre une destruction énorme du signal lors d’une analyse bit à bit avec le PCM original.

HFST:

Et pour l’image ?

THXRD:

Avec l’image, les coefficient de compression peuvent atteindre des valeurs énormes et là encore il y a des seuils à ne pas dépasser.

Mais en images, paradoxalement, c’est plus simple qu’en audio car le pouvoir d’analyse du cerveau est limité au mieux autour de 8/10 Bits et encore moins sur la couleur!!

La compression joue sur 3 paramètres : le mouvement / la couleurs / la définition.
Paradoxalement sur une image fixe ça se voit plus vite.

HFST:

Pour conclure, si on écoute de la techno ou du RAP, le ACC 256kbps convient ?

THXRD:

Oui, Pour de la musique techno/ dance / rap /hip hop / RNB ect .. Pas tellement de dynamique / spectre court / et aucune référence à une réalité donc là, aucun problèmes, à condition de conserver un débit raisonnable comme le 256 kbps ou le 320.
Néanmoins, le MP3 et les autres fichiers avec perte sont arrivés à point surprenant dans l’esprit du grand public.

Il a suffit de 25 ans de « bourrage » de crâne marketing affirmant que le MP3 est égal au « son CD » pour qu’en une génération d’individu, la culture de l’écoute et de l’audition disparaisse !!

HFST:

Merci pour ces informations, toujours enrichissantes !

3 Thoughts on “Fichier compressés avec ou sans perte, LOSSLESS (FLAC, ALAC) ou LOSSY (MP3, AAC)

  1. Pingback: TESTS ABX FICHIER AUDIO FLAC – ALAC lossless VS AAC – MP3 – FORMAT AUDIO NUMERIQUE | HiFi-STereo.fr, conception, design enceinte audiophile DIY active, DAC, amplificateur et acoustique

  2. Pingback: sources numerique audio, FLAC, ALAC, LOSSLESS, MP3, AAC

  3. Pingback: HiFi ou home cinema difference

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Post Navigation