Échantillonnage et Shannon
Pourquoi apprendre ça ?
Quand on enregistre de la musique en numérique, on prend des "photos" du signal sonore plusieurs milliers de fois par seconde. Mais combien de fois par seconde suffit-il pour ne rien perdre ? Le théorème de Shannon-Nyquist répond précisément : il faut échantillonner à plus du double de la fréquence maximale du signal. En dessous, des artefacts sonores apparaissent — c'est le repliement spectral.
Analogie
Imagine filmer les ailes d'un ventilateur. Si tu filmes trop lentement, les ailes semblent tourner à l'envers ou très lentement — c'est le repliement (aliasing). Pour "capturer" correctement un mouvement de fréquence , il faut filmer à au moins images par seconde. Le même principe s'applique aux signaux audio et numériques.
Processus d'échantillonnage
Théorie
Échantillonner un signal continu consiste à prélever ses valeurs à intervalles réguliers de période :
La fréquence d'échantillonnage est (en Hz).
Mathématiquement, l'échantillonnage correspond à multiplier le signal par un peigne de Dirac :
Dans le domaine fréquentiel, cette multiplication devient une convolution avec un peigne de Dirac en fréquence, ce qui se traduit par une périodisation du spectre de avec période .
Échantillonnage d'un signal audio
Signal audio couvrant Hz (plage auditive humaine).
La norme CD utilise Hz (44,1 kHz) :
- On prend 44 100 mesures par seconde
- Période d'échantillonnage :
- Chaque sample est encodé sur 16 bits
La norme DVD audio utilise Hz — plus de précision temporelle, mais fichiers plus lourds.
Théorème de Nyquist-Shannon
Théorie
Théorème de Nyquist-Shannon :
Un signal dont le spectre est limité à Hz (signal à bande limitée) peut être parfaitement reconstruit depuis ses échantillons si et seulement si :
La fréquence est appelée fréquence de Nyquist. Elle est la fréquence maximale représentable sans distorsion.
Démonstration intuitive : l'échantillonnage périodise le spectre avec période . Pour que les copies spectrales ne se chevauchent pas (condition nécessaire à la reconstruction), il faut que la largeur du spectre soit inférieure ou égale à , soit .
Formule de reconstruction (interpolation de Whittaker-Shannon) :
où . La reconstruction est exacte — pas d'information perdue si .
Applications du théorème de Nyquist
| Application | | requis | utilisé | |-------------|------------|--------------|----------------| | Téléphonie | 4 kHz | ≥ 8 kHz | 8 kHz (G.711) | | Audio CD | 20 kHz | ≥ 40 kHz | 44,1 kHz | | Audio HD | 96 kHz | ≥ 192 kHz | 192 kHz | | ECG médical | 150 Hz | ≥ 300 Hz | 1 000 Hz (marge) |
Pourquoi 44,1 kHz et pas 40 kHz ? La marge () permet de concevoir des filtres anti-aliasing réalistes — aucun filtre réel n'a une coupure parfaitement verticale à .
Checkpoint
Un signal contient des fréquences jusqu'à 8 000 Hz. Quelle est la fréquence d'échantillonnage minimale requise par le théorème de Shannon ?
Repliement spectral (aliasing)
Théorie
Si , les copies du spectre créées par l'échantillonnage périodique se chevauchent — c'est le repliement spectral (aliasing).
Conséquence : les composantes fréquentielles situées au-dessus de sont mal représentées. Dans le signal reconstruit, elles réapparaissent comme des fréquences parasites inférieures à .
Calcul de la fréquence repliée : une sinusoïde de fréquence échantillonnée à apparaît à la fréquence :
Cas simple — si : alors .
Prévention : utiliser un filtre anti-aliasing (filtre passe-bas de coupure ) AVANT l'échantillonnage pour éliminer les composantes qui se replieraient.
Exemple audio — l'aliasing en pratique
Signal de fréquence Hz, échantillonné à Hz.
Fréquence de Nyquist : Hz.
→ repliement.
Fréquence repliée : Hz.
Le signal à 11 kHz apparaît comme un signal à 3 kHz dans le signal reconstruit — artefact indésirable qui sonne "faux".
Avec filtre anti-aliasing : on coupe tout au-dessus de 4 kHz avant l'échantillonnage → 11 kHz est supprimé → pas de repliement.
Piège : égalité fs = 2·fmax est insuffisante en pratique
Le théorème de Shannon dit est nécessaire et suffisant en théorie (avec des filtres et signaux parfaits). En pratique : les filtres anti-aliasing ne peuvent pas couper exactement à (pas de filtre "brique" idéal), et les signaux ont rarement un spectre strictement borné. C'est pourquoi les systèmes réels utilisent significativement supérieur à pour avoir une bande de transition exploitable. La condition théorique est nécessaire mais insuffisante pour un système réel.
Checkpoint
Une fréquence de 7 kHz est échantillonnée à fs = 10 kHz (fN = 5 kHz). Quelle fréquence apparaît dans le signal reconstruit ?
Reconstruction — Filtre passe-bas idéal
Théorie
Reconstruction idéale (Whittaker-Shannon) : la reconstruction parfaite s'obtient par convolution des échantillons avec un filtre sinus cardinal (passe-bas idéal de fréquence de coupure ) :
Ce filtre a une réponse fréquentielle rectangulaire : il laisse passer exactement et coupe parfaitement au-delà. Son support temporel est infini (le sinus cardinal s'étend à ), ce qui le rend non causal et non implémentable directement.
En pratique — chaîne de reconstruction numérique :
- CNA (convertisseur numérique-analogique) : produit une approximation en escalier (maintien d'ordre zéro, ZOH) — constant sur chaque
- Filtre de lissage analogique : filtre passe-bas qui élimine les harmoniques dues à l'effet d'escalier et restitue un signal continu
- La pente de coupure dépend de l'ordre du filtre : un filtre d'ordre donne dB/décade au-delà de la coupure
Bruit de quantification : encoder chaque valeur sur bits introduit une erreur. Le rapport signal sur bruit est : Chaque bit supplémentaire apporte environ 6 dB de SNR.
Reconstruction — du numérique à l'analogique
Étape 1 (CNA + ZOH) : les échantillons sont convertis en signal à escaliers . Ce signal contient le spectre utile mais aussi des répliques atténuées autour de , , etc.
Étape 2 (filtre passe-bas) : un filtre analogique de coupure élimine toutes les répliques spectrales. La sortie est le signal continu reconstruit.
Qualité de reconstruction pour le CD (16 bits) :
C'est bien au-delà du seuil d'audibilité humain (~120 dB de dynamique maximale perçue). Pour un signal encodé sur 8 bits : dB — qualité téléphonique.
Filtres de reconstruction — ordres pratiques
Pour l'audio CD ( kHz, kHz) :
- Bande passante souhaitée : kHz
- Bande de transition disponible : kHz (seulement 4,1 kHz de marge)
- Pour une atténuation de 80 dB dans la bande coupée avec 4,1 kHz de transition, un filtre elliptique d'ordre 7 à 9 est typiquement nécessaire
Les filtres numériques RIF (réponse impulsionnelle finie) sont souvent utilisés côté numérique pour leur phase linéaire — garantissant une distorsion de phase nulle sur le signal reconstruit.
Checkpoint
Pourquoi le filtre de reconstruction idéal (sinus cardinal) n'est-il pas implémentable tel quel en pratique ?
Checkpoint
Un ingénieur encode un signal sur B = 8 bits. Quel est l'ordre de grandeur du SNR de quantification ?
À retenir
- Échantillonnage : prélever à fréquence — périodise le spectre avec période
- Théorème de Shannon : pour une reconstruction parfaite
- Fréquence de Nyquist : — fréquence maximale représentable sans distorsion
- Repliement (aliasing) : si , fréquence repliée pour
- Filtre anti-aliasing : couper AVANT l'échantillonnage — indispensable en pratique
- Reconstruction : filtre sinus cardinal idéal → en pratique CNA (ZOH) + filtre analogique passe-bas
- Quantification : dB — chaque bit vaut ~6 dB