Poprzedni
Następny

Co to jest kompresja dźwięku? Rodzaje kompresji - bezstratna i stratna kompresja audio

Średnia ocen: 5
(14 ocen) 4 komentarze

Zapewne słowo „kompresja dźwięku” obiło Ci się nieraz o uszy. Uważam, że każdy użytkownik sprzętu audio, który chce osiągnąć w swoim systemie wysoką jakość dźwięku, powinien wiedzieć, co to za proces i jaki ma wpływ na brzmienie. Dlatego właśnie w tym poradniku przedstawię wszystkie istotne informacje dotyczące kompresji, aby świadomie wybierać pliki i wiedzieć, jaki ma ona wpływ na jakość dźwięku.

Co to jest kompresja? Rodzaje kompresji - spis treści

  1. Co to jest kompresja dźwięku?
  2. Na czym polega kompresja dynamiki dźwięku?
  3. Na czym polega kompresja?
  4. Jakie są typy kompresji
  5. Podsumowanie
  6. FAQ - najczęściej zadawane pytania

odtwarzacz sieciowy rose rsa520

Co to jest kompresja dźwięku

Kompresja jest procesem, który znalazł zastosowanie w wielu dziedzinach naszego życia. Nas interesuje oczywiście kompresja dźwięku, która odnosi się do plików muzycznych zapisanych w formacie cyfrowym. To słowo można potocznie wytłumaczyć jako upychanie i ściskanie danych i słusznie oddaje to jego ideę, ponieważ głównym celem jest oczywiście zmniejszenie ilości danych do zapisu. Warto jednak wiedzieć, że z technicznego punktu widzenia kompresja dźwięku zmniejsza zakres pomiędzy najgłośniejszymi i najcichszymi częściami sygnału audio.

stratny-bezstratny

Na czym polega kompresja dynamiki dźwięku?

Kompresja jest pojęciem stosowanym w audio również w innym zakresie niż opisywanie wielkości pliku komputerowego. Termin ten stosują inżynierowie dźwięku, realizując daną płytę lub utwór muzyczny. Celem kompresowania dynamiki jest przyciszenie dźwięku, gdy zaczyna on wchodzić w przester i podnoszenie jego głośności, gdy dźwięki są słabo słyszalne. Proces ten wyrównuje poziom głośności np. dla różnych instrumentów muzycznych. Gdy gitara akustyczna gra za cicho względem skrzypiec – jej poziom jest podnoszony do wyższych wartości.

Obecnie zauważalna jest tendencja, by realizowane płyty grały jak najgłośniej. Jest to możliwe dzięki wysokiemu poziomowi kompresji, ale sytuacja ta ma również swoje minusy. Pasmo poddane spłaszczeniu traci na dynamice. By to zrozumieć, zachęcam do posłuchania Boléro Ravela. Utwór zaczyna się cicho wprowadzanym werblem, który nadaje rytm. Dynamiki dodają wchodzące kolejno instrumenty grające coraz głośniej, by już po kilku minutach ciarki na naszym ciele wywołała cała orkiestra, złożona z 26 instrumentów. Rozpiętość głośności jest tutaj przeogromna, a tego brakuje w nowoczesnych realizacjach, których celem jest niekiedy wyłącznie maksymalizacja głośności.

Kompresja dotycząca dynamiki, tak jak wspomniałem wcześniej, to również próba uwydatnienia cichych dźwięków, by te były bardziej słyszalne. Dlaczego taki sposób realizacji jest stosowany? Nieco winy za to ponosi sam nośnik, czyli najczęściej płyta CD. Ta, w swoim założeniu oferuje jedynie 96 dB a dynamika grania orkiestry symfonicznej to 140 dB. Realizator, nie chcąc, byśmy stracili słyszalność niektórych dźwięków, odpowiednio je wycisza lub zwiększa poziom natężenia dźwięku.

Po kompresji

Muszę przyznać, że część płyt CD realizowanych jest w niewłaściwy sposób. Aby to wyjaśnić, posłużę się przykładem. Byliśmy na koncercie jakiegoś zespołu – zachwyceni ich występem kupujemy płytę, a później okazuje się, że ta gra płasko. Dlaczego? Właśnie dlatego, że przyzwyczailiśmy firmy fonograficzne do wydawania głośnych płyt. Te ciche są szybko krytykowane, przez nieświadomych odbiorców odbierane jako „źle zrobione”. Te ciche są jednak często zrobione z pełną świadomością tego efektu. Nie krytykujmy tego.

A co zrobić, gdy płyta CD gra płasko? Często, z pomocą przychodzi winyl. Nierzadko wywoła on efekt pozytywnego zaskoczenia – zadziwi słuchacza tym, że można otrzymać taką różnicę na dynamice. Co ciekawe jednak, w pomiarach znacznie lepsze wartości dynamiki wykazuje winyl. Utwory na płycie kompaktowej osiągają dynamikę 90 dB, podczas gdy na czarnej płycie jedynie 35 dB. Radzę więc, aby samemu porównać podczas odsłuchu te dwa źródła, ponieważ te dwa źródła pozwalają uzyskać odmienny charakter dźwięku. Obecnie bardzo popularne są pliki FLAC lub DSD, czyli bezstratne formaty audio, w których dynamika jest przeogromna. Miłośnicy dobrego brzmienia chętnie wybierają też gramofon. Wiem, że poziom szumów podczas odtwarzania czarnej płyty jest wysoki, jednak zakres dynamiki często przewyższa złote krążki.

Na czym polega kompresja?

W jednym z poprzednich akapitów wyjaśniłem już, czym jest kompresja i jaki jest jej cel. Postanowiłem więc wyjaśnić także podstawy i narzędzia stosowane w kompresji, aby użytkownik był nieco bardziej świadomy, czym tak naprawdę różni się plik muzyczny przed kompresją i po niej. Nie ukrywam, że ten akapit napisałem z myślą o bardziej ambitnych miłośnikach dobrego brzmienia, którzy chcą wiedzieć, jak to wszystko wygląda od zaplecza. Proces kompresji dźwięku to w praktyce umiejętne korzystanie z narzędzi, które wymagają znajomości parametrów. Oczywiście, ograniczę się tylko do najistotniejszych informacji.

Pierwszym parametrem jest głębokość kompresji. To pojęcie określane jest w języku angielskim jako ratio. Gdy podczas analizy dźwięku narzędzie wykryje, że sygnał wejściowy przekroczył określony próg, wówczas rozpoczyna się tłumienie sygnału. Założony współczynnik decyduje, o jaką wartość zmniejszy się wartość sygnału.

Próg działania, czyli threshold, to wartość, w której rozpoczyna się proces kompresji. Ustalenie wartości progu wymaga doświadczenia i wiedzy dotyczącej realizacji nagrań. Zbyt niski prób sprawi, że nagranie będzie brzmiało nienaturalnie. Najczęściej kompresji poddawane są głównie krańcowe parametry sygnału, co czyni nagranie bardziej stabilne pod względem poziomu natężenia dźwięku.

Kolejnym parametrem jest attack, co można przetłumaczyć jako czas narastania sygnału. Chodzi o czas w milisekundach, który określi, jak szybko zwiększeniu ulegnie sygnał wejściowy do pełnej wartości współczynnika. Jaki jest cel tego parametru? Realistycznie odtworzenie dźwięku instrumentów muzycznych i wokalu.

Czas wygaszania sygnału (czasami określany jako czas zwolnienia lub zanikania), czyli parametr określany w języku angielskim jako release, jest przeciwieństwem ataku. Właściwe ustawienie wartości tego parametru podczas masteringu pozwala uzyskać właściwy takt i rytm utworu. Innymi słowy – po kompresji utwór nadal będzie brzmiał tak, jak oryginał, co jest niezwykle ważne przy odbiorze dźwięku.

Kolejnym parametrem jest wzmocnienie, czyli gain. Jeśli uważnie czytałeś poprzednie akapity, możesz być nieco zdziwiony i zastanawiać się, po co wzmacniać sygnał, który przecież tłumiliśmy. Pozwala to zrekompensować utraconą dynamikę i zyskać wyjściowy poziom głośności.

Jakie są typy kompresji?

Można wyróżnić dwa typy kompresji, które różnią się między sobą specyfiką oraz końcowym efektem.

Kompresja bezstratna to najwierniejsza forma oryginalnego pliku. Z założenia, jej celem jest przedstawienie utworu tak, by nie ucierpiał żaden słyszalny przez nas szczegół muzyczny. Mówiąc

inaczej, chodzi o to, by te same dźwięki przedstawić mniejszą zajętością bitów w pamięci naszych urządzeń przenośnych lub komputerów.

Wśród najpopularniejszych algorytmów kompresji bezstratnej znajdziemy:

  • FLAC (Free Lossless Audio Codec)
  • WMA / Windows Media Audio 9 Lossless
  • MLP (PPCM) / Meridian Lossless Packing
  • M4A / Apple Lossless
  • APE, inaczej Monkey's Audio

Porównanie

Jakie plusy wnosi bezstratna kompresja? Po pierwsze, jest to niezmieniona jakość muzyki w stosunku do oryginalnego nagrania. Nie tracimy szczegółów, detali, nie zmienia się dynamika i nie ucinane są skraje słyszalnego pasma. Po drugie, zmianie ulega wielkość pliku - większość kompresji bezstratnych wykorzystuje pakowanie 2:1 lub 1,5:1. Obecnie wszystkie odtwarzacze sieciowe, czyli streamery, a także amplitunery, odtwarzają większość wymienionych wyżej bezstratnych formatów audio. Dlatego polecam właśnie wybór bezstratnych formatów dźwięku.

Algorytmy kompresji bezstratnej obecnie są już całkiem dobrze ukorzenione w ludzkiej świadomości i pojmowaniu dobrej muzyki. Priorytety zmieniają się i gdybyśmy jeszcze 15 lat temu zastanawiali się nad tym co wybrać – to zdecydowałby za nas zapewne wysoki koszt nośników danych. Dzisiaj kilkuterabajtowy dysk twardy kosztuje 200-300 zł, czyli tyle, co kilka dobrych płyt. Jeden terabajt to często 200 płyt w formacie FLAC – gwarantuję, że warto w to zainwestować. Dodam także, że użytkownik może również wybrać dysk sieciowy, na którym zapisane będą pliki oraz streamer, który pozwala odtwarzać pliki bezpośrednio z dysku NAS.

Kompresja stratna zapisu sygnału audio to algorytm znacznej oszczędności miejsca na nośnikach danych, ale i utraty na jakości czy szczegółach w dźwięku. Sam zamysł kompresji stratnej powstał wraz z pojawieniem się pierwszych płyt CD Audio i chęci wielu użytkowników do ich skopiowania na dysk twardy swoich komputerów. Pełna płyta CD, zajmująca około 700 MB stanowiła wtedy dość duży procent całej objętości dysków twardych. Wraz z pojawieniem się formatu pokroju MP3, płytę taką mogliśmy spakować do pojemności około 30 MB. Oszczędność bitów była ogromna, a same wartości kompresji powodowały, że plik zajmował często ponad 20 razy mniej miejsca na dyskach. To zdefiniowało mocną na tamte lata pozycję kompresji stratnej.

Do najpopularniejszych formatów kompresji stratnej należą:

  • MP1, MP2, MP3
  • AAC
  • MPC (Musepack)
  • OGG (Vorbis)
  • ATRAC (używany w Minidisc)
  • A/52 (AC3)

Warto wiedzieć, że ludzkie zmysły także działają w pewien określony sposób, o czym na co dzień z pewnością nie zdajemy sobie sprawy. Ludzkie oko jest bardziej wrażliwe na niektóre kolory, na przykład zieleń, a na inne mniej. Podobnie jest z dźwiękami, co można wykorzystać właśnie podczas obróbki sygnału. Kompresja stratna działa najczęściej poprzez usunięcie najmniej słyszalnych przez ludzkie ucho skrajnych tonów niskich oraz wysokich. Przy większych stopniach kompresji usuwa się również ciche szczegóły w muzyce, czyli cierpi na tym detaliczność. Jeśli jesteśmy jakimś czynnikiem zmuszeni do zastosowania kompresji stratnej – to skupmy się na tym, by była ona o możliwie najniższym stopniu kompresji danych, czyli najlepszych właściwościach muzycznych. Gdy mamy jednak tą możliwość, by skorzystać z kompresji bezstratnej – to zdecydowanie ją wybierzmy.

Liczę, że po przeczytaniu powyższych akapitów nie będziesz miał już wątpliwości, jakie pliki audio wybierać. MP3 czy FLAC – bo te formaty są obecnie najpopularniejsze. To jakby porównywać Malucha 126P do najnowszej TESLI. Jeździ jeden i drugi, ale jaki komfort odczujemy, wożąc się nimi to chyba istotna kwestia. Nie inaczej jest z plikami audio.

Warto pamiętać, że gdy tylko zajdzie potrzeba, plik FLAC bez problemu przerobimy na MP3. W drugą stronę to nie działa i jeśli w przyszłości zmieniamy sprzęt na lepszy, pliki MP3, w które zainwestowaliśmy jakieś pieniądze, będą po prostu do wyrzucenia. Jakość niektórych z nich będzie wręcz odpychająca i zamiast delektować się czystym klarownym dźwiękiem, będziemy zmuszeni słuchać szumów.

Podsumowanie

W tym artykule wyjaśniłem wszystkie aspekty kompresji. Nie należy jej postrzegać wyłącznie jako procesu pogarszającego dynamikę i jakość dźwięku. W wielu przypadkach jest to niezbędny proces, aby dało się zapisać nagranie na odpowiednim nośniku. Znając specyfikę i typy kompresji świadomie wybierzesz odpowiednie pliki muzyczne do systemu, co pomoże cieszyć się wysoką jakością dźwięku.

FAQ – najczęściej zadawane pytania

Na czym polega kompresja mp3?

MP3 jest jednym z popularnych formatów dźwięku skompresowanego. Ten algorytm kompresji usuwa dźwięki niesłyszalne przez człowieka. Usunięte mogą zostać także informacje słyszalne, lecz nieistotne dla jakości brzmienia. Istotną cechą tego algorytmu kompresji jest znacznie zmniejszenie rozmiaru pliku, dlatego w czasach, gdy nośniki były drogie, był to popularny algorytm kompresji.

Co daje kompresja?

Głównym celem kompresji jest zmniejszenie rozmiaru pliku poprzez usunięcie z pliku niektórych partii danych. Najczęściej usuwane są informacje nieistotne przy odtwarzaniu dźwięku, których człowiek nie słyszy.

Co to znaczy bez kompresji?

Sygnał dźwiękowy bez kompresji nie posiada żadnych zmniejszonych lub usuniętych części pasma. Taki format cechuje się dużym rozmiarem pliku, dlatego w przypadku utworów muzycznych dane bez kompresji są najczęściej surowym materiałem do dalszej obróbki.

Ile powinna wynosić kompresja?

Istnieje szereg algorytmów kompresji, które różnią się przede wszystkim stopniem usunięcia informacji z oryginalnego pliku. Im większy stopień kompresji, tym więcej danych z pliku wyjściowego usuwanych jest z zakresu teoretycznie niesłyszalnego dla człowieka. W praktyce jednak pliki poddane kompresji w większym stopniu mają wyraźnie niższą jakość, ponieważ usuwane są także niektóre informacje, które są słyszalne przez człowieka. Najlepiej jest, aby kompresja odbyła się w takim stopniu, aby słuchacz nie mógł odróżnić pliku skompresowanego od oryginału. W praktyce jest to możliwe w przypadku kompresji bezstratnej, którą stosuje się w plikach FLAC, WAV, czy WMA. Właśnie dlatego te formaty są chętnie wybierane przez miłośników dobrego brzmienia.

Co to znaczy kompresja bezstratna?

Jednym ze sposobów zmniejszenia rozmiaru pliku jest kompresja bezstratna, polegająca na zmniejszeniu rozmiaru pliku bez pogarszania jego jakości. Oznacza to, że zawierają one 100% danych, a po dekompresji pliku powinien on powrócić w całości do rozmiaru wyjściowego. Kompresja zwana bezstratną zapewnia wysoką jakość dźwięku, dlatego jest chętnie wybierana w dzisiejszych czasach.

Najpopularniejsze formaty to WAV i AFF. Warto pamiętać, że po kompresji bezstratnej rozmiar pliku nadaj może być duży. Dowiedz się więcej z artykułu: Bezstratne formaty audio.

Co powoduje kompresja stratna?

Kompresja stratna ma na celu usunięcie określonych elementów dźwięku w celu zmniejszenia rozmiaru pliku. Można oczywiście dostosować poziom kompresji do oczekiwań, aby zachować równowagę pomiędzy jakością, a rozmiarem pliku.

Jak działa limiter?

Warto wiedzieć, że limiter może oznaczać różne urządzenia w technice studyjnej. Ja odniosę się do procesu polegającego na nadaniu ostatniego szlifu w masteringu muzycznym. Podczas obróbki audio limiter ogranicza maksymalny poziom głośności. Pozwala to zabezpieczyć sprzęt przez przekroczeniem dopuszczalnego progu natężenia dźwięku.

Jeśli masz pytania dotyczące parametrów sprzętu audio, a także ich wpływu na brzmienie, zachęcam do odwiedzenia wybranego salonu Top Hi-Fi. Na miejscu #EksperciDobregoBrzmienia zaprezentują Ci interesujące urządzenia oraz omówią parametry i ich wpływ na jakość dźwięku. Zawsze podkreślam, że świadomy wybór sprzętu wraz z odsłuchem jest gwarancją osiągnięcia dobrego brzmienia.

Poprzedni
Powrót do aktualności
Następny
5
Ocena:
Średnia ocen: 5

(14 ocen)

Polecane

Umów się na prezentację w salonie

W każdym z naszych salonów znajduje się sala odsłuchowa, w której w miłej atmosferze zaprezentujemy Ci brzmienie wybranego przez Ciebie sprzętu audio.

Umów się na spotkanie

Zobacz listę salonów

Umów

Top Hi-Fi & Video Design

Salony firmowe

Salony firmowe

Top Hi-Fi & Video Design: