Pengenalan kompresi data audio

PERHATIAN: sebelum membaca post ini sebaiknya Anda sudah mengetahui konsep penyimpanan data audio secara digital atau konversi data audio analog ke digital (setidaknya tahu arti sample dan channel).

Dalam dunia multimedia, salah satu persoalan utama adalah penyimpanan dan transmisi data. Sebuah berkas multimedia biasanya berukuran sangat besar hingga menyulitkan penyimpanan dan transmisi data dengan kapasitas dan bandwidth yang terbatas, oleh karena itu dibutuhkan kompresi data.

Algoritma kompresi data generik (ZIP, RAR, dll.) tidak efektif untuk diterapkan pada data audio. Selain rasio kompresi yang tidak besar karena sedikitnya redundansi data sekuensial pada data audio, kualitas suara pun menurun drastis. Oleh karena itu dibutuhkan algoritma kompresi khusus untuk data audio.

Seperti pada kompresi berkas gambar, ada dua tipe kompresi data audio: lossless dan lossy. Kompresi lossless memungkinkan hasil kompresi untuk didekompresi persis sama dengan data asli, sedangkan kompresi lossy akan menyebabkan sedikit penurunan kualitas saat dekompresi.

Berikut prinsip dasar pada kedua jenis kompresi data audio tersebut:

Kompresi lossless pada data audio

Ada dua tahap utama dalam kompresi lossless pada data audio, yaitu prediction dan residual coding.

Secara singkat, dengan prediction hanya nilai dari sample pertama yang disimpan. Nilai dari sample-sample lain ditentukan oleh nilai sample sebelumnya. Hal ini memiliki landasan bahwa setiap sample suara yang berdekatan tidak memiliki perbedaan nilai yang sangat besar.

Sample hasil prediksi tentu tidak sama persis dengan sample yang sebenarnya. Untuk memastikan kompresi bersifat lossless, selisih antara sample hasil prediksi dengan sample original harus disimpan. Selisih ini disebut dengan residu. Untuk lebih menghemat tempat, residu ini juga disimpan secara terkodekan. Inilah yang disebut dengan residual coding.

Beberapa algoritma kompresi juga menerapkan interchannel decorrelation. Prinsipnya adalah bahwa suara dari channel kiri dan kanan biasanya tidak terlalu jauh berbeda. Maka, yang disimpan cukup nilai utuh salah satu channel dan selisih nilai antara channel tersebut dengan channel lainnya.

Kompresi lossy pada data audio

Kompresi lossy pada data audio memanfaatkan teori psikoakustik, yaitu keterbatasan pendengaran manusia. Telinga manusia hanya dapat menangkap suara dalam rentang 20Hz hingga 20000Hz, maka dalam kompresi lossy, data suara di luar rentang tersebut tidak disimpan. Lebih dalam lagi, suara dengan frekuensi tinggi hanya dapat didengar oleh telinga manusia jika memiliki amplitudo yang tinggi juga. Oleh karena itu, noise pada data audio (yang biasanya memiliki amplitudo rendah) dapat ‘disembunyikan’ dengan cara disimpan pada rentang frekuensi tinggi.

Iklan

4 thoughts on “Pengenalan kompresi data audio

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s