Audio data datang dalam berbagai bentuk kadang-kadang membingungkan. Jumlah cara mendasar di mana suara dapat diwakili sebenarnya cukup kecil. Berbagai jenis file audio adalah karena fakta bahwa ada cukup beberapa pendekatan untuk data audio mengompresi dan sejumlah cara yang berbeda dari kemasan data. Kami pertama-tama menjelaskan bagaimana data audio sendiri diwakili, maka bagaimana itu dibungkus ke file. Orang sering berbicara tentang format audio sembarangan tanpa membedakan antara format data dan format file, tetapi sangat penting untuk menjaga perbedaan ini dalam pikiran banyak format file dapat berisi tanggal direpresentasikan di lebih dari satu cara dan sebagian besar representasi data dapat dikemas di lebih dari satu format file. Demikian pula, mengatakan bahwa file berisi data PCM mengatakan apa-apa tentang format file.
Audio data memakan banyak ruang, setidaknya dibandingkan dengan teks. A single kedua audio compact disc memakan sekitar ruang sebanyak 15.000 kata dari teks ASCII, yaitu, 60 halaman dari sebuah buku khas. Berikut adalah grafik yang menunjukkan jumlah ruang yang ditempati oleh jangka waktu yang berbeda suara mono pada tingkat sampling yang berbeda. Sebuah disk 10GB, misalnya, akan mengadakan hanya sekitar 31 jam audio pada tingkat-CD.
1 detik 1 menit 1 jam
44.100 sampel / 16 detik bit l88.2KB 5.3MB 317.5MB
22.050 sampel / 16 detik bit 44.1KB 2.6MB 158.8MB
16.000 sampel / 16 detik bit 32.0KB 1.9MB 115.2MB
Perhatikan bahwa dalam tabel ini KB singkatan dari 1.000 byte dan MB untuk 1.000.000 byte. Ini adalah definisi yang digunakan oleh Komisi Elektroteknik Internasional , badan internasional yang menetapkan standar di bidang elektronik dan listrik. Disk produsen menggunakan unit untuk menggambarkan ukuran produk mereka byte. Sebaliknya komputer, programmer umumnya menggunakan KB berarti 1.024 dan MB berarti 1024 * 1024 = 1.048.576 byte.
Karena data audio menempati banyak ruang, ada telah lama motivasi untuk kompres itu. Memang, kompresi audio mendahului penggunaan komputer digital dan digital transmisi data. Bell Laboratories melakukan penelitian perintis pada lokasi informasi dalam pidato dalam domain frekuensi sehingga AT & T bisa pak sebagai percakapan telepon banyak ke satu baris mungkin. Hasil penelitian menunjukkan bahwa sebagian besar informasi dalam pidato terletak di antara 300 dan 3.000 Hz adalah. Itu sebabnya, bahkan hari ini, sirkuit telepon menyaring energi semua di luar band ini.
Sumber : http://billposer.org/Linguistics/Computation/LectureNotes/AudioData.html
Tidak ada komentar:
Posting Komentar