Аудіо якості

Завдяки цій сторінці я сподіваюся пояснити, чого ми можемо очікувати щодо якості звуку від формату аудіофайлу.

кбіт Слухай кбіт

Джерело

Звукова хвиля (фізична) є чітко визначеною. Уявіть, як одна хвиля в морі прорізається на краю: вона низька в одному місці, висока в іншому, іноді більш-менш. Таким чином, можна записати мільярди вимірювань у мільярдах різних місць на одній і тій же хвилі. Чим більше заходів ми вживаємо, тим більше ми могли б перемалювати цю хвилю до досконалості і, таким чином, поширити її. Але обсяг інформації значно збільшує вагу вашого файлу Exel. Вчений може зацікавитись записати багато моментів. Матрос буде задоволений шкалою Дугласа, від моря 0 до моря 9. Відпочиваючий буде задоволений одним із 3 прапорів на пляжі. І я кажу своїм дітям, що море - це 0-метрова точка, повністю забуваючи про припливи і відливи. Ми всі по-різному використовуємо одне і те ж джерело, тому нам потрібна різна точність.

Що стосується аудіо, користувач громадського транспорту, який слухає політичний подкаст, буде менш вимогливим, ніж аудіофіл, який слухає нову інтерпретацію основної роботи.

Дві сім'ї носіїв звукозапису

- аналогові (або фізичні): вінілові платівки, воскові рулони, аудіокасети тощо. Сьогодні всі формати, в основному, застарілі, але незамінних звукових деталей, фізична та матеріальна форма яких визначає запис. Я не буду розповідати вам про це тут.

- цифрові: iPod, комп’ютери, компакт-диски (хоча вони фізичні, запис цифровий) тощо. Все залежить від більш-менш принизливого кодування, вираженого в аудіоформаті, найвідомішими розширеннями (або суфіксами) є .MP3, .WAV, .M4A тощо.

Цифрова

Оскільки цифрові технології зараз здебільшого витіснили аналогові, давайте розглянемо лише цю родину. Це також найлегше визначити кількісно і визначити.

Для запису на жорсткий диск, USB-ключ або подібне фізична звукова хвиля, отже, аналогова, повинна бути перетворена на комп'ютерну мову, яку легко зберігати. Мова йде про АЦП (для аналогового/цифрового).

Файл буде складатися з декількох "зразків" в секунду, ми говоримо про "відбір проб"або"частота дискретизації", що виражається в"Гц"або в"кГц": Це кількість точок, записаних щосекунди на вихідній звуковій хвилі. 44,1 кГц для аудіо компакт-диска представляє 44 100 точок, записаних щосекунди. 48 кГц в аудіовізуальній галузі - це 48 000 точок, записаних щосекунди. Уявіть, це кількість слів які складають фазу, що описує цю секунду.

Кожен із цих десятків тисяч зразків на секунду буде записаний у "дозвіл"виражається в"біти". Це число ділиться на 8, тобто в байтах: 16 бітів = 2 х 8 бітів або 2 байти. Уявіть, що це розмір кожного з цих слів, від найвідомішого (8 бітів) до самого наукового (32 16 біт для аудіо CD, 24 біт для аудіовізуального, .

Потім множимо на кількість доріжок "каналів". 1 канал (моно) для телефонної мелодії дзвінка, 2 канали (стерео) для аудіо CD, набагато більше для багатоканального.

Студія звукозапису може дозволити собі зберігати колосальний обсяг даних, включаючи безліч доріжок, кілька версій та у винятковій якості звуку. Студія зазвичай обробляє файли з частотою 96 кГц/32 біта, тобто швидкість передачі даних у 4 рази більша, ніж компакт-диск, у 4 рази важча теж.

Наші кишенькові зчитувачі мають смішну ємність. Тим більше вірно, що зараз файли все менше зберігаються локально, але проводять час, гуляючи по Інтернету чи телефонній мережі, в прямому ефірі; потокове.

Формат

Тому було необхідно створити аудіоформати, які можна легко розпізнати за їх розширенням (або суфіксом). Кожен із форматів створювався з цілком конкретною метою.

Якщо ми часто говоримо про формат без "зменшення даних" або "нестиснутого" (наприклад, у форматі wav або aiff, наприклад), про "стискання без втрат" або "оборотно" (формат flac, наприклад) або "з втратами" або «незворотне» стиснення (наприклад, mp3, m4u, ogg), жоден формат не може похвалитися ідеальним відтворенням якості звуку записаного джерела. Оскільки для кожного з них було зроблено багато варіантів для спрощення зберігання.

Приклад: Оскільки людське вухо не сприймає занадто серйозні звуки (інфразвук, менше 20 Герц) або занадто гострі (ультразвук, більше 20 000 Герц), логічно було обрано, щоб їх не записувати. Тому ми вже звільняємо місце для зберігання, записуючи лише звукові звуки. Ми зберігаємо лише пропускну здатність від 20 до 20 000 Гц. Це стосується всіх форматів.

Інший приклад: Якщо певні формати дозволяють просторіння завдяки багатоканальному запису (4, 6, 10 або більше треків), який ми знаходимо, наприклад, у кінотеатрі, для музичного альбому зазвичай роблять вибір стереоформату, наприклад, що ви слухаєте в навушниках або в машині. Ми зменшуємо розмір сховища в 2, 3, 5 або більше разів.

Приклад: Для подкасту про економіку, який містить лише голос, ми зупинимось на форматі без басів, без високих частот, з великим значенням, що надається частотам голосу, легко зберігається на маленькому кишеньковому програвачі. Ми оберемо формат MP3. Ми навіть могли вибрати моно та з низьким потоком.

"Без втрат" або "оборотне" стиснення (наприклад, flac) скромно спрощує файл, він стає менш важким, але його можна декодувати. До зображення: Він замінює всі "aa" на "2a", "aaa" на "3a", "aaaa" на "4a". Ми економимо трохи місця і можемо перетворити “4a” назад у “aaaa”, слухаючи його. Ми розшифровуємо.

Стиснення "з втратою" або "незворотно" (наприклад, mp3) настільки спрощує вихідний файл, що повернутися назад неможливо. До зображення: Він замінює всі "aa", "aaa" та "aaaa" на "a". Ми економимо багато місця, але ми не можемо сказати, чи означає "a" "a", "aa", "aaa" чи "aaaa".

Для подкасту про економіку, який містить лише голос, ми зупинимось на форматі MP3, оскільки нам не байдуже питання звуку.

Потік

Після вибору формату ми зацікавлені в "дебет". Це кількість даних за секунду. Це виражається у"кбіт/с", тобто у" кілобітах на секунду ". На комп'ютерній мові це еквівалент кількості тисяч літер, що утворюють дані, щосекунди.

На відміну від аматора, професіонала цікавить не потік, а те, що його складає. Тому він ретельно вибере частоту дискретизації, роздільну здатність та кількість каналів відповідно до свого проекту. Помноживши ці параметри, ми могли б розрахувати витрату.

Отже, для аудіо компакт-диска щосекунди обробляється 44100 16-бітових зразків на 2 канали (стерео), тобто 1411200 біт на секунду, або бітрейт 1411 кбіт/с.

Для MP3 любитель може вибрати бітрейт 320 кбіт/с, і все. Є також змінні витрати, але ми забудемо цю деталь:)

Інший приклад: стандарт для телефонії, G.711, має дискретизацію 8000 Гц, швидкість 64 кбіт/с і навіть дозволяє собі зберігати лише пропускну здатність звукового спектру від 300 до 3400 Гц! Якби його було збережено у такому форматі, 1-хвилинна розмова важила б 0,5 МБ !

Формули

Дебет (у кбіт/с) = Частота дискретизації (у Гц) X Дозвіл (у бітах) X З каналів (1 моно, 2 стерео тощо)

Вага (в МБ) = Дебет (у кбіт/с) X Тривалість (у секундах)/8 (1 байт)/1000 (1000 КБ = 1 МБ)

Деталь: До 1998 року ми говорили про кіБ, а не про КБ, де 1 кіБ = 1024 байта (потужність числа в базі 2), всупереч нормам, що діють для інших одиниць. Зараз стандартизація IEC вимагає потужності базового числа 10: 1 кб = 1000 байт. Більше інформації тут.

Ще одна деталь: будьте тут обережні, я кажу про "біти" (позначені маленьким "b"). Не поглиблюйте спільно з "Байтами" (позначеними великим "В"), що означає "Байти" англійською мовою, навіть у 8 разів менше! Якби ми говорили про потік в "кБ/с", ми б не ділили на 8.

Приклад:
Аудіо компакт-диск записується у форматі Wav, дискретизується з частотою 44,1 кГц (або 44100 Гц або 44100 семплів в секунду), 16 біт кожен на 2 каналах.
Або 44100 x 16 x 2 = 1411200 біт на секунду, або швидкість передачі даних 1411 кілобіт на секунду (kb/s або kbps).
Тоді 60-хвилинний диск містить 5080320 000 біт/8 = 635 040 000 байт або байт (635 мільйонів 8-бітних байт). Або 635 МБ! Тоді 1-хвилинна музика важить 10,6 МБ. Ось чому альбом на аудіо компакт-диску містить лише трохи більше 1 години музики.

Підсумуйте

Для аудіо CD:
Відбір проб: 44100 Гц
Роздільна здатність: 16 біт
Канали: 2 (стерео)
Бітрейт: 1411 кбіт/с
Вага: 10,6 міс/хв

Для найкращого MP3:
Бітрейт: 320 кбіт/с
Вага: 1,44 міс/хв

Вирок

Таким чином, MP3 зі швидкістю передачі даних 320 кбіт/с (кілобіт на секунду) містить 320 000 біт на секунду звуку. Значно менше, ніж 1411200 біт аудіо компакт-диска.

Що стосується чисто математичного аспекту, то визначення звуку MP3 у 4,4 рази нижче, ніж у форматі WAV. Насправді це трохи складніше відіграти кваліфікацію через різницю в стисненні цих двох форматів, тому mp3 буде навіть трохи менш хорошим, оскільки дуже погіршується. MP3 також трохи порочний, оскільки запис, навіть моно, іноді записується на 2 канали, тому ми не завжди ділимо його вагу не на 2. Та сама 1-хвилинна музика важить лише 1,44 МБ.

Решта

Окрім якості запису, для прослуховування звуку важливими є багато параметрів; це справжнє вирівнювання (тобто це найгірший з ланцюга, який визначає якість цілого):

- Джерело; вам потрібне хороше джерело звуку.
- Ланцюг запису: це те, що вставляється між джерелом та диктофоном: мікрофони, кабелі, електроніка тощо.
- Формат; про що ми говорили у цій справі.
- Канал прослуховування; це те, що вставляється між записом і вухом слухача: якість компонентів програвача, підсилювача, розподілу, якість кабелів тощо.
- Аудитор; це його чутливість

Перший надмірний приклад: все може бути абсолютно ідеальним, якщо слухач глухий, це марна трата часу. Ми вирівнюємо вниз = 0 !

Другий менш надмірний приклад: якщо ви слухаєте музику зі звичайними навушниками, зі свого смартфона; MP3 буде в основному достатньо, тому що вирівнювання, що проводиться знизу, саме смартфон та навушники обмежать якість прослуховування.

Третій приклад: якщо у вас є якісна аудіофільська система високої точності, яка коштувала вам нирки, запис на музичній групі маленького двоюрідного брата вашої племінниці на диктофоні ніколи не звучатиме правильно.

Слід розуміти, що саме той елемент (технічний чи ні) є найменш хорошим, що буде еталоном цілого. Тому необхідно прагнути підвищити якість кожного з найслабших елементів, щоб спробувати досягти цілісної системи, збалансованої від джерела (голос, група, звукові ефекти,.), Аж до прослуховування !

Висновок

Для аудіофіла незрозуміло, що зараз модно слухати непоправно стиснуту музику в Інтернеті. MP3 (та інші OGG, AAC тощо) є найгіршим аудіо носієм усіх часів.

В ідеалі вам слід:
- якісне джерело,
- записано в хорошій студії і в межах правил мистецтва,
- на носіях та у форматі без втрат,
- на високоякісній аудіосистемі,
- слухають експертні вуха,
- оцінюють уважний та культивований мозок.

І оскільки світ недосконалий, ми маємо:
- що завгодно,
- записані де завгодно і як завгодно,
- на носії та в катастрофічному форматі,
- на плачевному аудіоканалі,
- захоплені розшарованими вухами,
- почуте розумами розсеяними і без критичних умів.

Деякі навіть підуть настільки далеко, що скажуть, що це так само істинно за звучанням, як і для відео, фотографії, кіно, літератури, журналістики, освіти, політики. як і у всіх інших сферах:)

Слухай

Тож порівняйте MP3 320 кбіт/с, який я пропоную вам, тоді 8 кбіт/с. Ви повинні почути різницю. Або ти глухий.

Уявіть, що між файлом, кодованим зі швидкістю 128 кбіт/с, і файлом, кодованим зі швидкістю 320 кбіт/с, пропорційно відбувається однакове знищення звуку. Якщо ваше вухо в порядку і якщо ваша система мовлення хорошої якості, ви почуєте це.

Тож не важко зрозуміти, що стереофайл WAVE із швидкістю 1411 кбіт/с більш ніж у 4 рази кращий, ніж MP3 із розрізом 320 кбіт/с.

Флешка, що використовується для програвача, може не працювати на вашому комп’ютері, у цьому випадку натисніть «Відтворити»

MP3 (8 кбіт/с) Слухай
MP3 (16 кбіт/с) Слухай
MP3 (32 кбіт/с) Слухай
MP3 (56 кбіт/с) Слухай
MP3 (96 кбіт/с) Слухай
MP3 (128 кбіт/с) Слухай
MP3 (196 кбіт/с) Слухай
MP3 (256 кбіт/с) Слухай
MP3 (320 кбіт/с) Слухай

Це музика "Nisi Dominus (Ellegro)", RV 608 Вівальді.