Огляд аудіокодеків та форматів

Як кінцевий користувач, ви особливо знайомі з одним типом програми: програмами відтворення (або програвачами). Вони відтворюють аудіо- або відеофайли і, таким чином, є програмним еквівалентом касетофонів, відеозаписувачів або програвачів CD/DVD. Інтерфейс програми здебільшого схожий на пульт дистанційного керування стереосистемою: є кнопки для відтворення, перемотування вперед, перемотування назад, паузи тощо. Відомими представниками є напр. B. Медіапрогравач Windows, Quicktime Player або Apple iTunes. Замість того, щоб розміщувати компакт-диск у слоті для CD, файли потрібно відкривати на програвачах програмного забезпечення. Аудіо- та відеофайли програвач може відкрити лише у тому випадку, якщо він може щось робити із використовуваним форматом файлу.
Цифрові дані, за допомогою яких представлені аналогові аудіо- чи відеосигнали, можуть бути організовані у різних форматах. Найкращий спосіб пояснити це для одного зображення: Існують різні варіанти зберігання окремих пікселів у файлі. Наприклад, чи зберігаються точки зображення одна за одною у файлі спочатку зліва направо чи спочатку зверху вниз, звичайно, це умова, яку потрібно вказати. Спосіб збереження значення кольору також повинен бути чітко визначений. Ці та багато інших визначень визначаються специфікацією, яка потім реалізується у відповідному форматі файлу. Для збереження даних завжди дотримується заздалегідь визначеного правила кодування, що в кінцевому рахунку є визначальним для забезпечення правильної інтерпретації даних. Ви можете сприймати окремі формати як різні носії даних: компакт-диски, великі та малі відеокасети, аудіокасети тощо можуть містити аудіодані, але ви все одно не можете вставити касету в програвач компакт-дисків. Формати файлів WAV, MP4, WMA або MP3 такі ж різні.
Багато форматів файлів є насправді Формати контейнерів. Цей термін має на меті пояснити, що в рамках конвенції можна використовувати різні формати. Наприклад, файл MP4 може містити різні формати аудіо та відео, які також можуть відображатися в одному і тому ж файлі одночасно.
Якщо ви хочете зберегти різні формати у файлах, вам потрібен контейнер. Контейнери беруть аудіоматеріал у файлах із розширеннями типу ".mp3", ".wav", ".m4a", ".ogg" або ".wma" та надають йому метадані. Ось кілька важливих контейнерів для зберігання аудіофайлів:
ХВИЛЯ
Контейнер із закінченням ".wav" зазвичай містить нестиснуті цифрові дані, кодовані методом PCM. Використовуйте файли WAVE, щоб зберегти їх, якщо ви хочете обробити (вирізати, відредагувати) аудіоматеріал пізніше.
MP3
Контейнер MP3 (.mp3) використовується для запису потоків даних аудіо рівня MPEG-1 3 або MPEG-2 аудіо рівня 3. Розмовно ці потоки даних також називають MP3.
MP4/M4A
Контейнер MP4 походить із формату файлу Apple Quicktime. На відміну від файлів MP3 або WAVE, де ви можете бути відносно впевнені, які дані приховані всередині файлів, за допомогою файлів MP4 ви навряд чи можете зробити якісь висновки щодо використовуваних кодеків. Файли MP4 можуть містити різні відео- та аудіоформати, картинки та навіть графіку та текст. Тому рекомендується використовувати розширення файлу ".m4a" в аудіосекторі та лише використовувати метод кодування AAC.
OGG/OGA
Контейнер OGG - це безкоштовний формат мультимедійного вмісту, який не обмежений патентами на програмне забезпечення. Як і у випадку з MP4, розширення файлу не вказує, яким чином кодовані дані, що містяться в ньому. В аудіосекторі для кодування зазвичай використовується аудіокодек Vorbis, а використовується розширення файлу ".oga".
АЧС/WMA
На додаток до безкоштовного формату OGG та MP4 від Apple, Microsoft також вказала формат контейнера для мультимедійних файлів. Файли ASF також можуть містити метадані, звукові та відео доріжки. Для кращого розмежування файли, що містять аудіодані, позначаються закінченням ".wma" за допомогою однойменного методу кодування.
Залежно від того, чи хочете ви записати аудіофайл на компакт-диск, зробити його доступним в Інтернеті або відредагувати за допомогою аудіоредактора, різні аудіоформати ставляться під сумнів. Кодеки відповідають за перетворення з різних форматів і в них:
PCM (імпульсна кодова модуляція)
Імпульсна кодова модуляція - це процес кодування, в якому аналоговий сигнал може бути оцифрований майже без втрат. Аудіоматеріал, закодований таким чином, ідеально підходить для подальшої обробки, оскільки він не стискається. Дані, що генеруються цим методом, зазвичай зберігаються у вигляді хвильових файлів із розширенням ".wav".
MP3 (MPEG-1 Audio Layer 3)
Процес кодування насправді називається MPEG-1 Audio Layer 3 або MPEG-2 Audio Layer 3 і був розроблений Інститутом інтегральних мікросхем Фраунгофера. Назва походить від відповідного розширення файлу MP3 формату. Це один з перших методів стиснення з втратою, який покладається на психоакустичні ефекти у сприйнятті, щоб зменшити обсяг даних. На додаток до оригінального кодека з Інституту Фраунгофера, існує також кодер LAME з відкритим кодом. Файли, що містять потоки даних, закодовані таким чином, зазвичай закінчуються на ".mp3". Існують також інші формати контейнерів, які можуть містити потоки даних MP3, такі як AVI або MP4.
AAC (розширене кодування звуку)
AAC - це метод кодування з втратою, який може стискати аудіодані (з компакт-диска) до однієї шістнадцятої від початкового розміру. Порівняно з MP3, цей процес може продемонструвати більшу компресію та покращену якість звуку. Тому різні інтернет-музичні магазини та інтернет-радіостанції покладаються на цей формат. MP4 призначений як формат контейнера для зберігання стиснених звукових сигналів. Файли, що містять таку аудіодоріжку, зазвичай закінчуються на ".mp4" або ".m4a".
Ворбіс
Цей формат з відкритим вихідним кодом є безпатентним, тому його можуть використовувати розробники програмного забезпечення без ліцензійних зборів. Формат також підходить для потокових передач. Стиснення є втратним та кращим, ніж MP3. Хоча зараз численні апаратні пристрої відтворення підтримують цей формат, він не настільки поширений, як MP3. Потік даних зазвичай вбудований у контейнер OGG. Зв'язані файли закінчуються на ".ogg" або ".oga".
WMA (Windows Media Audio)
WMA - це метод кодування, розроблений Microsoft, а також пропонує стиснення з втратами. Зараз багато апаратних пристроїв відтворення підтримують цей формат, оскільки він дуже популярний у музичній індустрії завдяки вбудованому захисту від копіювання (Digital Rights Management (DRM)). Якщо файл містить лише аудіодані, він закінчується на ".wma". ASF використовується як формат контейнера.
Якщо ви хочете бути впевнені, що всі мультимедійні файли можна відтворювати, вам слід підготувати якомога більше кодеків для програвача. На щастя, більшість кодеків - або принаймні декодерів - доступні безкоштовно. Поточні медіаплеєри зазвичай мають із собою необхідні кодеки. Це допомагає завжди шукати найновіший кодек в Інтернеті та встановлювати його, оскільки вони, як правило, зворотно сумісні, тобто вони також можуть інтерпретувати старі формати.
Спільне для всіх форматів те, що аудіо- та відеодані записуються у файли у стиснутому вигляді. Обсяг даних, що виникає, дуже великий, тому кодеки намагаються зменшити обсяг даних при кодуванні. Тому складене слово-кодек часто використовується як коротка форма для компресора/декомпресора. Методи стиснення даних дуже різноманітні. Загальна різниця між стисненням без втрат та з втратами.

Стиснення без втрат
При стисненні без втрат вихідні дані зберігаються; вони лише компактніше записуються у файл. Наприклад, у випадку із зображеннями замість збереження кожного окремого пікселя у файлі можуть бути враховані лише зміни. Якщо, наприклад, показано блакитне море, файл не повинен містити “синьо-синьо-блакитний. -синьо-блакитний ", але вказівки" 123 сині пікселі "достатньо - інформаційний вміст не змінюється. Навіть з відеоданими часто зберігаються не окремі зображення, а лише різниця між ними. Отже, якщо камера відображає нерухомий пейзаж протягом декількох секунд, тоді це альбомне зображення потрібно записати у файл лише один раз. У випадку аудіоданих схожість між різними каналами (лівий та правий стереоканали часто ідентичні) можна використовувати для більш компактного зберігання даних. У всіх трьох прикладах однакові або лише незначні зміни є необхідною умовою стиснення даних. На жаль, оскільки ці подібності не завжди присутні в аудіо- та відеоданих, стиснення без втрат не настільки ефективно, як стиснення з втратами.

Стиснення з втратою з використанням кодека AAC відповідно до стандарту MPEG-4 у формат MP4/M4a.