Технічний університет Берліна

Technische Universität Берлінський факультет I Інститут мови та комунікації Відділ аудіокомунікації Оцінка аудіовізуальної якості гучномовців Магістерська робота, подана Полом Майнцом Студентський номер 225610 Берлін, 18 березня 2015 р. Перший рецензент: проф. Штефан Вайнціерль Другий рецензент: Dr. Ганс-Йоахім Маемпель

Свідченням я цим заявляю замість присяги, що я підготував даний твір самостійно та особисто, без несанкціонованої сторонньої допомоги та виключно використовуючи перелічені джерела та ресурси. Берлін, 18 березня 2015 року Пауль Майнц

Зміст 1 Вступ 1 2 Стан досліджень 3 2.1 Мультимодальне сприйняття. 3 2.2 Аудіовізуальне сприйняття. 4 2.2.1 Аудіовізуальна оцінка якості. 7 2.2.2 Аудіовізуальне сприйняття гучномовців. 9 3 Тест на аудіювання 11 3.1 Предмет дослідження. 11 3.2 Розробка тесту. 12 3.2.1 Парадигма співіснування. 12 3.2.2 Парадигма конічного стимулу. 12 3.3 Гучномовці. 14 3.4 Налаштування структурних випробувань. 17 3.5 Вимірювання. 19 3.6 Аудіовміст. 23 3.7 Інструмент опитування. 24 3.8 Побудова шкали. 25 3.9 Налаштування технічного експерименту. 29 3.9.1 Збір даних. 29 3.9.2 Акустичне моделювання. 32 3.9.3 Поворотний стіл. 35 3.10 Впровадження. 36 4 Оцінка 39 4.1 Парадигма співіснування. 41 4.1.1 Слухові ознаки. 44 4.1.2 Візуальні атрибути. 49 І.

4.1.3 Аудіовізуальні атрибути. 50 4.2 Парадигма конічного стимулу. 52 4.2.1 Слухові ознаки. 53 4.2.2 Візуальні атрибути. 57 4.2.3 Аудіовізуальні атрибути. 58 4.3 Зв'язок між змінними. 60 4.3.1 Парадигма співіснування. 60 4.3.2 Парадигма конічного стимулу. 65 5 Резюме 70 Бібліографія 73 Список рисунків 76 Список таблиць 79 Аналіз дисперсії 82 A.1 Парадигма співіснування. 82 А.2 Парадигма конічного стимулу. 85 B Регресія 89 B.1 Парадигма співіснування. 89 Б.2 Конічний подразник. Проле полярності 91 С 93 С.1 Парадигма співіснування. 93 D LimeSurvey 97 D.1 Інструкції з тестування. 97 D.2 Анкети. 98 D.3 osc-web. 99 E Функції Matlab 100 E.1 reset_turntable.m. 100 E.2 переміщення_поворотний стіл м. 102 E.3 setup_righttable.m. 105 E.4 outline_callback.m. 106 II

1. ВСТУП Сприйняття відтворюваного ними звуку, а також оцінка якості всього гучномовця. Якщо тут є зв’язок, слід зробити спробу його кількісно визначити. Аудіовізуальному сприйняттю як науковій галузі досліджень приділяється дедалі більша увага, але це молода дисципліна, яка пропонує багато відкритих питань. Метою цієї роботи є сприяння кращому розумінню взаємозв'язку між слухом та баченням предметів. Крім того, знання цих взаємозв’язків щодо гучномовців може бути корисним на практиці у виробництві гучномовців. 2

2.2. АУДІОВІЗУАЛЬНЕ СПРИЙМАННЯ 2. СТАН ДОСЛІДЖЕННЯ, розташовані один проти одного. Таким чином, зсередини назовні, постійно зростає різниця між зоровим та слуховим подразниками. Перед експериментом випробовуваним було повідомлено, що обидва динаміки видають однаковий звук, і тому вони не чують стереозвук і звучать так, ніби сигнал надходить з центру. Тим не менше, залишається сумнівним, чи робить це оголошення стимул для суперечки правдоподібним для системи сприйняття, і має сенс провести подібний експеримент за умов, які представляють ситуацію, яка є більш звичною для випробуваних та повсякденного природного досвіду при прослуховуванні звукових сигналів через динаміки карти краще. У своєму експерименті автори завжди запитували про якість звуку за будь-яких умов (включаючи суто візуальні). Вони також зазначають, що може бути цікавим дослідити, які окремі фактори є важливими для загального сприйняття продукту гучномовця. 10

3.4. СТРУКТУРНИЙ ЕКСПЕРИМЕНТАЛЬНИЙ НАСТРОЙ (a) Адам Класична колонка Mk3 (c) JVC SP-E5 3-Й ТЕСТ НА СЛУХАВАННЯ (b) B&W DM601 S2 (d) Braun L420/1 (e) Heco Victa 201 Рисунок 3.1: Гучномовці, що використовуються в тесті на прослуховування 18

3.5. ВИМІРЮВАННЯ 3-Й ТЕСТ НА СЛУХАННЯ Рисунок 3.4: Вимірювальний робот FABIAN на стільці для випробовуваних перед вимірюванням BRIR.Рен оснащує навушники головним трекером, який реєструє рух голови. На основі даних про положення головного трекера можна вибрати відповідний BRIR для поточного положення голови для складання з вхідним сигналом. Для слухача це створює віртуальне джерело звуку, яке при русі голови не рухається, а залишається у своєму положенні. Для вимірювання BRIR був використаний вимірювальний робот FABIAN, розроблений відділом аудіозв'язку [24]. Робот пропонує простий спосіб автоматичного вимірювання BRIR в діапазоні положень голови ± 80. Роздільна здатність тут дорівнювала 1. Таким чином, BRIR вимірювали з кроком 1 - від обертання голови на 80 вліво до 80 вправо. Таким чином, в кінці вимірювання джерела ви отримуєте 80 BRIR в кожному напрямку плюс один в нульовому положенні, тобто положення голови, в якому робот дивиться прямо вперед. Отже, це дає 2 80 + 1 = 161 BRIR (стерео) на джерело. Кожен динамік у стереопарі вимірювався окремо. Тож у підсумку на модель гучномовця припадає 2161 = 322 BRIR

3.6. ЗМІСТ АУДІО. На рисунках 3.5 та 3.6 наведені приклади передавальних функцій експериментальної установки для всіх п’яти гучномовців, розрахованих на основі імпульсних характеристик лівого гучномовця під кутом 30 (тому вимірювальний робот уважно дивиться на гучномовець). 3.6 Аудіовміст Потрібно зробити спробу створити ситуацію прослуховування для випробовуваних якомога нормальніше. Зміст стимулів, що оцінюються випробовуваними, тобто аудіоматеріал, складений за допомогою BRIR, слід обирати із жанру, досить відомого багатьом слухачам. У той же час цей сигнал повинен мати можливість виявити слабкі сторони гучномовця та зробити їх чутними або підкреслити сильні сторони, щоб випробувані мали можливість почути відмінності між п’ятьма моделями гучномовців. Як описано в 3.2 23

3.9. ТЕХНІЧНЕ НАСТРОЮВАННЯ 3-ТЕ ТЕСТ НА СЛУХАННЯ Рисунок 3.7: Схематичне технічне налаштування під час тестування аудіо Інтерфейс. Приклади окремих сторінок запитань можна знайти в Додатку D. Для всіх різних частин експерименту (чисто акустичних, чисто оптичних та оптоакустичних) сторінки запитань із відповідними атрибутами були створені в LimeSurvey. Це гарантує, що випробувані бачать лише ті атрибути, які в даний час є відповідними. Кожну сторінку можна віднести до групи рандомізації в LimeSurvey. Усередині такої групи окремі сторінки відображаються в довільному порядку. У той же час групи можна розташувати в будь-якому конкретному порядку. У цьому випадку була створена група для чисто акустичної, чисто оптичної та оптоакустичної частин експерименту. Це дозволяє дуже легко створити бажану послідовність подразників в експерименті (спочатку акустично, потім оптично, потім 30

3.9. ТЕХНІЧНИЙ ЕКСПЕРИМЕНТАЛЬНИЙ НАЛАШТУВАННЯ 3-Й ДОСЛІДОВИЙ ЕКСПЕРИМЕНТ Рисунок 3.8: Шлях аудіоданих в акустичному моделюванні через навушники за допомогою сабвуфера, який був розміщений у куті кімнати за іншими гучномовцями. Для досліджуваних було важко побачити, і учасники не могли помітити повітряних вибухів, спричинених рухами мембрани. Тому сабвуфер не був чітко впізнаний як компонент, який брав активну участь в експерименті, і акустична локалізація коробки була неможливою через низькі частоти, що відтворюються. Оскільки метою використання сабвуфера було відтворення послідовних компонентів сигналів для тварин, але лише до точки в частотному спектрі, в якій навушники можуть знову взяти на себе управління, і одночасно рівень сигналу для сабвуфера також потрібно було регулювати Щоб забезпечити відповідність рівня імітаційної частини навушників у положенні випробовуваних, вихідний сигнал від fwonder, тобто сигнал, складений BRIR, був надісланий до програмного забезпечення JACKRack 9. JACKRack пропонує 9 Bob Ham et al., Http://jack-rack.sourceforge.net/ 33

3.10. ВИКОНАННЯ 3-ГО СУДОВОГО СУДУ Виправити акустичне моделювання поточного стимулу. 3.10 Впровадження В ході експерименту передбачалося спочатку представити випробуваним суто акустичні подразники, тобто лише дозволити їм чути динаміки, але не бачити, потім генерувати чисто оптичні подразники, тобто лише показувати гучномовці без використання акустичного моделювання. Відтворіть звукові зразки і, нарешті, подайте оптоакустичні подразники. Цей порядок гарантує, що зовнішній вигляд гучномовців під час чисто слухового оцінювання на учасників ще не впливає. Оскільки під час першого прослуховування ви не бачите жодного динаміка, неможливо просто призначити раніше прослухані зразки звуку оптично показаним динамікам для подальшої чисто візуальної оцінки. Стимули були представлені випадково в межах кожної з цих трьох груп (див. 3.9.1). Рисунок 3.10: Вікова структура випробовуваних Під час випробування загалом 20 осіб, які мають громадянство Німеччини 36

3.10. ВПРОВАДЖЕННЯ 3. СЛУХАЛЬНИЙ СУД, що пізніше через навушники буде знову відтворюватися сигнал, саме тому вам довелося б тримати навушники увімкненими протягом усього експерименту. Також людям було оголошено, що вони будуть чути кожен гучномовець кілька разів і що через різні електроакустичні налаштування, що використовуються, один і той же гучномовець може звучати по-різному кожного разу. Тому їм слід намагатися щоразу слухати або бачити та оцінювати заново. Для того, щоб динаміки могли оцінюватися чисто слухово, на початку експерименту динаміки були покриті тканинами. Тому люди не могли їх бачити. Після п’яти суто акустичних подразників випробовуваних попросили зробити невеличку перерву, поки експериментатор не зняв кришки. 38

4.1. ПАРАДИГМА КОПЕСЕНСІЇ 4. ОЦІНКА Всі змінні кодуються зі значеннями від -2 до 2. Найменше або найбільш негативне значення на шкалі відповідає значенню -2, найбільше або найбільш позитивне до значення 2. 4.1 Парадигма спільної присутності знаходиться в парадигмі спільної присутності як вже пояснювалося, містять усі подразники, які не виробляють конічного подразника. Тут змінюються два фактори модальності (3 факторні рівні) та гучномовець (5 факторних рівнів). Для всіх залежних змінних спочатку були розраховані середні значення, і, таким чином, були створені профілі полярності для всіх гучномовців та всіх методів для ілюстрації даних. Вони дають хороший огляд зареєстрованих рейтингів, і деякі речі привертають увагу при погляді на Prole. Проти для гучномовця B&W та для слухової модальності показані тут як приклад (рис. 4.1 та 4.2). Вказівки щодо інших гучномовців та способи їх використання можна знайти в додатку. Рисунок 4.1: Профіль полярності B&W DM601 S2 у парадигмі співіснування Зміна від слухової до аудіовізуальної модальності представляється суттєвою зміною

4.1. ПАРАДИГМА СОСУТНОСТІ 4. ОЦІНКА застосовується в парадигмі співіснування цього типу III для збереження простоти та однорідності. У випадках, коли це представляє інтерес, також проводили порівняння окремих пар (без коригування) між окремими рівнями факторів. 4.1.1 Слухові атрибути Як і слід було очікувати, більшість слухових атрибутів демонструють значні результати, коли коефіцієнт гучномовця змінюється. Це не дивно, оскільки відтворення акустичних сигналів та створення хороших слухових вражень - головне завдання гучномовця. Рисунок 4.3: Середні значення слухових атрибутів високий, низький, твердість та об’єм, нанесені на графік модальності; окремі значення пов'язані лініями для кращої читабельності, рядки не представляють значень між модальностями, однак зміна коефіцієнта гучномовця не призводить до значної різниці в оцінці високих частот. Це також видно на малюнку 4.3. На цьому малюнку та в наступних поданнях середнього значення абсциса номінально масштабована, а коефіцієнт відкладено на кожному. Це означає, що між точками, позначеними на осі х, звичайно, немає 44

4.1. ПАРАДИГМА КОПЕСЕНЦІЇ 4. ОЦІНКА Вимірювали значення. Тим не менше, між введеними значеннями була проведена сполучна лінія, щоб полегшити читання графіків. Значення висот всі близькі. Піддослідні майже не відзначали різниці у відтворенні висоти. Окрім гучності, атрибут високих частот є єдиним слуховим, який не виявляє жодних значущих спостережень у парадигмі співіснування. Це також стосується фактора модальності. Хоча гучномовці також демонструють відмінності в високих частотах, учасникам це, можливо, було не так просто почути. Однак для коефіцієнта гучномовця результат є лише незначним (p = 0, 080). Міцність при випробуванні також не особливо висока при 0,539. Тому може бути, що очікуваного впливу гучномовців тут не було знайдено. Частка перцептивних мінімумів показує дуже значущі результати щодо коефіцієнта гучномовця (стор