Додаток для збереження вашого голосу, незважаючи на рак гортані - Sciences et Avenir
Опубліковано 14.01.2019 8:00

Два чеських університети розробили програму перетворення тексту в мову, яка дозволяє хворим на рак гортані продовжувати говорити своїм голосом, навіть після видалення органу та голосових зв’язок.
Ілюстрація трахеостомії 1874 року.
Людям із раком гортані часто доводиться видаляти його. Ризикують їх голосові зв’язки, точно розташовані в гортані. Таким чином, пацієнти втрачають використання свого голосу. Однак високотехнологічний процес, розроблений двома чеськими університетами, дозволяє зберегти його. Точніше, щоб імітувати його, завдяки вокальним записам, зробленим перед операцією, які дають змогу тонко змоделювати тембр звуку! Завдяки планшету або смартфону та інструменту перетворення тексту в мовлення можна знову поговорити з найближчими. І це, з його "справжнім" голосом !
Текст у мову, а не голосовий протез
У 2018 році Властиміл Гулар очікував незначного втручання в його голосові зв’язки, але лікарі діагностували у нього рак і планували видалити гортань. Йому належало втратити вживання голосу. Проте ми чуємо це і сьогодні. 51-річний батько чотирьох дітей продовжує спілкуватися в чаті, роблячи його власний голос, а не металевий дзвін робота, завдяки додатку на мобільному телефоні: йому просто потрібно набирати те, що він хоче сказати на клавіатурі.
"Я не дуже добре володію голосовим протезом", - додає він, вказуючи на отвір розміром з монету в горлі. Цей протез - це невеликий силіконовий пристрій, імплантований у трахею, що дозволяє людям говорити, натискаючи на нього пальцями, щоб змінювати потік повітря. Він віддає перевагу застосуванню, розробленому для пацієнтів, які перенесли абляцію гортані - класичне втручання для боротьби із запущеним раком.
300 речень, записаних до операції, може бути достатньо
Цей спільний проект Університету Західної Богемії в Пльзені, Карлівського університету в Празі та двох приватних компаній, CertiCon та SpeechTech, був започаткований менше двох років тому. Його назвали Голосом Ларинго. Технологія полягає у використанні записів голосу пацієнта для створення синтетичного, який можна виводити з телефону, планшета чи ноутбука за допомогою програми.
В ідеалі пацієнти повинні записати більше 10 000 речень, щоб дати вченим достатньо матеріалів. Але дослідники придумали, як зменшити кількість необхідних записів, яка потім зменшується до 3500. Кількість, яку навіть у деяких випадках можна зменшити до 300. Розширені статистичні моделі, включаючи штучні нейронні мережі, потім просіюють записи. "Ви використовуєте мовні моделі з певними параметрами для створення синтетичного мовлення. Чим більше даних вам потрібно починати, тим краще, але ви можете отримати гідну якість із відносно обмеженого матеріалу", - пояснює Йіндріх. керує проектом у Пльзені. Їхня система працює для чеської, але також для англійської, російської та словацької мов.
Божевільні речення для навчання алгоритму
Однак у пацієнтів, яким проводять видалення гортані, зазвичай залишається мало часу та енергії, щоб зробити багато записів після того, як дізналися про діагноз. "Найчастіше це лише тижні", - сказала AFP Барбора Репова, лікар лікарні "Мотол", яка працює над проектом від імені Карлового університету. І слова також потрібно записувати неодноразово, оскільки вони вимовляються по-різному залежно від їх місця в реченні. Звідси досить абсурдні вправи на вимову: "Чеченці завжди віддавали перевагу автомату Калашникова у формі кинджала", - читає пацієнт біля мікрофона. Вона продовжує наступне речення, необхідне для вивчення алгоритму: "На нас напали дитячі динозаври від тиранозавра".
Властиміл Гулар, який втратив роботу оббивця через проблеми зі здоров'ям, увійшов до програми відразу після діагнозу необхідного видалення гортані, призначеного через три тижні, і зміг записати 477 речень до операції. Але він визнає, що був підкреслений і досить незадоволений якістю свого голосу. "Пацієнти з раком горла часто страждають дисфонією перед процедурою, і його ефект із зменшеним записаним зразком видає неприродний звук", - продовжує Барбора Рєпова. Це краще, ніж ніщо.
Близько десяти хворих на гортань вже скористалися програмою
Загалом близько десяти пацієнтів із захворюваннями гортані записали свої голоси в університеті Пльзена. Ще десяток здорових людей також зробили записи для програми. Пан Матоусек вважає, що в майбутньому пацієнти зможуть записувати свій голос вдома завдяки спеціалізованому веб-сайту, який надаватиме їм усі необхідні вказівки в рамках майбутньої розробки цієї програми.
Він мріє про технологічні вдосконалення пристрою: "Кінцевий зір - це мініатюрний пристрій, підключений до мозку, до нервів, що відповідають за мову. Пацієнти можуть керувати цим своїми думками", - пояснює він. А для Барбори Рєпової кінцевою метою "буде пристрій, імплантований в горло, який може говорити голосом пацієнта". "Це досяжно. Можливо, це не через рік, а то й через десять років, але це можливо, і ми йдемо правильним шляхом", - підсумовує дослідник.