YouTube воює зі шкідливим вмістом! Як компанія бореться, щоб зупинити явище

Автор: Богдан Унгуряну/Дата публікації: 09.03.2019 19:09

Платформа YouTube веде змагання проти годинника щодо видалення шкідливого вмісту, будь то підбурювання до ненависті, тероризм, жорстоке поводження з дітьми тощо. У цьому випадку технологія машинного навчання дуже важлива.

YouTube з самого початку ліквідував шкідливий вміст, але за останні роки зусилля в цьому напрямку пришвидшились, головним чином шляхом оновлення правил, яких повинна дотримуватися спільнота, вдосконалення інструкцій, впровадження систем машинного навчання, розробки команд, які аналізувати його зміст або спеціальні програми у партнерстві з різними організаціями. Лише у 2018 році YouTube вніс понад 30 змін до політики, що регулює платформу.

Як результат, у другому кварталі 2019 року YouTube видалив понад 4 мільйони каналів та 9 мільйонів відео за порушення правил спільноти. Наприкінці серпня YouTube оприлюднив щоквартальний звіт про вміст, вилучений з платформи, який містить інформацію про обсяг вилученого вмісту, чому та коли він був видалений.

Перед видаленням вмісту потрібно провести межу між тим, що приймається, і тим, що видаляється. Мета - забезпечити свободу вираження поглядів, захищаючи та підтримуючи спільноту YouTube. З цією метою YouTube має команду з розробки політики спільноти, яка постійно перевіряє їх, щоб переконатися, що вони в курсі подій, забезпечити безпеку спільноти та не обмежувати свободу YouTube.

У деяких складних випадках група аналітиків може витратити кілька місяців на розробку нового правила. Це робиться шляхом консультацій із зовнішніми експертами та творцями контенту на YouTube, щоб з’ясувати, де чинні правила показують їх межі, які особливості мають різні регіони світу, щоб запропоновані зміни застосовувались досить глобально.

Однією з таких фундаментальних змін стало оновлення політики мов ненависті. Їх зміни відбулися в понеділок, а новий набір політик був запущений на початку червня 2019 року. Вплив нового набору політик на підбурювання до ненависті спостерігався у другому кварталі 2019 року:

Вилучено понад 100 000 відео, що означає збільшення в 5 разів
Кількість каналів, видалених через "мову ненависті", зросла в 5 разів - до понад 17 000
Кількість коментарів, видалених з YouTube, у другому кварталі 2019 року майже подвоїлася - до понад 500 мільйонів, частково через видалення коментарів "мови ненависті"

YouTube покладається на поєднання людей та технологій для позначення вмісту, що підлягає аналізу. У деяких випадках "відбитки пальців" використовуються для пошуку копій невідповідного вмісту перед переглядом. Щодо певних типів вмісту, таких як сексуальне насильство над дітьми чи тероризм, YouTube вносить вклад у базу даних контент-індустрії, щоб збільшити шанси блокування цього типу вмісту перед завантаженням.

У 2017 році YouTube розширив використання технології машинного навчання для виявлення потенційно невідповідного вмісту, а потім направив на аналіз людини. Ця технологія підходить для виявлення шаблонів, що допомагає знаходити вміст, схожий - але не зовсім однаковий - на інший вміст, який вже був видалений, навіть до того, як його переглянуть користувачі. Таким чином, понад 87% із 9 мільйонів відео, вилучених у другій половині 2019 року, спочатку були ідентифіковані автоматизованими системами YouTube. Оновлення автоматичних систем виявлення спаму у другому кварталі 2019 року призвело до 50% збільшення кількості видалених каналів за порушення правил спаму.

У всіх цих намаганнях видалити вміст, що порушує правила, важливо, щоб відео такого роду не переглядались у великому масштабі або взагалі не переглядалися перед тим, як їх видалити. Тут найважливішим елементом є автоматизована система оповіщення, яка допомогла виявити та оцінити вміст до того, як про це повідомила громада. Як результат, більше 80% вмісту, про який повідомляють системи автоматизації, було видалено до отримання єдиного перегляду у другому кварталі 2019 року.

На початку 2018 року компанія YouTube запустила Intelligence Desk - команду, яка відстежує новини, соціальні мережі та звіти користувачів, щоб виявити нові тенденції в області невідповідного контенту. Google найняв понад 10 000 людей для виявлення, аналізу та видалення вмісту, який порушує політику YouTube.