GPU прискорене розпізнавання об’єктів за допомогою нейронних згорткових мереж - PDF Free Download

Rheinische Friedrich-Wilhelms-Universität Bonn Institute of Computer Science VI Dominik Scherer GPU-прискорене розпізнавання об'єктів за допомогою нейронних згорткових мереж 8 червня 2009 р. Дипломна робота Перший рецензент: Проф. Свен Бенке Другий рецензент: проф. Підхід Йоахіма К.

єктів

2.4. Паралельне обладнання Рисунок 2.16: Архітектура SIMT: Кілька мультипроцесорів із спільною пам’яттю, інтегрованою на мікросхемі (від [Nvi08c], відредагована) Спільна пам’ять 16 КБ, до якої мають доступ усі потоки блоку, майже така ж швидка, але дещо гнучкіша. Найбільша ємність відеокарти - 1 Гб в пам’яті пристрою, яку можуть використовувати всі мультипроцесори. Однак, оскільки ця пам'ять має відносно високу затримку, кожен мультипроцесор має постійну пам'ять 64 КБ, яку можна лише прочитати. Ще однією особливістю є пам’ять текстур, яка оптимізована для двовимірного доступу і адресація якої контролюється за допомогою спеціального текстурного блоку. Хост може отримати доступ лише до пам'яті пристрою, всі інші області пам'яті доступні лише на графічному процесорі. Швидкість обчислення для багатьох алгоритмів обмежена доступною пам’яттю. Кількість блоків, які мультипроцесор може обробляти одночасно, залежить, перш за все, від двох факторів: з одного боку, від того, скільки регістрів потрібно потоку, а, з іншого боку, від обсягу спільної пам'яті, який блок 33

4.4. Вхідні та вихідні (a) кольорове зображення (b) фільтр вертикального краю (c) фільтр горизонтального краю (d) компонент яскравості Y (e) компонент кольоровості U (f) компонент кольоровості V Рисунок 4.7: Різна попередня обробка різнокольорового вхідного зображення (a) Розміщення в центрі (b) Випадкове Розміщення (c) Координата вертикального положення в кодуванні шкали сірого (d) Продовження пікселів краю (e) Зникнення краю (f) Зникнення пікселів суцільного краю Рисунок 4.8: Альтернативні варіанти роботи із зображенням, яке є замалим для вхідного рівня. 55