Архітектура гетерогенної системи - що це насправді Hardwareluxx

AMD продовжує говорити про HSA, але що таке HSA? Архітектура гетерогенної системи була офіційно оголошена AMD на AFDS (AMD Fusion Developer Summit) 2011 з метою пришвидшення майбутнього програмного забезпечення з одночасним використанням графічного блоку та центрального процесора. Є завдання, які центральний процесор може виконувати більш ефективно, а є інші завдання, які GPU може зробити краще. З тих пір багато чого сталося, оскільки AMD на чотири покоління випереджає APU (прискорений процесор). Мікросхеми "Llano" і "Bobcat" належать до першого покоління APU, які в класичному розумінні є просто процесором і графічним процесором на одній і тій же матриці. Вони мають або не мали жодних функцій HSA. Незважаючи на все це, вони стали важливим кроком для AMD.

Друге покоління складається з APU "Trinity" та "Richland" на основі ядер "Piledriver". Вони вже пропонують прості функції HSA, але це все ще не кінець історії. Лише завдяки "Jaguar" та технології HUMA, включаючи графічну частину GCN, був досягнутий наступний вищий рівень. Шейдери GCN можуть бути запрограмовані за допомогою C ++ і, отже, можуть бути запрограмовані більш економічно у часі, ніж якщо б інженерам програмного забезпечення довелося використовувати складні мови шейдерів. Разом із "Кавері" та наступником "Ягуара" "Пумою" AMD вийшла на сучасний етап розвитку в області набору функцій HSA.

Фонд HSA - це асоціація виробників мікросхем, розробників мікрочіпів та розробників програмного забезпечення з усього світу. Найвідоміші імена включають, звичайно, засновників Advanced Micro Devices (AMD) з Каліфорнії, ARM Limited з Англії, ARM у важкій вазі Qualcomm, також з Каліфорнії, та інші компанії, які в першу чергу покладаються на ARM, такі як Samsung та MediaTek.

За допомогою цієї основи AMD та інші члени хочуть додатково оптимізувати свої власні чіпи за допомогою спільних ноу-хау та, як головний суперважкий, перейти на індустрію програмного забезпечення для оптимізації для HSA. Перш за все, це необхідно для AMD, з одного боку, а також можливість, оскільки центральні процесори від Intel явно перевершують з точки зору чистої обчислювальної продуктивності x86. Компанії також співпрацюють з низкою університетів, які підтримують їх ноу-хау.

Фонд HSA намагається використовувати спільно розроблені інструменти розробників, щоб зробити програмування для цього архітектурного підходу якомога простішим та крос-платформним для розробників. Коли інструменти будуть повністю розроблені, не має значення, чи програма згодом буде скомпільована для процесорів з архітектурою ARM або для APU з архітектурою x86. Потім компілятор робить оптимізацію для конкретної архітектури. Крім того, припускаючи відповідні набори команд, можна було б надсилати RISC-інструкції безпосередньо ядрам, оскільки для багатьох поколінь, навіть у процесорах x86, складний набір команд CISC був перетворений в набір команд RISC за допомогою більш-менш швидких декодерів. Цей крок можна пропустити і, таким чином, спочатку знову спростити одночасне програмування для процесорів ARM та x86, і час, необхідний для перекладу через декодер, буде виключено.

hUMA - це технологія, яка дозволяє процесору та графічному процесору отримувати доступ до однієї області пам'яті. Раніше це було неможливо, оскільки центральний процесор і графічний процесор зарезервували область пам'яті в оперативній пам'яті, і це більше не було доступним для іншого блоку. За допомогою hUMA цілком можливо, що центральний процесор і графічний процесор можуть отримувати доступ до одних і тих самих файлів без трудомісткого копіювання даних вперед і назад, і, в разі сумнівів, трохи більше продуктивності буде розібрано. Це може статися, лише якщо програмне забезпечення явно це підтримує. Тільки завдяки hUMA стало можливим подолання абстракційних шарів, таких як DirectCompute або OpenCL, і програмування безпосередньо на мові високого рівня C ++.

Такі програми, як Photoshop або програми загалом, які займаються процесами візуалізації або графікою, можуть отримати величезну користь від цієї технології, оскільки тут завдання, які шейдер насправді може робити краще, ніж ядро центрального процесора, не повинні вирішувати виключно центральний процесор. Сьогодні вже доступні фільтри Adobe Photoshop, які прискорюються OpenCL або CUDA на графічній карті. Але не всі з них, оскільки, на думку Adobe, копіювання даних знищує виграш (часу), який досягається обчисленням на графічній карті.

[h3] hQ (гетерогенні черги) [/ h3]

Штаб-квартира була оголошена компанією AMD лише нещодавно. Ця технологія, яка буде використана лише в процесорах "Kaveri", які будуть випущені в січні, дозволяє процесору та графічному процесору обробляти завдання на рівних умовах. Раніше центральний процесор завжди призначав завдання графічному процесору. Тож вона була господарем серед двох підрозділів. Тут також програмне забезпечення повинно підтримувати штаб-квартиру, оскільки воно розподіляє завдання без прямої дії операційної системи. Так звані черги завдань виконуються програмою безпосередньо в користувацькому режимі, що перш за все скорочує час, який був би необхідний, якби завдання виконувалися лише через операційну систему в режимі ядра. Сама Microsoft має подібний інтерфейс, а саме C ++ AMP, але це працює через DirectCompute, і Microsoft майже зупинила подальший розвиток.

Стратегія AMD чітка: навіть якщо поточні APU на перший погляд здаються менш швидкими, ніж конкуренти, вони більше підходять для певних завдань, ніж здається. Тільки належним чином оптимізоване програмне забезпечення може повністю використати цей потенціал, і тут AMD намагається вивести різні технології на ринок, взаємодіючи з іншими розмірами бізнесу. Чи вдасться це, доведеться визначити час.

Наша порада щодо придбання поточних процесорів Intel і AMD допоможе вам не загубити слід. Там ми показуємо, які процесори на сьогодні є найкращим вибором - незалежно від того, чи йдеться про чистоту продуктивності чи співвідношення ціни та якості.