Внутрішній бій у тренажері; 5 0 для машини; Очі прямо вперед!

Машина 5: 0 чоловік. Це був результат конкурсу AlphaDogfight, організованого цього тижня Агентством оборонних дослідницьких проектів (DARPA), дослідницьким агентством для американських військових. Внутрішній бій стосується ближнього повітряного бою між двома бойовими літаками, і в цій спробі штучний інтелект (ШІ) змагався в симуляторі проти людини-пілота. ШІ виграв великий. Але що це означає?

Френк Зауер, політолог з університету Бундесверу в Мюнхені, стурбований важливістю штучного інтелекту для систем озброєнь, включаючи питання про те, які правила повинні застосовуватися до смертоносних автономних систем озброєнь. Він прямо в очі! записав свої спостереження за цим експериментом, який закінчився у четвер (учора) вершиною людина проти машини:

Вже в серпні 2019 року DARPA відібрала вісім команд з університетів та промисловості - від великих компаній, таких як Lockheed Martin, до невеликих груп, таких як Heron Systems, - для участі в програмі Air Combat Evolution (ACE). Цього тижня, з 18 по 20 серпня, програмні рішення, розроблені вісьмома командами, спочатку змагалися між собою в модельованому повітряному бою та проти програмного забезпечення лабораторії прикладної фізики Університету Джона Хопкінса, щоб визначити, хто буде у фіналі людям-пілотам дозволено вимірювати.

Heron Systems вийшла переможцем з попередніх боїв і, нарешті, змагалася проти пілота-винищувача "Banger". Він сидів у тренажері в окулярах для віртуальної реальності і, нарешті, отримав коротку соломинку з 0 до 5.

Звичайні маневри повітряного бою марні, заявив Бенджер після 0 до 4 проти машини. Ось чому він хотів спробувати щось інше наприкінці. Останній круг насправді зайняв помітно більше часу, але врешті-решт програмне забезпечення Heron поставило перед пілотованим носом літака людину-пілота Бенджера, достатньо довгий, щоб виграти дуель.

Як усе це оцінювати? Перш за все, слід зазначити, що результат змагань аж ніяк не дивує. Вже в 2016 році програмне забезпечення ALPHA, розроблене компанією Psibernetix Inc., яке працювало на тодішньому комп’ютерному комп’ютері Raspberry Pi вартістю 35 доларів, перемогло пілота-людини під час випробувань для дослідницької лабораторії ВПС США. Якби Бенджер виграв один раунд симуляції проти Герона, це була б сенсація.

Тому що ключове слово - це моделювання. Людина та машина змагалися один з одним у значно спрощеному середовищі, в якому машина мала повну інформацію. Для Герона не було що робити, окрім оптимізації енергії, кута, відстані та кількох інших параметрів - легка вправа для системи глибокого навчання, підготовленої для підкріплення.

Системі не довелося боятися втратити свідомість під час поворотів 9G. Бо в ньому все одно немає. Однак Banger також зміг скористатися імітованим середовищем у цьому відношенні. Насправді він навряд чи впорався б із маневрами, які йому було зручно полетіти зі стільця.

Тому сенс та мета моделювання ACE не полягає в отриманні результатів, які можна перенести в реальність. Швидше, в більш широкому розумінні, інтереси промисловості мають бути виховувані, з одного боку, і довіра збройних сил США до штучного інтелекту, з іншого боку.

Коротше кажучи: пілоти-люди повинні звикнути до думки, що їх у майбутньому супроводжуватимуть і підтримуватимуть програмно керовані безпілотні системи. В даний час розробляється програмне забезпечення для такої супровідної системи для винищувача F-35 - як частина програми під назвою "Skyborg" з усією серйозністю. У змаганнях за апаратне забезпечення, серед інших, компанія Kratos із XQ-58A Valkyrie та Boeing із своїм безпілотником Loyal Wingman. Подібна концепція планується в Європі з системою майбутнього бойового повітря.

Тому наступ чарівності ШІ має не лише технічні, але перш за все організаційно-політичні передумови. Тому що ні з США Військово-повітряні сили, перебуваючи у складі ВМС, пілоти з особливим ентузіазмом ставляться до ідеї передачі управління польотом - це видно, наприклад, з програм ВМС США за останні роки.

Демонстратор технологій X-47B від Northrop Grumman успішно завершив зльоти та посадки на авіаносцях та заправку в польоті, але, як очікували багато спостерігачів, не отримав подальшого розвитку в безпілотний бойовий літальний апарат, що підтримується носієм, який в основному управлявся без контролю людини. Натомість Boeing зараз постачає ВМС MQ-25 Stingray, безпілотний танкер і розвідувальну платформу. "Справжнє польоту" залишається в людських руках - і причини цього, на думку ThinkTanks у Вашингтоні та колишніх співробітників Пентагону, скоріше культурні, ніж технічні.

Однак у довгостроковій перспективі ШІ все одно знайде свій шлях до кабіни. Без людей з обмеженими навантаженнями більших показників можна досягти не лише за допомогою існуючих планерних конструкцій. Можливі також абсолютно нові конструкції та тактики. Той факт, що люди, навіть якщо вони фізично відсутні, продовжуватимуть відігравати вирішальну роль - у прямому сенсі цього слова - у більшості випадків також довгий час не підлягає сумніву.

Оскільки недостатня обізнаність щодо програмного забезпечення є і перевагою, і недоліком. З одного боку, в 9G вона не може втратити те, чого не має. З іншого боку, системи глибокого навчання, такі як Heron and Co., не зможуть когнітивно зробити те, що може мислити людина в найближчому майбутньому. Вони не тільки жадають даних (жадібні), але й надзвичайно схильні до помилок, коли мають справу з незнайомими ситуаціями (крихкими). З іншого боку, люди розуміють контекст, можуть класифікувати нові ситуації та приймати надійні рішення, незважаючи на брак інформації. Тож не дивно, що в ACE багато говорили про пілотовані безпілотні команди як про фактичну мету. Тому майбутнє буде виглядати так: Машина летить, людина думає - і приймає рішення здалеку.

І ще одна примітка щодо цього від Міссі Каммінгс, колишньої американської льотчиці-винищувача. Дослідник ВМС та ШІ: дайте мені знати, коли ШІ зможе постійно розрізняти учасників бойових дій та некомбатантів.

Тут немає нічого дивного - боротьба з собаками полягає виключно на правилах, і той, хто може довше літати на краю маневреного огинаючого, виграє. У людей не було шансів. Коли ШІ в площині може послідовно розрізняти учасників бойових дій та некомбатантів, зателефонуйте мені https://t.co/d69yUjuFaL https://t.co/rp81Q6NZ5g

(Френк також є одним із моїх співведучих у подкасті, щоб бути у безпеці, велике йому спасибі!)

(Фото: знімок екрану з відео о 4:50:30)

23 відповіді на "Повітряний бій у тренажері - 5: 0 для машини"

Вам потрібен ШІ "послідовно" або з прийнятним коефіцієнтом помилок? https://en.wikipedia.org/wiki/190th_Fighter_Squadron,_Blues_and_Royals_friendly_fire_incident times як приклад людської помилки.

Послідовно вже означає з прийнятним коефіцієнтом помилок. Помилки також можуть бути послідовними. Тут прямо не сказано "бездоганно".

" Справжня авіація "залишається в людських руках - і причини цього, на думку аналітичних центрів у Вашингтоні та колишніх співробітників Пентагону, мають більше культурний, ніж технічний характер".
Через все ще високий рівень помилок ШІ, це добре. Але майте на увазі, що це моментальний знімок.
Щодо питання культурного чи технічного характеру, я просто хотів би сказати, що керманичі безпілотників також з’являються у ВПС із заявою про підготовку як бойових пілотів. І, звичайно, обслуговування повинно здійснюватися в льотному костюмі (іншого способу управління безпілотником немає, SARC OFF). Я запитую себе, скільки аварійних літаків нам знадобиться в майбутньому, які ніколи не можна використовувати, але які потрібні для бойової підготовки контролерів безпілотників.

Мало того, що безпілотники можуть досягти більш високих показників, вони також мають значно менше баласту, наприклад, кабіну, сидіння, сидіння ежектора, кисень.

До того ж надійність не особливо висока. Якщо дрон падає, це нікого не постраждає.

Це означає, що безпілотники можна випускати набагато дешевше, менше та легше.

Тоді одного дня дві авіації протистоять одна одній:
Один складається з 1000 маленьких, легких, дешевих безпілотників, які виграють 90% боїв у повітряному бою, але отримують один синій, один зелений та два сірі вбивства на десяти вбивствах червоних. Інші ВПС складаються із 100 великих, важких, дорогих класичних літаків, які виграють лише 10% повітряних боїв, але на 1000 місій вони мають стільки ж відмов, скільки і безпілотники на 10.

На якій стороні я хочу бути, на "Шіс-ін-Краут" чи на "Trifftnix"?

Поговоримо про запрограмовані алгоритми або реальний ШІ?
Це стає цікавим після 1 проти 1, наприклад, з 4 проти 4.
Коли досвідчені пілоти проаналізували комп’ютерні маневри та впровадили власні висновки в нові тактики, як комп’ютер чи принаймні ШІ реагують на них.

"Я запитую себе, скільки аварійних літаків нам знадобиться в майбутньому, які ніколи не слід використовувати, але які потрібні для боєздатної підготовки диспетчерів безпілотників".

@ SB63: Який аварійний літак повинен знадобитися екіпажам RPAS? Відповідні концепції та правила можуть не на 100% визначати майбутній навчальний шлях, але шлях до LCR вже описаний досить точно. Також чітко йдеться про окрему ТКТП та необхідні навчальні кроки. Але ніде не сказано, що ні майбутні WSOps, ні AVO не вимагають або конфіскують будь-який тип розгортання.

Міссі Каммінгс вказує на суть справи "надзвичайно заснованою на правилах". Характер змагань можна було б описати набагато точніше за допомогою «шахістів проти шахових комп’ютерів». Якщо говорити про ШІ тут, то створюється неправильне враження.

@Magmakammer
Мова йде про розробку програмного забезпечення.

Це означає, що Бундестаг ще 10 років обговорюватиме, чи є морально виправданим запровадження цих систем (див. Франко-німецький проект FCAS), тоді як інші країни вже давно запроваджують їх.

Знову ж таки - "комбатанти і некомбатанти" ... Що, якщо це трапиться в запеклій сутичці з сильними ворогами? Якщо відбудеться авіаудар по містах? ("Гібридна війна" та "некомбатанти" ...) "Це ніколи не може бути, бо не може бути ..." Ну, здається, Ізраїль по-іншому почувається і досліджує штучний інтелект. З повагою ...

Також існує ризик перенасичення датчиків та ефекторів. І: при необхідності безпілотний літальний апарат просто таранить ворога, коли він наблизиться до нього.

Тоді чому, на біса, ШІ завжди такий поганий при моделюванні польотів?;)

Щоб у вас був шанс як людського гравця!;-)

Якби ШІ було просто запрограмовано відповідно до "чистих" параметрів в моделюванні, потрапляння першого пострілу падало б на максимальній дальності зброї. Отже, у кожен ШІ повинна бути вбудована відповідно "нечиста" поведінка, щоб веселість у грі зберігалася.

Однак - як уже було зазначено вище - це працює лише у стерильних умовах тренажера зі 100% відомими та розрахованими значеннями та параметрами.

"Насправді він навряд чи зміг би впоратися з маневрами, які він зручно пролетів зі свого крісла".

Я хотів би суперечити цьому. Сонячні бої були схожі на ті, які регулярно тренуються пілотами.

Це нова версія TacAir SOAR чи насправді щось нове?

Ну, приватно, ізраїльські ВПС і ВМС мають проблеми не з Іраном, а з ... Росією. На жаль, не дивуйтеся. Нам потрібно випередити цей, дружній Skynet (на івриті) та "Печать Соломона", про всяк випадок ... (смішний смайлик) Щиро ...

Я повинен визнати, що навіть після 5 років професійної діяльності у галузі машинного навчання (ML) я не можу звикнути до терміна "штучний інтелект (ШІ)". У галузі цей термін рідко використовується або навіть розглядається як показник того, що зацікавлена особа повинна бути менеджером, продавцем або журналістом;-)

Особливо з повідомленнями, які змушують читачів відчувати: «Ми скоро застаріємо», це завжди допомагає пам’ятати, що насправді штучний інтелект (ШІ): а саме не що інше, як математична формула з фіксованим набором параметрів і Вага. Тому ШІ не може реагувати на абсолютно нові параметри, оскільки формула просто не містить цих параметрів. Отже, ШІ нічого не знає про світ поза простором параметрів - яким він харчувався під час навчання.

Таким же чином, ШІ, як правило, реагує абсолютно непередбачувано, якщо значення подаються за вже відомими параметрами, які суттєво відрізняються від значень, що спостерігаються під час тренування (або через історичні дані, або через значення в змодельованому навчальному середовищі) (TW вже має термін "крихкий" додається).

На відміну від машин, тварини та люди навчились еволюцією реагувати на такі невідомі ситуації евристикою. Наприклад, реакція на втечу - одна з таких евристик. Ці евристики не завжди ефективні, але вони надійні. Це показує істотну різницю між насправді розумним життям та стохастичними машинами.

Особисто я вважаю, що відсутність здатності впоратися з абсолютно новими або незнайомими ситуаціями досить передбачуваним та надійним способом (без перекваліфікації) є жорсткою межею для машинного навчання.

З іншого боку, сучасні підходи до машинного навчання є несподівано сильними, наприклад, коли йдеться про виявлення ракових клітин з низьким показником хибнопозитивних чи помилково негативних показників. Ось чому я абсолютно не погоджуюся з твітом Міссі Каммінгс тут: Націлювання - це одна з сильних сторін ML та одна зі слабких сторін людей. Останні втомлюються, бояться і демонструють погану здатність приймати об’єктивні рішення у стресових ситуаціях. З іншого боку, модель ML може (в основному) позбавлена суб'єктивних впливів, на основі всіх наявних даних, обчислювати стохастичну ймовірність (впевненість), що ціль є учасником бойових дій. Тут розробники можуть встановити високий поріг довіри, що у випадку сумнівів призведе до того, що машина пожертвує собою перед тим, як битися із сторонніми особами. Навпаки, пілотовані системи повинні боятися власного знищення і, швидше за все, натиснуть на курок.

В даний час досягається великий прогрес у роботі з неповною інформацією та довгостроковим плануванням. Яскравим прикладом тут є AlphaStar: модель ML, розроблена Deepmind і здатна грати в комп’ютерну гру StarCraft 2 в режимі реального часу та конкурувати з найкращими гравцями світу. Обставина, яку довгий час вважали неможливою навіть фахівці. Оскільки гра може тривати від декількох хвилин до більше години. Кожна попередня дія чи рішення впливає на варіанти дій у більш пізній момент часу. Крім того, так званий "туман війни" приховує дії противника. Тож модель повинна обирати стратегію, не знаючи, яку стратегію обере суперник. Ситуація розвивається абсолютно динамічно і вносить основні зміни в стратегію, необхідні в несприятливих ситуаціях, хоча жодна стратегія чи тактика явно не перевершує (перевертання монети).

[Поки що я терплю англійськомовні коментарі в німецькомовному блозі ... те, що я не хочу терпіти: Використання цитат без надання джерела. Т.В.]

Олег, я вважаю ваші ідеї цікавими та хорошим внеском. І, як зазначає Т.В. писав, він терпить публікації англійською мовою, але не бажає цитати без джерела. Дуже поширене доповнення навіть для нас, хто говорить німецькою мовою ...;-)

Як це часто буває, те саме застосовується і тут - найкраща суміш. Що говорить проти того, що люди, які приймають рішення в літаку, можуть підтримуватися комп’ютерами або алгоритмами. Шлях туди так чи інакше пішов давно. Давно можливо, щоб операція проходила майже автономно з людьми виключно як керівники, які можуть змінити стратегію, якщо це необхідно. Автоматичне виконання повітряних бойових маневрів - це лише ще один крок.

Про що не слід забувати в абсолютно автономному безпілотному літаку, це аспект дозволеності.

Зараз я на пенсії і маю проблеми з Інтернетом. Але час ще є (смайлик)
Дякую за вашу підтримку, пішоходи!

@ Олег Ольха 19:23
Пенсіонери та геймери? У будь-якому випадку це не робить вас непривабливим! (Смайлик)

Повідомте мене, коли (...) особа (...) зможе постійно розрізняти учасників бойових дій та некомбатантів. Або хочете . . .