Новий Google AI може називати калорії на фотографіях продуктів харчування в Instagram

Різні програми для здоров’я користуються великою популярністю на мобільних пристроях, і численні користувачі намагаються стежити за своєю дієтою за допомогою лічильників калорій. Але скільки енергії насправді додає тілу під час їжі? У випадку з продуктами супермаркетів це написано на упаковці, і у всіх інших ситуаціях алгоритм, розроблений співробітником Google Кевіном Мерфі, може допомогти.

новий

"Im2Calories" - так називається його інструмент, який він нещодавно представив на саміті Rework Deep Learning Summit у Бостоні. На заході розробники обміняються думками про програми, які за допомогою алгоритмів самонавчання та різних методів аналізу здатні дедалі краще справлятися з абстрактними завданнями. Додаток Мерфі працює за дуже простим принципом: користувач передає їй фото своєї їжі і повертає значення калорій, які вона містить, повідомляє Smithsonian Magazine.

Однак за цим простим звуковим механізмом стоять надзвичайно складні методи аналізу зображень. Система повинна розібрати представлену фотографію настільки добре, що на першому кроці вона розпізнає, які окремі компоненти їжі можна побачити. Не менш складним є другий крок, на якому необхідно оцінити кількість кожного продукту на тарілці на основі різних характеристик, які можна використовувати для порівняння.

Останнє порівняно легко, якщо система розпізнає на малюнку яйце або скибочку ковбаси. Це стає складніше з порцією картоплі фрі, яка була засипана навколо гамбургера. Як зазначив розробник, для успішного аналізу фото їжі навіть не повинно бути з якомога кращою роздільною здатністю. Цілком достатньо надати алгоритму численні фотографії продуктів харчування, які регулярно публікують в Instagram численні користувачі.

За словами Мерфі, розрахунки калорій в даний час точні приблизно до 20 відсотків. Враховуючи складність завдання, це надзвичайно чудово. Однак це проект із галузі глибокого навчання - програмне забезпечення розроблено таким чином, що воно автоматично вдосконалюється, коли йому повідомляють про неправильні розрахунки.

Тепер розробник хоче зробити програмне забезпечення доступним для групи більшої кількості користувачів після початкових тестів. Як результат, найближчим часом у систему повинно надходити значно більше зворотного зв’язку, а продуктивність повинна значно зростати. У Google, схоже, впевнені, що алгоритм його розробника буде працювати добре і що користувачі зацікавляться. Принаймні один уже подав заявку на патент на процес. Fast Ring, бакалія, гамбургер Jeshoots (CC0)