Бази даних про харчові продукти, інструменти сумнівної надійності

Після Юки з’явилось багато баз даних про їжу, що дозволяє споживачам краще інформуватись про те, що вони купують. Принаймні вони так думають, оскільки помилки, властиві моделі збору інформації, підривають надійність цих інструментів.

харчові

Гребінці класифікуються як продукт, що містить горіхи? У програмах для виявлення харчової цінності або небажаних інгредієнтів перероблених харчових продуктів цей тип помилок є більш поширеним, ніж ви можете подумати, і часто походить від самих виробників. Французька база даних про споживчі товари Open Food Facts, створена в 2012 році та забезпечена споживачами, дозволила завдяки своєму вільному доступу та великій кількості посилань на статті з’явити багато додатків: наприклад, Scanup та Yuka за порадами щодо харчових цінностей. або добавки, цифрові тренери з харчування або Isla Food, щоб дотримуватися халяльної дієти.

Спочатку неохоче або навіть проти вибору їхніх даних третіми сторонами, виробники з тих пір зрозуміли цінність їх передачі та почали передавати свою інформацію до Open Food Facts. Але їх іноді дратує, коли анонімні люди переписують свої дані та критикують базу даних за погане оновлення, оскільки вони регулярно змінюють свої рецепти. Знаючи про ставки, Open Food Facts створили в жовтні 2019 року спеціальний шлюз, завдяки якому виробники можуть регулярно вводити свою інформацію. Їх перевіряють, а потім блокують, щоб жоден співавтор не міг їх змінити.

Помилки від 5 до 40%

Прагнучи зберегти контроль над спільними базами даних, харчова промисловість розробляє нові бази даних з інформацією (інгредієнти, харчові цінності, алергени тощо), взятою у джерела, і, отже, теоретично більш надійною. Таким чином, національна асоціація харчової промисловості (Ania) запустила проект Num'alim, який збиратиме всі дані про їжу (від фермера до продавця) та їх споживання, щоб проводити дослідження поведінки та консультувати професіоналів. Ця платформа базуватиметься на Codeonline Food, базі даних органу з стандартизації GS1 Франція, відповідального Ania за збір інформації про товари безпосередньо від своїх членів (промисловців, але також дрібних виробників). За словами Гаель Оффре, директора з ринку споживчих товарів (PGC) для GS1 Франція, цей збір інформації у джерела забезпечує "надійну та безпечну базу даних, яку неможливо змінити і яка дає брендам можливість знову стати майстрами своїх даних". " .

Але чи обов’язково інформація, надана виробниками, є більш надійною, ніж інформація, яку надають споживачі? Жюльєн Дойєн, засновник програми Allergobox, яка виявляє алергію, сумнівається: його платформа Consotrust, яку він створив для перевірки, виправлення та сертифікації даних за допомогою алгоритмів, спостерігала від 5% до 40% помилок на думку виробників. Помилки, які він спостерігав, бувають усіх типів: орфографічні помилки (які заважають алгоритмам додатків виявляти добавку або алерген), невідповідність харчових цінностей (наприклад, 120 грамів цукру в порції 100 грамів їжі), інверсія даних (відсоток ліпідів, плутаних із відсотком насичених жирних кислот), аналітичні помилки, особливо при ідентифікації алергенів (гребінці, асимільовані на прикладі з горіхом дерева).

Ці неточності можуть мати наслідки для людей, які стежать за споживанням клейковини або солі, або страждають на алергію або діабет. "Ми не змогли створити Allergobox на основі даних Codeonline або Open Food Facts, як це є, інакше ми вбили б когось у перший день", - сказав Жульєн Дойєн AFP. "Я не обов'язково рекомендую використовувати ці програми своїм пацієнтам", - сказав спортивний дієтолог Девід yonюйон. Це залежить від випадку: для діабету це може бути корисно, для решти я волію вчити їх читати ярлики ", - говорить він. Тим більше, що, за його словами, розміщення рейтингів на основі вмісту цукру або жиру може "ввести в оману" користувачів і зосередити їхню увагу на чомусь неактуальному.

"Немає централізованого управління чи інструменту"

Продовольчий економіст П'єр Комбріс брав участь у створенні в 2008 році Обсерваторії якості харчових продуктів, і тому дуже рано натрапив на анархію даних про їжу. "Основна проблема полягає в тому, що управління даними є настільки складним, що багатьом операторам важко контролювати якість своїх даних внутрішньо, вони не обов'язково мають у своєму розпорядженні централізоване управління або інструменти", - говорить він AFP.

Відсутність інструментів, які Alkemics намагається заповнити: виробники вводять інформацію про свою продукцію на платформі цього французького стартапу, щоб ними можна було поділитися з дистриб’юторами, а також, за бажанням, додатками, призначеними для споживачів. Директор з маркетингу Alkemics Флоренс Ді Нікола вважає це "автоматизованою ланцюжком даних про товари", що відповідає на "величезний виклик" так званого регламенту Inco, який набув чинності в 2014 році і мав зробити етикетки більш читабельними шляхом стандартизації і вимагати, щоб усі веб-сайти електронної комерції надавали ту ж інформацію про харчові продукти, що і в магазинах.

Codeonline Food, Open Food Facts та Alkemics, зокрема, використовують алгоритми контролю даних, щоб уникнути невідповідностей. Додаток Yuka, який створив власну базу даних у 2018 році, ретельно відстежує дані користувачів і більше довіряє професіоналам, хоча застосовує до них засоби контролю. За оцінками Alkemics, "майже вся продукція досягає 98% якості", тобто 98% полів не містять помилок. «Сьогодні, безумовно, є проблеми з надійністю, але це залежить від галузі. Чим сирішим є продукт, тим вища надійність ", - визнає Жером Франсуа, генеральний директор Num'Alim, який розглядає можливість створення показника надійності. Оскільки, очікуючи на конкретну оцінку, неможливо знати рівень надійності різних баз даних.