Статистична робоча група

Статистичну робочу групу організовують Гаел Шаньї та Антуан Шаннаронд. Якщо не вказано інше, сеанси проводяться в Мадриле в четвер, з 10:30 до 11:30 або з 14:00 до 15:00 в залі для семінарів M.0.1 (перший поверх).

Програма 2014-2015

18 червня 2015 р. (10:30) Анджеліна Рош (MAP5, Університет Парижа 5) Адаптивна оцінка ядра умовних розподілів з функціональним коваріатом У цій розмові ми зацікавлені в дослідженні зв'язку між змінною, що цікавить Y, та змінна X зі значеннями в просторі Гільберта (як правило, функціональний простір). Цей тип проблем виникає, наприклад, у спектроскопії, коли прагнуть зробити висновок про хімічний склад сполуки за її спектрометричною кривою. Ми розглядаємо оцінки ядра типу Надарая-Ватсон, функції умовного розподілу та функції регресії. Якість оцінювача сильно залежить від того, як обрано один із параметрів оцінки - вікно. Ми запропонуємо метод вибору цього параметра, натхненний роботами Гольденшлюгера та Лепського (2011) та інструментами вибору моделі. Отриманий кошторис є оптимальним у сенсі оракула та мінімаксі, аж до втрати журналу. Вибір псевдовідстані в ядрі також буде коротко обговорено. Ця робота співпрацює з Гаел Шаньї (LMRS, Руанський університет).

23 квітня 2015 р. (9:00) Євген Пчелінцев (Томський державний університет) Покращені зважені LS-оцінки для регресійної функції з негауссовим шумом Ми розглядаємо проблему непараметричної оцінки через квадратичний ризик періодичної функції в безперервній модель регресії часу з негауссовим напівмартингальним шумом. Ми пропонуємо вдосконалені зважені оцінки, які за деяких загальних умов мають перевагу середньоквадратичної точності перед оціненими найменшими квадратами. Встановлено асимптотичну мінімаксичність запропонованих оцінок.

26 березня 2015 р. (10:30) Мадаліна Олтеану (Лабораторія SAMM, Університет Парижа 1) Самоорганізуючі карти для складних даних Ця доповідь буде присвячена презентації деяких розширень самоорганізуючих карт для невекторних даних. По-перше, ми припустимо, що дані відомі лише через матрицю відмінностей. По-друге, дані будуть описані кількома цифровими та/або нецифровими джерелами (наприклад, графіком, позначеним кількісною та/або якісною інформацією про вузли). Різні джерела інформації будуть враховані за допомогою адаптивного поєднання ядер або відмінностей. Деякі приклади реальних та змодельованих даних ілюструють різні алгоритми та представляють пакет R SOMbrero.

19 березня 2015 р. (10:30 ранку) Емільєн Джолі (Університет Парижу, 11, Орсе). Оцінка великих втрат хвоста. Історично, одним із перших завдань статистиків було забезпечення та доведення методів оцінки очікувань d 'a. Однак ця проблема, яка добре відома сьогодні, не була проігнорована дослідниками, і саме з цього приводу дві статті запропонували дві нові методики оцінки (Catoni, 2012; Lerasle та Oliveira, 2011). Вони мають ту перевагу, що пропонують два оцінювачі, сильно сконцентровані навколо очікувань, з невеликими припущеннями щодо розглянутого розподілу (по суті, кінцева дисперсія). Ми визначимо ці оцінювачі та спробуємо зрозуміти їх відмінності. Нарешті, ми побачимо, що вони пропонують для пов'язаних проблем, таких як емпіричне мінімізація ризику, класифікація або U-оцінка.

29 січня 2015 р. (10:30 ранку) Керолайн Берар (LITIS, Університет Руана) Приховані моделі Маркова із сумішами як розподіл викидів У некерованій класифікації приховані моделі Маркова (HMM) використовуються для врахування структури сусідства між спостереженнями. Розподіли викидів часто належать до якогось параметричного сімейства. Тут пропонується напівпараметричне моделювання, де розподіли викидів є сумішшю параметричних розподілів, щоб отримати більшу гнучкість. Ми показуємо, що класичний алгоритм ЕМ може бути адаптований для виведення параметрів моделі. Для кроку ініціалізації, починаючи з великої кількості компонентів, пропонується ієрархічний метод їх об'єднання у приховані стани. Обговорюються три критерії, що ґрунтуються на вірогідності вибору компонентів, які будуть поєднані. Запропонований метод проілюстровано з використанням біологічних даних.

4 грудня 2014 р. (10:30) Мод Делатр (MORSE та команди статистики та геному, AgroParisTech) Який BIC у змішаних моделях? (у співпраці з Marc Lavielle та Marie-Anne Poursat) Критерій BIC широко використовується для відбору змінних у змішаних моделях. На практиці цікаво відзначити, що він кодується по-різному відповідно до статистичного програмного забезпечення. Ми розглянули асимптотичне вивчення ймовірності дуже загальних змішаних моделей, щоб запропонувати критерій BIC, який відповідає як структурі аналізованих даних (зазвичай повторюваних даних), так і коваріаційній структурі випадкових ефектів. Ми ілюструємо поведінку цього BIC шляхом імітаційного дослідження та рекомендуємо використовувати його як альтернативу різним існуючим версіям.

Список літератури:

Ч. Бірнакі, Г. Целе, Г. Говаерт. Оцінка моделі суміші для кластеризації з інтегрованою завершеною ймовірністю. Аналіз зразків та машинний інтелект, IEEE транзакції, 22 (7): 719-725, 2000.
А. Шаннаронд, Ж.-Додін та С. Робін, Класифікація та оцінка в стохастичній блок-моделі на основі емпіричних ступенів. Електронний журнал статистики, 6: 2574-2601, 2012.
К. Керібін, В. Брауль, Г. Селе, Г. Говаерт. Оцінка та вибір для моделі прихованого блоку за категоріальними даними. Статистика та обчислення, сторінки 1-16, 2014.
Х. Лередде та П. Перін. Меровінгські пряжки. Археологічні файли, 42: 83-87, 1980.
Дж. Вайс і Н. Фріл. Кластеризація блоків із згорнутими прихованими моделями блоків. Статистика та обчислення, сторінки 1-14, 2010.