Ru En

Зарегистрироваться

OpenTalks.AI /
6-7 Марта 2024,
Тбилиси

Открытая конференция по ии

Зарегистрироваться!

Программа
OpenTalks.AI 2022

версия от 15.02.2022

Программа в PDF

Онлайн трансляция

День CV и RL

Четверг, 17 Февраля

09:00 – 10:00

Регистрация

10:00 – 10:10

Открытие конференции и дня

Игорь Пивоваров, OpenTalks.AI

Что будет на конференции, основные идеи, цифры, акценты.

10:10 – 11:25

Пленарная сессия 1 - обзоры

Большой конференц-зал

10.10 – 10.50

Computer vision - главное в 2021

Алексей Досовицкий, Inceptive, ex-Google Brain

Vision in 2021: Transformers, Transfer, and Beyond

10.50 – 11.25

Нейроморфные системы искусственного интеллекта

Денис Ларионов, ЧУ Цифрум, Росатом

В докладе будет рассмотрен принцип классификации нейроморфных систем искусственного интеллекта и приведен аналитический обзор в соответствии с предложенным принципом следующих нейроморфных проектов: SpiNNaker, TrueNorth, Loihi, BrainScaleS, Tianjic, NeuronFlow, Akida, DYNAP, Алтай. Для каждого проекта будут приведены примеры решения прикладных задач и другие интересные особенности.

11:25 – 11:45

Перерыв

11:45 – 12:45

Параллельные сессии

Илья Контаев,
xperience.ai

Vision Transformers - обзор архитектур, основных идей и трюков.

Андрей Федулин,
АО «КТ - Беспилотные Системы»

Актуальные задачи и проблемы внедрения систем технического зрения для БпЛА класса MALE

Цель доклада продемонстрировать достижения алгоритмов на основе ИИ для лучевой диагностики и сравнить с результатами работы «среднего» врача-рентгенолога. В качестве материалов использованы результаты работы Эксперимента по применению компьютерного зрения в лучевой диагностике (mosmed.ai) и результаты «ИИ-батла» с участием 8 коммерческих алгоритмов и 366 врачей-рентгенологов. ИИ-алгоритмы способны решать задачи по подготовке протоколов описаний и заключений по исследованию, а также способны классифицировать патологические находки и корректно отмечать их на рентгенологических изображениях. Однако до сих пор в работе алгоритмов встречаются технологические дефекты, обусловленные некорректным определением анатомической области, изменением параметров изображения, приводящее к невозможности проведения его клиникой оценки врачом-рентгенологом и, выявлением находок за пределами целевого органа. При сопоставлении метрик диагностической точности с таковыми «среднего» врача-рентгенолога, видим существенное отставание ИИ от врача. Наиболее близки к врачу-рентгенологу только ИИ-алгоритмы, определяющие поражения лёгких при Covid-19. Стоит отметить появление новых алгоритмов ИИ, способных выполнять скрининговые исследования патологий, которые требуют отдельных пакетов рентгенологических инструментов или остаются без внимания при описании исследования врачом, но при этом могут быть важны для дальнейшего ведения пациента.

Подробнее

Предложены функции потерь для обучения нейронной сети RetinaNet, моделирующие гомоскедастичную алеаторную неопределенность, для детекции объектов на изображении. Функции получены с помощью байесовского вывода и позволяют использовать его в существующих нейросетевых детекторах, основанных на архитектуре RetinaNet. Преимущества функций потерь продемонстрированы на двух задачах детекции изображений. С помощью новых функций потерь удалось повысить точность детекции, а именно локализации и классификации, на изображениях набора данных COCO в среднем на 1,7%, на наборе изображений пыльцы - на 2,76%. Показано, что моделирование гомоскедастичной алеаторной неопределенности в процессе обучения нейронной сети позволяет отделять шум, присущий данным, от сигнала, тем самым повышая точность решения задач.

Подробнее

Общая проблема обнаружения аномалий во временных рядах часто разделяется на две конкретные проблемы: обнаружение выбросов (outlier detection, для точечных аномалий) и обнаружение точек изменения состояния (changepoint detection, для коллективных аномалий). Открытые датасеты обычно используются для оценки алгоритмов и методов, решающих каждую из проблем. К сожалению, доступные открытые датасеты с аномалиями обычно не относятся к области аномалий в промышленности по крайней мере по двум причинам: машинное обучение - относительно новый метод, а промышленные данные часто являются закрытыми и не публикуются в открытых источниках. Отсутствие открытых датасетов для обнаружения аномалий привело нас к идее создания нового хорошо описанного структурированного открытого датасета для обнаружения аномалий. Мы предлагаем Skoltech Anomaly Benchmark (SKAB), который состоит из многомерных наборов данных, включая данные как в исправном, так и в неисправном режимах. Наборы данных размечены как для проблемы обнаружения выбросов, так и для проблемы обнаружения точек изменения состояния.

Подробнее

В докладе рассматриваются актуальные задачи повышения применения крупноразмерных БпЛА двойного назначения в задача аэромониторинга, решаемые с помощью систем технического зрения с элементами ИИ, а также специфика и проблематика их внедрения в авиационной индустрии.

Подробнее

За последние несколько лет архитектуры на базе Transformer заняли важное место в задачах обработки естественного языка. Однако использование механизма self-attention в задачах компьютерного зрения ограничено из-за квадратичной сложности данной операции. В ходе доклада будут рассмотрены основные идеи и трюки, использованные в Vision Transformer (ViT), которые позволяют решать задачу классификации изображений без использования свёрточных слоёв. Более кратко рассмотрим другие основные архитектуры из данного семейства.

Подробнее

В нашей работе проведен анализ широкой выборки сверхновых по данным Open Supernova Catalog, дополненной 10 объектами из класса сверхновых с зарегистрированным гамма всплеском. В нашем анализе мы сфокусировались на форме долговременной кривой блеска сверхновых, а также на проверке связей между ее характеристиками. С помощью методов машинного обучения мы смогли разработать модель, способную различать два класса объектов, используя информацию о кривой блеска, а также восстанавливать информацию о светимости сверхновой на ранней стадии. Найденная возможность классификации дает важную возможность: в случаях с недостаточным количеством наблюдательных данных описанный метод способен помочь разрешить тип спорных объектов, и, кроме того, возможно использовать разработанный классификатор для поиска сверхновых с гамма всплесками в архивных данных.

Подробнее

Андрей Фильченков, ИТМО

Модератор

Партнеры сессии

Партнер сессии

Егор Захаров,
Samsung AI Center, Сколтех

Neural Rendering for Telepresence

Ксения Евтеева,
ДЗМ

Как заставить искусственный интеллект работать в реальной медицинской практике?

Данный доклад фокусируется на автоматизированной платформе для оценки качества сервисов на основе алгоритмов компьютерного зрения в рентгенологической практике. Для оценки качества ИИ-сервисов был разработан инструмент ROC анализа, реализованный также в формате веб-сайта. Он позволяет рассчитать матрицу ошибок, основные метрики точности, а также построить ROC кривую с 95% доверительным интервалом. Инструмент позволяет визуализировать оптимальные пороговые значения по точкам с максимальным индексом Юдена или минимальным расстоянием до левого верхнего угла графика. Для того, чтобы автоматизировать процесс оценки сервисов на основе данного инструмента, была разработана платформа на основе метода обмена сообщениями и файлами между ИИ-сервисами и платформой. При этом, в дополнение к метрикам инструмента ROC анализа происходит автоматическая регистрация времени обработки исследования сервисом. Апробация платформы проводилась на основе семи тестирований шести ИИ-сервисов. Один из сервисов прошел два тестирования на платформе в связи с доработками алгоритма. При этом была полностью снята нагрузка с экспертов, а общее время подтверждения валидности сервиса сократилось с девяти рабочих дней до трех. Данная разработка будет полезна как разработчику, так и конечному пользователю. Оценка на эталонном наборе реальных данных конечному пользователю позволит выбрать оптимальное решение для медицинской организации, а также подтвердить валидность сервиса после доработки, а разработчику позволит найти пути модернизации алгоритма.

Подробнее

Евгений Кононенко,
NtechLab

Face Recognition: проблемы и вызовы

Михаил Беляев,
IRA Labs

Медицинское компьютерное зрение: исследования и продукты

Роман Доронин, EORA.AI

Модератор

Анна Андрейченко, ДЗМ

Эталонные наборы данных для обеспечения надежного внедрения технологий искусственного интеллекта в медицинскую практику

В настоящее время существует множество решений на основе технологий искусственного интеллекта для медицинской диагностики, которые их создатели позиционируют как готовые для практического клинического использования. Однако целесообразность широкого практического применения технологий искусственного интеллекта и компьютерного зрения в медицинской диагностике еще предстоит доказать и оправдать. Одним из ключевых шагов при разработке, валидации и эксплуатации моделей машинного обучения являются размеченные наборы данных. На данный момент отсутствуют унифицированные стандарты, методологии и технологические решения, позволяющие формировать большие объемы наборов медицинских данных, пригодных для обучения и валидации (в т.ч. оценка эффективности, безопасности, рисков внедрения) программного обеспечения для медицинской диагностики, в котором используются технологии искусственного интеллекта. В докладе будет рассказано о разработанной в Центре Диагностики и Телемедицины (ГБУЗ «НПКЦ ДиТ ДЗМ») универсальной методологии подготовки наборов данных данных для выбора, настройки и оценки работы ИИ алгоритмов для лучевой диагностики в масштабе мегаполиса и практических результатах методологии.

Подробнее

Виктория Зинченко, ДЗМ

Клинические испытания медицинского ПО с искусственным интеллектом

Разработка, производство и выпуск в обращение систем искусственного интеллекта, как медицинских изделий, должны в обязательном порядке законодательно и технически регулироваться, т.к. относятся к высокому классу риска. Клинические испытания, технические испытания и последующая экспертная проверка, при регистрации медицинских изделий являются частью оценки безопасности, эффективности и качества продуктов на основе технологий искусственного интеллекта. Методология проведения клинических испытаний, представленная в национальном российском стандарте по клинической медицине (сформирована окончательная редакция), включает клиническую связь и клиническую валидацию на наборах данных, стоит отметить, что за основу взят как национальный, так и международный опыт (рекомендации FDA и IMDRF). Методология также включает рекомендуемый перечень показателей эффективности и требования к наборам данных для тестирования систем искусственного интеллекта, а также требования к исследователям, проводящим испытания и системе менеджмента качества при организации испытаний. Апробация разработанной методологии клинических испытаний систем искусственного интеллекта проведена на базе Центра диагностики и телемедицинских технологий. Клинические испытания систем искусственного интеллекта процесс, который отличается от испытаний других медицинских изделий, в нем принимают участие врачи, ИТ-специалисты, аналитики и инженеры. Достоверное тестирование по разработанной методологии клинических испытаний систем искусственного интеллекта поможет сделать такие инновационные продукты более "прозрачными" и повысить к ним доверие как врачей (медицинского персонала), так и пациентов.

Подробнее

CV в медицинской диагностике: московский опыт

Модератор

Зал Галактики 1-3

Зал Сатурн

Большой зал

Сергей Морозов,
Центр диагностики и телемедицины ДЗМ

Научные доклады в ML

Разработка в CV

Кирилл Арзамасов, ДЗМ

Может ли сейчас ИИ заменить рентгенолога?

Байесовская RetinaNet для моделирования гомоскедастичной алеаторной неопределенности в задаче детекции объектов на изображениях

Наталья Ханжина,
ИТМО

Открытые бенчмарки для задач обнаружения аномалий во временных рядах

Юрий Кацер,
Сколтех, ЧУ Цифрум

Машинное обучение в астрофизике: как восстановить утерянную информацию о сверхновых?

Артем Просветов,
ИКИ РАН

Вячеслав Козицин,
Сколтех, ЧУ Цифрум

12:45 – 13:00

Перерыв

13:00 – 14:00

Параллельные сессии

Партнер сессии

Дата-сайентист без преувеличения одна из самых перспективных профессий. Однако стремительное развитие технологий и все более сложные бизнес-задачи становятся причиной ее постоянной трансформации. Какие запросы к data science формирует сегодня бизнес, какая экспертиза будет востребована в будущем, как меняется образовательный трек специалиста, и какие опыт и знания становятся главным в «ДНК» успешного дата-сайентиста? Анализируем российский и международный опыт.

Подробнее

К выступлению предлагается проект по возвращению зрения полностью ослепшим людям - нейроимплант ELVIS. Это пример практического использования алгоритмов машинного зрения для решения конкретных задач, которые убедительно расширяют пользовательский опыт будущих пациентов. ELVIS - это протезная зрительная система, в которой есть внешняя часть с алгоритмами ИИ, а также внутренний чип, который устанавливается непосредственно на зрительную кору. Это позволяет транслировать изображение с камеры напрямую в мозг, минуя глаза.

Подробнее

ELVIS Нейроимплант для восстановления зрения

Андрей Демчинский,
Лаборатория «Сенсор-Тех»

Михаил Синцов,
ООО Моторика

ИИ в человекомашинных интерфейсах для протезов

Гурген Согоян,
Сколтех

Александр Попов, Лаборатория «Сенсор-Тех»

CV в beauty tech

Анастасия Георгиевская,
Haut.AI

Сергей Шумский,
Российская Ассоциация Нейроинформатики

Модератор

Константин Воронцов,
МФТИ

Александр Крайнов,
Группа компаний «Яндекс»

Алексей Натекин,
Open Data Science

Ирина Пионтковская, Huawei

Человеко-машинное взаимодействие стремительно выходит на новый уровень. Считываемые из мозга или с поверхности тела сигналы биоэлектрической природы, после обработки, могут служить сигналом для управления внешними устройствами. Подобные технологии уже сегодня реализуются в виде коммерчески успешных неинвазивных протезов руки. В исследовательских проектах алгоритмы машинного и глубинного обучения, считывая сигнал активности глубинных структур мозга, способны декодировать и синтезировать речь.
В рамках доклада спикеры опишут основной спектр задач, решаемых при помощи нейро- и мио-сигналов, и каким трансформациям необходимо подвергнуть сигнал для успешного декодирования. В ходе презентации будет рассмотрен кейс Моторики и Сколтеха по управлению протезом руки с четырьмя степенями свободы на основе оптомиографических сигналов. Также спикеры очертят возможное будущее инвазивных технологий, включающее реабилитацию посредством речевого протезирования.

Подробнее

Диффузионные модели с динамически меняющимся размером

Дмитрий Ветров,
НИУ ВШЭ, AIRI

За последние два года диффузионные модели задали новую планку качества в генеративном моделировании. Эта красивая концепция объединяет в себе нейродиффуры, моделирование на основе скор-функции, приближенные методы байесовского вывода и стохастические дифференциальные уравнения. Их основным недостатком является большое время генерации объекта. В докладе мы рассмотрим причины успеха диффузионных моделей и пути повышения их эффективности за счет уменьшения работы вхолостую на начальном этапе обратной динамики. Получившаяся модель обобщает стандартные диффузионные модели и иерархические вариационные автокодировщики в рамках более общей парадигмы.

Подробнее

Робастность глубоких нейросетей: геометрический подход

Евгений Бурнаев,
Сколтех, AIRI

При построении предиктивных моделей важно учитывать геометрическую структуру данных - то, как расположены наблюдения в многомерном пространстве. Оценив многообразие данных, мы можем выявить области на многообразии, в которых предиктивная модель не робастна, и, тем самым, становится возможным генерировать как эффективные злонамеренные атаки на модель, так и обеспечивать защиту от них. Доклад посвящён вопросам генерации атак и защиты от них с учётом многообразия данных, а также, в целом, вопросам того, как сравнивать многообразие реальных данных и данных, порождённых генеративной моделью, и за счет этого, например, выявлять искусственно сгенерированные (потенциально, фейковые) наблюдения.

Подробнее

Зал Галактики 1-3

Зал Сатурн

Большой зал

CV в
медицине

Модератор

Антон Конушин,
ВШЭ, Samsung

ДНК дата-сайентиста. Как меняется «генетический код» профессии будущего?

Денис Суржко,
начальник управления перспективных алгоритмов машинного обучения ВТБ

Партнер сессии

Научные доклады
в ML

Трансформеры в распознавании медицинских изображений

Евгений Сидоров,
Третье Мнение

Модератор

14:00 – 15:00

Обед

15:00 – 16:15

Пленарная сессия 2 - обзоры

Большой конференц-зал

15:00 – 15:45

Обучение с подкреплением —
главные результаты в 2021 г.

Валентин Малых, Huawei

В докладе будут рассмотрены самые интересные работы по обучению с подкреплением, вышедшие в 2021 году на основных конференциях по ML.

15.45 – 16:15

Построение независимой экосистемы ИИ.
Опыт Китая

Олег Сиротюк, Huawei

В 2020 году Китай вырвался в лидеры гонки стран в области ИИ. Сегодня Китай аккумулирует огромные массивы информации, китайские ученые публикуют больше всех научных статей и патентов в области ИИ, а каждый третий сервер в мире, который используется для решения задач ИИ, развернут в Китае. Кроме того, Китай достиг серьезного прогресса в области импортозамещения программного и аппаратного обеспечения. В докладе будут представлены основные достижения Китая в области ИИ, а также меры, которые предпринимает китайское правительство для поддержки развития ИИ в стране.

16:15 – 16:30

Перерыв

16:30 – 17:30

Параллельные сессии

Анна Мещерякова,
Третье мнение

Николай Ряшин, RegMT

Михаил Беляев, IRA Labs

Внедрение ИИ в реальную медицинскую практику идет с огромными усилиями. Сложность с финансированием через ОМС/ДМС, правовой статус и ответственность за результаты работы ИИ и многое другое - это камни преткновения, которые встают на пути у многих компаний. На этой сессии мы обсудим все эти важные проблемы и возможные пути решения.

Подробнее

Чтобы ответить на вопрос, насколько хорошо обработано изображение или видео, существуют объективные метрики качества. Вместе с бумом нейросетей появилось огромное количество новых ML метрик. Но как и любая нейросеть, learning-метрики подвержены атакам и взломам, нечестно повышающим оценку не самым лучшим результатам, использующим взлом. В лаборатории компьютерной графики и мультимедиа ВМК МГУ мы уже 20 лет занимаемся исследованиями метрик качества видео. В докладе будут представлены наши новые бенчмарки метрик и методы взлома, разработанные под руководством автора. Недавно мы показали, что самые популярные метрики PSNR и SSIM не могут применяться для оценки методов Super-Resolution (хотя активно используются), а методы взлома VMAF могут привести к резкому ухудшению качества видео. В докладе мы покажем, как резко усложнилась эта тема с приходом эпохи нейросетей.

Подробнее

В докладе кратко анализируется соответствие психологических понятий понятиям теории ИИ. Представлены наиболее интересные концепции мотивации как инструмента организации когнитивной деятельности.

Подробнее

Александр Панов,
МФТИ, AIRI

Петр Кудеров,
МФТИ, AIRI

Внутренняя и внешняя мотивация при моделировании поведения когнитивных агентов

Александр Теплюк,
ЧУ «Цифрум»

Нейроморфные системы компьютерного зрения

Семен Буденков,
IntelliVision

Системы контроля трафика: как сделать их интеллектуальными?

Артур Газиев,
SberMed.AI

Модератор

Роман Доронин, EORA.AI

Модератор

Антон Колонин
Aigents, НГУ

Модератор

Александр Гришканич,
АО «Швабе» Госкорпорации «Ростех»

Алексей Рыбаков,
группа компаний ЦРТ

Зал Галактики 1-3

Зал Сатурн

Большой зал

Мотивация у человека и сильного ИИ

Разработка в CV

Как обучать модели распознавания лиц на миллионах людей?

Евгений Смирнов,
группа компаний ЦРТ

Как хакнуть метрику качества видео и куда катится мир

Дмитрий Ватолин,
МГУ

ИИ в медицине
открытый разговор

Партнер сессии

Игорь Пудиков,
Врач-психиатр

Партнер сессии

@AGIRussia

Что могут почерпнуть разработчики ИИ из психологии ЕИ. Мотивация

Партнер сессии

Александр Гусев,
Webiomed.AI

Лоран Акопян,
iPavlov

Разработка и внедрение движка по детекции и классификации транспортных средств (тип, цвет, марка-модель)

Подробнее

Анастасия Анциферова, Научный сотрудник ВМК МГУ и ИСП РАН

17:30 – 17:45

Перерыв

17:45 – 18:45

Параллельные сессии

Мы создали систему, которая способна с высокой (более 60%) точностью идентифицировать видовой состав сорняков по фотографиям полученным с БВС DJI Mavic 2 Pro. Данная информация достаточна для рекомендации технологии защиты растений от сорняков.

Подробнее

Внедрение разработанной системы прослеживаемости трубы позволяет снизить долю дефектов на 10% - на 5 – 15 млн. руб. в год, в зависимости от доли рынка предприятия.

Подробнее

Ольга Перепелкина,
Intel

Federated Learning: распределенный подход к машинному обучению на приватных данных.

Федеративное обучение позволяет решать проблемы доступа к данным – благодаря этому подходу можно обучать ML модели на распределенных, чувствительных и приватных данных. Это относительно новая парадигма в машинном обучении, но она уже достаточно сильно влияет на различные индустрии, особенно на здравоохранение.

Подробнее

Юрий Годына,
Facemetric

Компьютерное зрение для промышленности

Руслан Салахутдинов,
Carnegie Mellon University

SEAL: Self-supervised Embodied Active Learning using Exploration and 3D Consistency

Сергей Алямкин, Enot.ai

Модератор

Александр Жариков, VisionLabs

Использование биометрических технологий в эквайринге

Петр Емельянов,
Bloomtech LLC

Дмитрий Берестнев, ВТБ

MPC- конфиденциальное машинное обучение

Денис Афанасьев,
SberDevices

Модератор

Эксперты из ВТБ и Bloomtech расскажут о том, что такое технология Multy-Party Computation, и как ее использование в реальных условиях позволят компаниям обмениваться данными, не обмениваясь ими.

Подробнее

CV в бизнесе

Зал Галактики 1-3

Зал Сатурн

Большой зал

Обучение с подкреплением -
что нового

Secure and Private Machine Learning

Александр Ганин,
Точка зрения

Система контроля качества труб на производстве

Евгений Багрянцев,
Ассистгро

Использование технологии компьютерного зрения для идентификации сорняков сельскохозяйственных полей

Применение компьютерного зрения на базе платформы facemetric для контроля качества продукции. Система сигнализирует о выявленных дефектах, определяет их класс и фиксирует размер. При повторяющихся повреждениях конвейер останавливается, что помогает сократить бракованную продукцию, которая не попадает в продажу, за счёт чего повышается лояльность потребителей.

Подробнее

Patrick Foley,
Intel

Using Federated Learning to improve astronaut health with the NASA Frontier Development Lab

In this talk we explore the use of OpenFL by researchers at the NASA Frontier Development Lab (FDL) to tie together heterogenous human and mouse data using an ensemble of federated causal methods.

Подробнее

День NLP и Hardware

Пятница, 18 Февраля

09:00 – 10:00

Регистрация

10:00 – 10:10

Открытие дня. ИИ в России - тренды

Игорь Пивоваров, OpenTalks.AI

10:10 – 11:25

Пленарная сессия 3 - обзоры

Большой конференц-зал

10:10 – 10:50

NLP - главное в 2021 году

Григорий Сапунов, Intento

Обзор основных результатов в обработке естественного языка в 2021 году - достижения и тренды.

10:50 – 11:25

Hardware для ИИ - главное в 2021

Дмитрий Ватолин, ВМК МГУ

Обзор основных направлений развития аппаратных ускорителей для ИИ, что нового и прогноз на будущее.

11:25 – 11:45

Перерыв

11:45 – 12:45

Параллельные сессии

Интерпретируемая обработка текстов на естественном языке

Антон Колонин,
Aigents

RuBERT-tiny: компактные предобученные модели для понимания русского языка

Давид Дале,
Сколтех

Графы знаний и онтологии, всегда содержат таксономическую основу, которая позволяет упорядочивать и структурировать различные концепты в соответствии с класс-подкласс (или гипероним-гипоним) отношениями. С быстрым ростом лексических ресурсов проблема автоматического расширения существующих таксономий новыми словами становится все более и более распространенной. В данной работе рассматривается проблема пополнения существующей таксономии новой терминологией. В работе был предложен новый метод, который основывается на векторных представлениях слов и достигает SoTA результатов на рассматриваемых наборах данных. Метод состоит из двух основых частей: формирование мета-векторных представлений слов на основе существующих векторных моделей, и алгоритма, который формирует и ранжирует список концептов-кандидатов для новых слов, решая таким образом поставленную задачу. В работе были исследованы различные комбинации векторных моделей, как класических, таких как word2vec и fasttext, так и графовых, таких как node2vec.

Подробнее

Обзор разработок и state-of-the-art приложений и алгоритмов интерпретируемой обработки текстов на естественном языке в проектах Новосибирского Государственного Университета, Link Grammar, OpenCog, SingularityNET, SingularityDAO, Autonio Foundation и Aigents®

Подробнее

Текст или голосовое сообщение оценивается по количеству переданной информации. Однако живому читателю или слушателю понятно, что эти сообщения несут определенный смысл. Смысл – это нечетко определенное понятие с неясным масштабом. Минимальным же сообщением передающим смысл принято считать слово. Слова могут быть близкими и далекими по смыслу, причем одно слово может иметь разные смыслы. Мы использовали близость слов по смыслу в качестве меры для построения вмещающего пространства для всех глаголов и прилагательных русского языка. В результате оказалось, что тезаурусы глаголов и прилагательных могут быть отображены на компактные круглые области, расположенные на двумерной поверхности. Каждая из этих областей делится на три примерно равных сектора, вмещающих слова с положительным, нейтральным и отрицательным эмоциональным содержанием. Внутри этих секторов размещаются группы слов, выстроенных в упорядоченные списки, относящиеся к определенной семантической категории. Размеры списков плавно меняются от десятков слов до нескольких слов в группе. Мы полагаем, что этот результат отражение того, как устроена словарная память в коре мозга человека.

Подробнее

Different types of annotations can be obtained in a process of labeling images. The most thorough, strong and time-consuming type of labels is multiclass segmentation masks, the least and weakest - binary and multiclass labels per instance. One more level of labels into the weak side is binary or multiclass labels per a whole bag of instances. The examples of such annotations are one label per video (bag of frames), one label per 3D computed tomography or magnetic resonance tomography image (bag of 2D slices), or one label per whole-slide image with dimensions over 16000 * 16000 pixels (bag of 2D tiles). Multiple Instance Learning is one of the approaches which allows data scientists to work with such labels. The main MIL pipeline in Deep Learning is Extract features of instances in a bag Apply aggregation technique Get final prediction for aggregated vector Get loss for that prediction Back-propagate through aggregation layer This pipeline allows to train networks end-to-end. The nature of the connection between instances in a bag - independent, 1d-connected, 2d-connected - allows to apply different aggregation techniques. This report is dedicated to the application of MIL approach to the field with a great amount of weakly labeled data - medical imaging.

Подробнее

Предобученные языковые модели, такие, как BERT, изменили облик NLP за последние несколько лет, но стандартные версии таких моделей, SOTA по качеству, часто плохо пригодны для прикладного применения из-за большого размера и медленной скорости инференса. Дистилляция больших предобученных траснформеров в маленькие может сделать их доступными для более массового применения и даже повысить их качество работы на некоторых задачах. Мы обучили и публикуем несколько подобных маленьких моделей, подготовленных для разных задач понимания русского языка.

Подробнее

Владимир Валентинович Воеводин,
МГУ

Модератор

Игнат Постный,
Tag Consulting

Модератор

Артем Артемов,
НИЦ СТРАТКОМ

Модератор

Наличие точной пиксельной разметки является важным условием для обучения алгоритмов сегментации. На практике органы на медицинских КТ и МРТ изображениях могут быть заданы шумно или слабо – то есть, не масками с точно обозначенными границами, а в виде многоугольников или ограничивающих рамок. В докладе будет описано несколько методов более эффективного обучения алгоритмов сегментации на плохо размеченных данных, разработанных в исследовательской лаборатории Philips.

Подробнее

В докладе мы обсудим, как краудсорсинг позволяет собирать разметку для нетривиальных задач на примере оценки качества поиска и обновления информации об организациях. Мы покажем, что сложность выполнения подобных заданий можно снизить благодаря специальным методам агрегации для текстовых, графических и субъективных данных. Затем мы представим открытую библиотеку Crowd-Kit, которая реализует популярные методы контроля качества в краудсорсинге и позволяет делать это легко и удобно.

Подробнее

Евгений Романов,
Фонд «Сколково»

Галина Добрякова,
ООО «Платформа Технологий»

Алексей Петровичев, ООО «Нейросканер»

Кирилл Партала,
BID Technologies

Тимофей Окроев,
Турфон

Дмитрий Степанов,
ООО «Системы компьютерного зрения»

Алексей Калиниченко, ФСИТИ

Суперкомпьютеры Яндекса и Сбера

Зал Галактики 1-3

Зал Сатурн

Большой зал

Суперкомпьютеры для машинного обучения. Строить самим или купить готовое решение. Опыт Яндекс

Дмитрий Монахов,
Яндекс

Разработка в NLP

Плотное упорядоченное отображение тезаурусов глаголов и прилагательных на центрально-симметричные круглые области на плоскости

Виктор Введенский,
Курчатовский институт

Мета-эмбеддинги в задаче пополнения таксономии

Михаил Тихомиров,
МГУ

Наталья Лукашевич,
МГУ

Обучение на слабой/шумной разметке

Алексей Чернявский,
Philips AI Research Russia

Сегментация в медицине: как извлечь пользу из «ленивой» разметки

Анастасия Мирошникова,
Цельс

Multiple instance learning: как обучать нейросети на медицинских данных без дополнительной разметки

Дмитрий Усталов,
Яндекс.Толока

Нетривиальная разметка в краудсорсинге и как с ней быть

Партнер сессии

Андрей Петров,
SberCloud

Алексей Климов,
SberCloud

Татьяна Шаврина,
SberDevices, AIRI

Суперкомпьютеры Christofari в публичной платформе ML Space. Опыт SberCloud.

Зал Вечерний космос

Демо-день акселератора Сколково

Партнер сессии

Павел Кривозубов,
ИТ-Кластер Фонда «Сколково»

Модератор

В секции будут питчи стартапов, вышедшие в финал акселерационной программы Tech Explorer Skolkovo

Жюри

Максим Саенко,
МТС

Максим Яцкевич, Road.Travel

Бхаскар Багчи, Angelsdeck

Денис Свичкарь,
ПАО «Сбербанк»

11:45 – 12:45

Параллельные сессии

Максим Саенко,
МТС

Максим Яцкевич, Road.Travel

Бхаскар Багчи, Angelsdeck

Денис Свичкарь,
ПАО Сбербанк»

Евгений Романов,
Фонд «Сколково»

Галина Добрякова,
ООО «Платформа Технологий»

Алексей Петровичев,
ООО «Нейросканер»

Кирилл Партала,
BID Technologies

Тимофей Окроев,
Турфон

Дмитрий Степанов,
ООО «Системы компьютерного зрения»

Алексей Калиниченко, ФСИТИ

Партнер сессии

Зал Вечерний космос

Демо-день акселератора Сколково

Павел Кривозубов,
ИТ-Кластер Фонда «Сколково»

Модератор

В секции будут питчи стартапов, вышедшие в финал акселерационной программы Tech Explorer Skolkovo

Жюри

12:45 – 13:00

Перерыв

13:00 – 14:00

Параллельные сессии

В докладе рассмотрены методы и способы реализации человечных скиллов для чатботов: умный ранжировщик ответов генеративной модели, модель "подсказок", помогающая передать конкретную "личность" боту. Рассматриваются кейсы применения разработок и их практическая польза.

Подробнее

Development environments for spoken dialogue systems are popular today because they enable rapid creation of the dialogue systems in times when usage of the voice AI Assistants is constantly growing. We introduce a Discourse-Driven Integrated Dialogue Development Environment (DD-IDDE) for spoken open-domain dialogue systems. The DD-IDDE allows dialogue architects to interactively define dialogue flows of their skills/chatbots with the aid of the discourse moves recommendation system, enhance these flows in the Python-based DSL, deploy, and then further improve based on the skills/chatbots usage statistics. We show how these skills/chatbots can be specified through a graphical user interface within the VS Code Extension, and then run on top of the Dialog Flow Framework (DFF). An earlier version of this framework has been adopted in one of the Alexa Prize 4 socialbots while the updated version was specifically used to power the described DD-IDDE solution.

Подробнее

Данила Корнев,
DeepPavlov.ai

DD-IDDE: God Mode for Designing Scenario-Driven Skills for Chatbots & AI Assistants

Дмитрий Сивков,
Intel

Кластера ML на платформах Intel

Сергей Лукашкин,
ВТБ

Модератор

My talk presents BigDL, an open source tool from Intel that provides end-to-end Big Data AI pipeline for scaling distributed AI. It allows data scientists and ML engineers to simply build conventional Python notebooks on their laptops, which can then automatically scale out to large clusters and process large amount of data in a distributed fashion.

The tool is open sourced at https://github.com/intel-analytics/BigDL, and have been used in production at many large companies such as Mastercard, Burger King, Inspur, JD.com, etc. It will be useful for data scientists, data engineers and ML engineers who want to apply AI to large-scale, distributed dataset in production.

Подробнее

Лев Щур,
ИТФ им. Л.Д. Ландау РАН, НИУ ВШЭ

Модератор

Сергей Виноградов

Модератор

How machine learning and AI can support the fight against COVID-19

Дмитрий Сошников,
Microsoft

Партнер сессии

Сергей Васильев, венчурный партнёр Yellow Rockets

Денис Ефремов, принципал Fort Ross Ventures

Кирилл Тишин,
старший инвестиционный директор Kama Flow

Ислам Мидов, руководитель корпоративного венчурного фонда МТС

Александр Земляк,
Leta Capital

Аркадий Сандлер,
DOCET TI

Dr. Zhou Bin,
CTO, Ascend ComputingBusiness, Huawei

Суперкомпьютеры для ML/DL

Зал Галактики 1-3

Зал Сатурн

Большой зал

Разработка в NLP

Виктор Носко,
Аватар Машина

Контролируем генерацию нейросетей Transformer: передача личности с технологией fast experts tuning, управление логикой и conditional generation"

Инна Лизунова,
группа компаний ЦРТ

Трансформер в роли редактора: повышаем читаемость распознанной речи

Татьяна Шаврина,
AIRI, Sber devices

Фундаментальные научные задачи NLP и что мы с ними делаем в AIRI. Тренды 2021-2022: многоязычность, перенос навыков и знаний

Питч-сессия стартапов

Зал Вечерний космос

Наталья Подсосонная, Сколтех

Модератор

Облачные платформы для ML-разработки

Платформа SberCloud ML Space для распределенного обучения: функциональные и инфраструктурные особенности

Вера Шибаева,
SberCloud

Владимир Новоженов, SberCloud

Партнер сессии

В секции будут питчи 10 стартапов, отобранных инвестиционным жюри конференции OpenTalks.AI

13:00 – 14:00

Параллельные сессии

Наталья Подсосонная, Сколтех

Модератор

Партнер сессии

Питч-сессия стартапов

Зал Вечерний космос

Александр Земляк,
Leta Capital

Ислам Мидов,
руководитель корпоративного венчурного фонда МТС

Аркадий Сандлер,
DOCET TI

В секции будут питчи 10 стартапов, отобранных инвестиционным жюри конференции OpenTalks.AI

Сергей Васильев, венчурный партнёр Yellow Rockets

Денис Ефремов, принципал Fort Ross Ventures

Кирилл Тишин,
старший инвестиционный директор Kama Flow

14:00 – 15:00

Обед

15:00 – 16:15

Пленарная сессия 4 - обзоры

Большой конференц-зал

Сергей Кузнецов, НИУ ВШЭ
Модератор

15:00 – 15:45

AGI - обзор текущего состояния

Игорь Пивоваров, МФТИ

В докладе будет сделан обзор текущих подходов к построению AGI от разных групп в мире и оценены их текущие продвижения.

15:45 – 16:15

Этика в искусственном интеллекте

Александр Крайнов, Группа компаний «Яндекс»

Регулирование разработки и применения ИИ. Чего ждать, к чему готовиться.

16:15 – 16:30

Перерыв

16:30 – 17:45

Параллельные сессии

Доклад посвящен программно-аппаратным комплексам с искусственным интеллектом на базе отечественной ЭКБ

Подробнее

Спрос на техническую поддержку разного рода аналитики, в том числе стратегической аналитики, растет в последние годы на фоне повышения требований к качеству и своевременности принятия управленческих решений. Переход к парадигме принятия решений, основанных на данных, обусловленный ростом как сложности происходящих процессов, так и глубины отражения этих процессов в данных, а также осознанием возможностей применения методов и инструментов анализа больших текстово-документных данных , выступает дополнительным фактором усиления этого спроса. Техническая поддержка аналитики включает как автоматизацию рутинных операций предварительной обработки данных, так и автоматизацию непосредственно умственного труда экспертов-аналитиков, а также усиление (аугментацию) аналитического процесса за счет предоставления на основе интеллектуального анализа больших текстово-документных данных таких видов аналитических разрезов информации, которые невозможно получить традиционными методами.

Подробнее

Модератор

Аркадий Сандлер,
DOCET TI

Модератор

Юрий Визильтер,
ГОСНИИАС

Александр Крайнов,
Группа компаний «Яндекс»

Опыт создания аппаратного ускорителя для низколатентного инференса искусственных нейросетей

Игорь Увкин,
IVA Technologies (ГК «ХайТэк»)

Елена Сурагина,
ПАО «МТС»

Николай Князев,
Softline digital

Павел Дрейгер,
Sitronics Group

Никита Кардашин,
NAUMEN

Александр Крупин,
ООО «Норникель - Общий центр обслуживания»

Программно-аппаратная экосистема АО НПЦ «ЭЛВИС» для приложений Искусственного Интеллекта

Денис Кузнецов, АО НПЦ «ЭЛВИС»

В рамках доклада кратко будет рассказано об экосистеме решений АО НПЦ «ЭЛВИС» для ИИ, сделан обзор аппаратных платформ RoboDeus и Скиф, архитектуры тензорного процессора Elcore50.
Также будут озвучены состояние и перспективы стека программного обеспечения для inference и обучения, результаты тестирования производительности на mlperf и ряде стандартных нейросетей.
Кроме того, будут отмечены проблемы по выводу платформы на рынок и кратко представлена продуктовая линейка планируемых конечных продуктов на основе платформы.

Подробнее

Партнер сессии

Российское железо для ИИ

Модератор

Зал Галактики 1-3

Зал Сатурн

Большой зал

Программно-аппаратные комплексы с искусственным интеллектом на базе отечественной ЭКБ

Халиль Эль-Хажж,
НТЦ Модуль

Платформа-ГНС: платформа и фреймворк для обучения глубоких нейронных сетей. Тестирование отечественных аппаратных платформ

Борис Вишняков,
ГОСНИИАС

NLP в бизнесе

Аугментация и автоматизация стратегической аналитики, усиленной интеллектуальным анализом больших текстово-документных данных и искусственным интеллектом

Илья Кузьминов,
iFORA

Андрей Незнамов,
ПАО «Сбербанк»

NLP в HR аналитике: как повысить эффективность бизнеса, прислушиваясь к мнению сотрудников

Павел Егоров,
GlowByte

Выявление редких генетических заболеваний на ранних стадиях

Лоран Акопян,
iPavlov

Искусственный интеллект и прогнозная аналитика для эффективного применения электронных медицинских карт

Александр Гусев,
Webiomed.AI

Ирина Жилина,
Леруа Мерлен

Порядка 80% данных электронных медицинских карт хранится в текстовом неструктурированном виде, не пригодном для машинной обработки. По сути, это просто цифровой архив, наличие которого на самом деле мало что дает с точки зрения ценности для пациента и врача. Тем не менее, эта информация, представляющая по сути сырые данные реальной клинической практики, при помощи использования технологий искусственного интеллекта, таких как извлечение признаков из текстовых медицинских протоколов с помощью NLP и прогнозирование событий в здоровье пациента с помощью машинного обучения, открывают большие перспективы для повышения эффективности работы медицинской организации. В докладе будет представлен опыт проекта Webiomed в части автоматического анализа ЭМК и предоставления сервисов поддержки принятия решений, включая клиническую и управленческую аналитику.

Подробнее

Обученные CV и NLP модели анализируют исследования и заключения врачей в деперсонализированных электронных медицинских картах (ДЭМК), а также родословную пациента для прогнозирования риска возникновения орфанных (генетических) заболеваний у детей (до 7 лет) или для диагностики данных заболеваний у новорожденных. Выявление орфанных заболеваний с помощью ИИ призвано сократить среднее время, необходимое для постановки диагноза, с 7 до 2 лет и снизить детскую смертность на 50%. На текущий момент анализируются следующие заболевания: — Мукополисахаридоз — Болезнь Фабри — Болезнь Помпе — Болезнь Ниманна-Пика тип A/B (ASMD) Проспективный анализ риска возникновения орфанных заболеваний по родословной призван предупредить их распространение и уменьшить количество летальных исходов во врачебной практике.

Подробнее

Авторы национального Кодекса этики в сфере искусственного интеллекта, созданного на площадке Альянса в сфере ИИ, а также компании, присоединившиеся к кодексу, обсудят, как его соблюдение влияет на привычные бизнес-процессы и сказывается на разработке ИИ-решений. В конце секции - Q&A с экспертами сессии.

Этика в ИИ

17:45 – 18:00

Перерыв

18:00 – 18:45

Место России в мире в искусственном интеллекте

Большой конференц-зал

Игорь Пивоваров, OpenTalks.AI
модератор

Сергей Карелов, IT-эксперт

Дмитрий Конягин, NVIDIA

Олег Сиротюк, Huawei

Александр Крайнов, Группа компаний «Яндекс»

Константин Воронцов, МФТИ

19:00 – 22:00

Вечеринка

У Вас будет замечательная возможность неформально пообщаться со спикерами и участниками конференции и послушать выступления музыкальных групп компаний ИИ индустрии!

Андрей Кочетов, Huawei

Ратмир Мамцев,
Huawei

10:00 - 12:00

Создаём приложение для детектирования медицинских масок с помощью OpenVINO

Тугарёв Артём, Intel
AI Frameworks Engineer

Демидовский Александр, Intel
AI Frameworks Engineer

12:15 - 14:15

OpenFL: Open Federated Learning Library

Алексей Груздев, Intel
AI Software Engineering Manager

Игорь Давидюк, Intel
AI Frameworks Engineer

14:30 - 15:15

Разработка моделей машинного обучения на фреймворке MindSpore

15:30 - 17:30

Создаём приложение для автоматического обнаружения токсичных комментариев с помощью трансформеров и OpenVINO

Панюков Артур, Intel
AI Frameworks Engineer

Демидовский Александр, Intel
AI Frameworks Engineer

Для построения качественных моделей машинного обучения часто нужно много данных. В мире огромное количество данных, которое растет каждый день. Однако на них могут распространяться законы о персональных данных. Также данные могут занимать много места и их фактически невозможно собрать в централизованное хранилище для последующего обучения. Решить эти проблемы помогает один из подходов коллаборативного обучения, который получил название Federated Learning. Он позволяет обучать модели на распределенных данных, не пересылая сами данные и не нарушая их приватности. Вместо того чтобы отправлять данные к моделям, в федеративном обучении мы отправляем модели к данным. В рамках данного туториала мы познакомимся с Python open-source библиотекой для федеративного обучения – OpenFL (https://github.com/intel/openfl). Посмотрим новый функционал библиотеки, построим свою федеративную сеть для обучения на распределенных данных и разберем несколько примеров ее применения.

Подробнее

Сейчас, когда в машинном обучении идет битва за стоимость и эффективность вычислений, как в обучении так и в инференсе, бизнес все больше обращается к аппаратному стеку Huawei, где есть и мощные ускорители и программные инструменты реализации нейронных сетей. Однако, пока очень мало разработчиков знакомы с этим железом и софтом. А те, кто умеет работать с ним, получают новые перспективы развития и роста.

На этом семинаре мы разберем фреймворк Mindspore – это новое поколение фреймворков для разработки и обучения нейронных сетей, который стал стандартом де-факто в Китае. Мы расскажем про особенности фреймворка, его уникальные возможности и работу на чипах Huawei Ascend. Также мы вместе создадим нейронную сеть на основе архитектуры LeNET в этом фреймворке и обучим ее распознавать рукописные символы. Работа будет выполняться непосредственно на чипах Ascend, развернутых в облаке.

Подробнее

Трек 1

10:00 - 17:00

Building Intelligent Recommender Systems

Закрытая трансляция, регистрация закрыта

Александр Дюмин,
Сертифицированный инструктор NVIDIA DLI, доцент МИФИ

Изучите основные инструменты и методы создания высокоэффективных рекомендательных систем, а также способы развертывания решений на GPU ускорителях для рекомендаций в реальном времени.

Требования: Знание Python на среднем уровне, включая List comprehension. Опыт работы с данными с использованием Python, знакомство с NumPy и матричной математикой

Внимание! Воркшоп идет 8 часов с перерывами!

Трек 2

Зарегистрироваться на tutorials

ПрограммаOpenTalks.AI 2022

День CV и RL

День NLP и Hardware

Программа
OpenTalks.AI 2022