Открытая конференция по ии

OpenTalks.AI /
6-7 Марта 2024,
Тбилиси


Данные видеозаписи предназначаются исключительно для участников конференции OpenTalks.AI.
Распространение видеозаписей будет нарушением соглашения на участие в конференции, на которое соглашался участник при регистрации.
День Tutorials
Трек 1
Павел Факанов, BERT Reranking model
Replika - это крупнейший в мире англоговорящий чатбот. Обсудим, как устроена одна из наших ключевых компонент, которая позволяет выбирать нам наиболее релевантный ответ из разных диалоговых моделей, в том числе GPT-3, значительно повышая качество диалога. Пройдемся по всему пути развития данной компоненты, поговорим об удачных и неудачных экспериментах.
Михаил Гущин, Обнаружение аномалий и точек разладки генеративными моделями.
Туториал по работе с GAN - генеративными нейронными сетями. Обнаружение изменений в режиме работы наблюдаемого объекта - хорошо известная задача, встречающаяся в различных контекстах: контроль качества производственных процессов, обнаружение сбоев в сложных системах, предиктивное обслуживание, мониторинг состояния пациентов в медицине, построение языковых помощников и анализе видео. Для решения этой задачи используются методы обнаружения точек разладки. Точка разладки - это момент времени, в котором меняется поведение временного ряда, который характеризует наблюдаемый объект. Возникновение разладки означает, что состояние объекта изменилось, и ее своевременное обнаружение может помочь предотвратить нежелательные последствия. В этом докладе мы представляем два подхода к обнаружению точек разладки в режиме онлайн на основе нейронных сетей. Эти алгоритмы демонстрируют линейную вычислительную сложность применения и подходят для обнаружения точек разладки в продолжительных многомерный временных рядах. В докладе приводится наглядное описание этих алгоритмов и их сравнение с наиболее известными методами на различных наборах синтетических и реальных данных. В частности, рассмотрим задачу детектирования смены физической активности человека по данным сенсоров смартчасов; протестируем алгоритмы на данных астрономических телескопов и детекторов частиц в физике высоких энергий.
Вадим Стрижов, Поиск архитектур нейросетей.
Four variables make a machine learning model selected: the model parameters and their distribution, the model structure and its distribution. Changes in data implies changes in the model structure. For a complex data set one has to deal with an ensemble of selected models. An ensemble is supposed to collect different models, which fit the data holistically. This talk will discuss principles of model selection for a single model and for an ensemble.
Кирилл Аксенов, Интеграция RL и планирования.
Планирование действий по известной модели - один из важных классических подходов в искусственном интеллекте. При интеграции с методами обучения с подкреплением оказывается возможным использовать обновляемую модель и добиваться действительно значимых результатов. Начиная с простых алгоритмов, мы в этом туториале разберемся, как работает AlphaZero, после чего посмотрим на современные SOTA алгоритмы последних двух лет.
Трек 2
Дмитрий Миронов, AI Workflows for Intelligent Video Analytics with DeepStream.
  • Deploy DeepStream pipeline for parallel, multi-stream video processing and deliver applications with maximum throughput at scale.
  • Configure the processing pipeline and create intuitive, graph-based applications.
  • Leverage multiple deep network models to process video streams and achieve more intelligent insights.
Дмитрий Сошников, Краткое практическое введение в Azure Machine Learning.
Этот мастер-класс будет посвящен обзору основного облачного инструмента Microsoft для машинного обучения – Azure Machine Learning от простой возможности запуска Jupyter Notebooks до планирования распределенных обучающих экспериментов и оптимизации гиперпараметров на вычислительном кластере. В качестве примера будет рассмотрена генерация картин генеративно-состязательными сетями и построение модели для ответов на вопросы по датасету научных статей о COVID-19.
Алесь Кучумов, Запуск контейнера с демо Face recognition, используя систему Huawei FusionDirector.
Деплой и запуск docker контейнера на edge устройстве Atlas500, используя систему Huawei FusionDirector. Настройка и запуск контейнера с facerecognition demo

Алексей Груздев, Ольга Перепелкина, OpenFL: Federated Learning for everyone.
Для построения качественных моделей машинного обучения часто нужны большие объемы данных. В мире огромное количество данных, которое растет каждый день. Однако эти данные обычно кому-то принадлежат и на них могут распространяться законы о персональных данных. Например, медицинские записи, финансовые операции, фотографии людей – это все примеры данных, на которые могут накладываться различные ограничения. Также иногда данные занимают огромное количество места и их фактически невозможно собрать в централизованное хранилище для последующего обучения. Однако для развития AI индустрии мы хотим использовать имеющиеся в мире данные по максимуму. Решить эти проблемы помогает подход, который получил название Federated Learning. Это подход к машинному обучению, который позволяет обучать модели на распределенных данных, не пересылая сами данные и не нарушая их приватности. Вместо того чтобы отправлять данные к моделям, в федеративном обучении мы отправляем модели к данным. Это позволяет организациям сотрудничать в проектах машинного обучения без обмена конфиденциальными данными, например, в медицинской и финансовой отраслях, а также решить проблему перемещения по сети больших данных. В рамках туториала мы познакомимся с Python open-source библиотекой для федеративного обучения – OpenFL (https://github.com/intel/openfl). Построим свою федеративную сеть для обучения на распределенных данных и разберем несколько примеров.