Для построения качественных моделей машинного обучения часто нужны большие объемы данных. В мире огромное количество данных, которое растет каждый день. Однако эти данные обычно кому-то принадлежат и на них могут распространяться законы о персональных данных. Например, медицинские записи, финансовые операции, фотографии людей – это все примеры данных, на которые могут накладываться различные ограничения. Также иногда данные занимают огромное количество места и их фактически невозможно собрать в централизованное хранилище для последующего обучения. Однако для развития AI индустрии мы хотим использовать имеющиеся в мире данные по максимуму. Решить эти проблемы помогает подход, который получил название Federated Learning. Это подход к машинному обучению, который позволяет обучать модели на распределенных данных, не пересылая сами данные и не нарушая их приватности. Вместо того чтобы отправлять данные к моделям, в федеративном обучении мы отправляем модели к данным. Это позволяет организациям сотрудничать в проектах машинного обучения без обмена конфиденциальными данными, например, в медицинской и финансовой отраслях, а также решить проблему перемещения по сети больших данных. В рамках туториала мы познакомимся с Python open-source библиотекой для федеративного обучения – OpenFL (
https://github.com/intel/openfl). Построим свою федеративную сеть для обучения на распределенных данных и разберем несколько примеров.