Формат обучения

Обучение длится полтора года. Вы можете выбрать один из двух форматов обучения: очное или дистанционное. Программа построена так, что вы будете закреплять материал на индивидуальных и командных проектах.

Вам потребуется личный ноутбук.

Будьте готовы к высокой нагрузке: 15–20 часов в неделю
Очное обучение

Где: НИТУ «МИСиС» в Москве (м. Октябрьская).
Когда: 3 раза в неделю. Будние дни с 19:00 до 22:00 и суббота с 11:00 до 20:00.

Дистанционное обучение

Где: онлайн на учебной платформе MADE.
Когда: видеозаписи будут появляться по мере завершения монтажа. Просмотр лекций и выполнение домашних заданий займут 15-20 часов в неделю.

Программа

Длительность курса составляет три семестра на протяжении полутора лет.
В программе предусмотрены обязательные курсы и курсы по выбору.

Занятия начнутся 7 сентября 2020 года.

Образовательная программа профессиональной переподготовки реализуется в сетевой форме в партнерстве ООО «Мэйл. Ру» и НИТУ «МИСиС» (образовательная лицензия № 1947 от 19 февраля 2016 года).
Data Scientist
Семестр 1
Обязательные курсы
Алгоритмы и структуры данных
Цель курса

Глубже познакомить слушателей с необходимыми для разработчика алгоритмами и структурами данных. Правильное применение материала этого курса позволит слушателям реализовывать в коде более удачные по времени работы и потребляемой памяти решения, а в некоторых случаях — справляться с теми задачами, с которыми без знания алгоритмов не совладать вовсе.

Длительность

30 занятий, 45 часов

Машинное обучение
Цель курса

Дать слушателям целостное и подробное представление о задачах машинного обучения, существующих классических алгоритмах обучения с учителем, их модификациях и библиотеках, в которых эти алгоритмы реализованы. Научить строить модели для задач, возникающих в бизнесе IT-компании, и правильно организовывать контроль качества работы этих моделей.

Длительность

20 занятий, 30 часов

Курс на выбор
Python (продвинутый уровень)
Цель курса

Научить слушателей:

  • реализовывать на Python сервисы, удовлетворяющие требованиям качества промышленной разработки
  • выполнять воспроизводимые исследования с помощью Python
Длительность

20 занятий, 30 часов

C++ (продвинутый уровень)
Цель курса

Научить слушателей свободно применять идиомы языка, писать эффективный код на C++ для решения практических задач, заботиться при написании программ о дальнейшей поддержке своего кода.

Длительность

20 занятий, 30 часов

Java (продвинутый уровень)
Цель курса

Научить слушателей основным языковым конструкциям Java, работе со стандартными коллекциями и с многопоточностью. Познакомить с работой JVM, включая алгоритмы GC, оптимизации JIT. Развить умение писать поддерживаемый код и тесты для промышленного использования, применяя принципы и паттерны проектирования.

Длительность

20 занятий, 30 часов

Статистический анализ данных
Цель курса

Напомнить слушателям ключевые понятия и методы статистической обработки данных, научить уверенно использовать аппарат проверки статистических гипотез для прикладных задач, познакомить с полезными для статистического анализа данных пакетами языка R.

Длительность

20 занятий, 30 часов

Семестр 2
Методы оптимизации в машинном обучении
Цель курса

Рассказать теоретические основы методов оптимизации для детерминированных и стохастических алгоритмов. Познакомить слушателей с методами регуляризации и ускорения оптимизационных алгоритмов, а также апроксимации и поиска наилучшей стратегии на основе генетических или EM-алгоритмов. Курс уделяет особое внимание теоретическим гарантиям сходимости методов для различных задач, вопросам оптимальности методов и их практической эффективности.

Длительность

10 занятий, 30 часов

Компьютерное зрение
Цель курса

Курс покрывает основные задачи компьютерного зрения с использованием современных архитектур нейронных сетей. Рассматриваются задачи детектирования и сегментации объектов, классификации изображений, а также методы построения и обучения архитектур сверточных, рекуррентных и состязательных глубоких нейронных сетей. Курс сопровождается демонстрацией современных моделей и методов решения классических задач в компьютерном зрении и машинном обучении.

Длительность

10 занятий, 30 часов

Введение в технологии работы с большими данными
Цель курса

Познакомить слушателей с основными технологиями и методами работы с большими данными. В курсе будут затронуты: использование экосистемы Hadoop, оптимизация вычислений с использованием MapReduce, работа с SQL-запросами к базам данных используя Hive, средства Apache Spark для работы с базами данных и потоковой обработкой данных, взаимодействие хранилищ NoSQL баз данных (Cassandra и Hbase) со Spark и Hadoop.

Длительность

10 занятий, 30 часов

Дизайн и планирование экспериментов
Цель курса

Рассказать о скрытом от глаз процессе интеграции результатов экспериментов в действующие бизнес-процессы. Планируя постановку и внедрение решения для конкретной задачи, важно задумываться над тестированием и валидацией модели — как с точки зрения верификации корректности работы, так и для повышения бизнес-показателей после внедрения. Рассматриваются вопросы принятия решения на основе статистических гипотез и экспертных оценок, примеры внедрения и использования A/B-тестов, проводится глубокий анализ цикла поддержки решения, от сбора данных, обработки и обучения модели, до обновления и поддержки цикла продукта, верификации бизнес-гипотез. Курс будет полезен опытным аналитикам и разработчикам, которые хотят получить практический опыт ведения проекта от дизайна эксперимента до его валидации и внедрения.

Длительность

5 занятий, 15 часов

Обработка естественного языка и распознавание речи
Цель курса

Научить обработке текстов на естественном языке. Познакомить слушателей с современными методами обработки текстов, решения задач машинного обучения на текстах. Курс рассмотрит такие задачи как векторизация текста и контекстные эмбеддинги слов, выделение зависимостей, определение частей речи, тэгирование и тематическое моделирование, а также познакомит слушателей с современными методами глубокого обучения в задачах seq2seq и рекуррентных моделях, машинном переводе при помощи статистического подхода, нейронных сетей и метрик качества результата BLEU/Perplexity. Курс закончится введением в применение архитектур с использованием Attention и трансформеров (BERT, XLNET, GPT, GPT-2) для задач построения модели языка, контекстных эмбеддингов и многих других.

Длительность

10 занятий, 30 часов

Семестр 3
  • Нейробайесовские методы машинного обучения
  • Современные методы глубокого обучения
  • Диалоговые ассистенты и голосовые помощники
  • Распределенные системы
  • Машинное обучение на больших данных
  • Высокопроизводительные вычисления
  • Анализ социальных сетей и машинное обучение на графах
Machine Learning Engineer
Семестр 1
Обязательные курсы
Алгоритмы и структуры данных
Цель курса

Глубже познакомить слушателей с необходимыми для разработчика алгоритмами и структурами данных. Правильное применение материала этого курса позволит слушателям реализовывать в коде более удачные по времени работы и потребляемой памяти решения, а в некоторых случаях — справляться с теми задачами, с которыми без знания алгоритмов не совладать вовсе.

Длительность

30 занятий, 45 часов

Машинное обучение
Цель курса

Дать слушателям целостное и подробное представление о задачах машинного обучения, существующих классических алгоритмах обучения с учителем, их модификациях и библиотеках, в которых эти алгоритмы реализованы. Научить строить модели для задач, возникающих в бизнесе IT-компании, и правильно организовывать контроль качества работы этих моделей.

Длительность

20 занятий, 30 часов

Курс на выбор
Python (продвинутый уровень)
Цель курса

Научить слушателей:

  • реализовывать на Python сервисы, удовлетворяющие требованиям качества промышленной разработки
  • выполнять воспроизводимые исследования с помощью Python
Длительность

20 занятий, 30 часов

C++ (продвинутый уровень)
Цель курса

Научить слушателей свободно применять идиомы языка, писать эффективный код на C++ для решения практических задач, заботиться при написании программ о дальнейшей поддержке своего кода.

Длительность

20 занятий, 30 часов

Java (продвинутый уровень)
Цель курса

Научить слушателей основным языковым конструкциям Java, работе со стандартными коллекциями и с многопоточностью. Познакомить с работой JVM, включая алгоритмы GC, оптимизации JIT. Развить умение писать поддерживаемый код и тесты для промышленного использования, применяя принципы и паттерны проектирования.

Длительность

20 занятий, 30 часов

Статистический анализ данных
Цель курса

Напомнить слушателям ключевые понятия и методы статистической обработки данных, научить уверенно использовать аппарат проверки статистических гипотез для прикладных задач, познакомить с полезными для статистического анализа данных пакетами языка R.

Длительность

20 занятий, 30 часов

Семестры 2-3
Алгоритмы и структуры данных (продвинутый уровень)
Цель курса

Курс продолжает обязательные занятия по Алгоритмам и структурам данных, расширяя кругозор слушателей в области динамического программирования и эффективной его реализации, применения теории чисел в задачах криптографии, эффективного хранения пространственных данных на примере деревьев отрезков. Курс объясняет приближенные методы решения NP-полных задач, рассматривает классические алгоритмы обсчета потока в сетях и алгоритмы на строках. Изложение курса заканчивается примерами алгоритмов во внешней памяти и описанием эффективных структур данных для реализации алгоритмов с ограниченными ресурсами.

Длительность

10 занятий, 30 часов

Компьютерное зрение
Цель курса

Курс покрывает основные задачи компьютерного зрения с использованием современных архитектур нейронных сетей. Рассматриваются задачи детектирования и сегментации объектов, классификации изображений, а также методы построения и обучения архитектур сверточных, рекуррентных и состязательных глубоких нейронных сетей. Курс сопровождается демонстрацией современных моделей и методов решения классических задач в компьютерном зрении и машинном обучении.

Длительность

10 занятий, 30 часов

Обработка естественного языка и распознавание речи
Цель курса

Научить обработке текстов на естественном языке. Познакомить слушателей с современными методами обработки текстов, решения задач машинного обучения на текстах. Курс рассмотрит такие задачи как векторизация текста и контекстные эмбеддинги слов, выделение зависимостей, определение частей речи, тэгирование и тематическое моделирование, а также познакомит слушателей с современными методами глубокого обучения в задачах seq2seq и рекуррентных моделях, машинном переводе при помощи статистического подхода, нейронных сетей и метрик качества результата BLEU/Perplexity. Курс закончится введением в применение архитектур с использованием Attention и трансформеров (BERT, XLNET, GPT, GPT-2) для задач построения модели языка, контекстных эмбеддингов и многих других.

Длительность

10 занятий, 30 часов

  • Нейробайесовские методы машинного обучения
  • Современные методы глубокого обучения
  • Диалоговые ассистенты и голосовые помощники
  • Распределенные системы
  • Машинное обучение на больших данных
  • Высокопроизводительные вычисления
  • Анализ социальных сетей и машинное обучение на графах
Data Engineer
Семестр 1
Обязательные курсы
Алгоритмы и структуры данных
Цель курса

Глубже познакомить слушателей с необходимыми для разработчика алгоритмами и структурами данных. Правильное применение материала этого курса позволит слушателям реализовывать в коде более удачные по времени работы и потребляемой памяти решения, а в некоторых случаях — справляться с теми задачами, с которыми без знания алгоритмов не совладать вовсе.

Длительность

30 занятий, 45 часов

Машинное обучение
Цель курса

Дать слушателям целостное и подробное представление о задачах машинного обучения, существующих классических алгоритмах обучения с учителем, их модификациях и библиотеках, в которых эти алгоритмы реализованы. Научить строить модели для задач, возникающих в бизнесе IT-компании, и правильно организовывать контроль качества работы этих моделей.

Длительность

20 занятий, 30 часов

Курс на выбор
Python (продвинутый уровень)
Цель курса

Научить слушателей:

  • реализовывать на Python сервисы, удовлетворяющие требованиям качества промышленной разработки
  • выполнять воспроизводимые исследования с помощью Python
Длительность

20 занятий, 30 часов

C++ (продвинутый уровень)
Цель курса

Научить слушателей свободно применять идиомы языка, писать эффективный код на C++ для решения практических задач, заботиться при написании программ о дальнейшей поддержке своего кода.

Длительность

20 занятий, 30 часов

Java (продвинутый уровень)
Цель курса

Научить слушателей основным языковым конструкциям Java, работе со стандартными коллекциями и с многопоточностью. Познакомить с работой JVM, включая алгоритмы GC, оптимизации JIT. Развить умение писать поддерживаемый код и тесты для промышленного использования, применяя принципы и паттерны проектирования.

Длительность

20 занятий, 30 часов

Статистический анализ данных
Цель курса

Напомнить слушателям ключевые понятия и методы статистической обработки данных, научить уверенно использовать аппарат проверки статистических гипотез для прикладных задач, познакомить с полезными для статистического анализа данных пакетами языка R.

Длительность

20 занятий, 30 часов

Семестры 2-3
Алгоритмы и структуры данных (продвинутый уровень)
Цель курса

Курс продолжает обязательные занятия по Алгоритмам и структурам данных, расширяя кругозор слушателей в области динамического программирования и эффективной его реализации, применения теории чисел в задачах криптографии, эффективного хранения пространственных данных на примере деревьев отрезков. Курс объясняет приближенные методы решения NP-полных задач, рассматривает классические алгоритмы обсчета потока в сетях и алгоритмы на строках. Изложение курса заканчивается примерами алгоритмов во внешней памяти и описанием эффективных структур данных для реализации алгоритмов с ограниченными ресурсами.

Длительность

10 занятий, 30 часов

  • Нейробайесовские методы машинного обучения
  • Современные методы глубокого обучения
  • Диалоговые ассистенты и голосовые помощники
  • Распределенные системы
  • Машинное обучение на больших данных
  • Высокопроизводительные вычисления
  • Анализ социальных сетей и машинное обучение на графах
Подать заявку
Приём заявок — до 1 августа включительно.
Вступительные испытания — со 2 по 23 августа.