Профессия Data Scientist
Изучив курс «Профессия Data Scientist», Вы станете специалистом по анализу данных, алгоритмам машинного обучения и нейросетям, сможете построить карьеру в крупной технологической компании — в России или за рубежом.
1,5 года стажа в Data Science в ваше резюме. 2 специальности в одной программе. Обучение на реальных данных. Трудоустройство после обучения.
Вы научитесь:
— Программировать на Python.
— Визуализировать данные.
— Работать с библиотеками и базами данных.
— Программировать на R.
— Применять нейронные сети для решения реальных задач.
— Создавать рекомендательные системы.
Программа курса «Профессия Data Scientist» состоит из 94 тематических модулей и 2 бонусных курса:
Введение в анализ данных и машинное обучение
1. Аналитика. Начальный уровень
— Введение в Data Science.
— Введение в Python.
— Основы Python: установка PyCharm.
— Основы Python: базовые структуры данных.
— Основы Python: циклы и условия.
— Основы Python: функции.
— Мастер-класс: воронки.
— Основы Python: классы и объекты.
— Основы Python: исключения.
— Библиотека NumPy: методы анализа массивов.
— Библиотека NumPy: способы преобразования массивов.
— Библиотека pandas: индексация и выбор данных.
— Библиотека pandas: применение функций, группировка, сортировка.
— Визуализация данных с помощью matplotlib.
— Мастер-класс: разведочный анализ (EDA).
— Курсовая работа. Подготовка аналитического отчёта на основе имеющихся данных в качестве помощи продюсерам образовательных программ эффективно выстраивать стратегию по обновлению и улучшению курсов.
— Чтение и запись данных: CSV, HTML, XML, XLSX.
— Основы SQL.
— Чтение и запись данных: JSON, HDF5, Работа с БД: SQLite3, postgreSQL, MongoDB.
— Работа со строками.
— Курсовая работа. Часть 1. Подготовка аналитического отчёта для HR-отдела. На основе аналитики необходимо составить рекомендации для отдела кадров по стратегии набора персонала и взаимодействию с сотрудниками.
— Курсовая работа. Часть 2. подготовка аналитического отчёта для SMM-отдела компании Skillbox на основе паблика Skillbox «ВКонтакте».
2. Статистика и теория вероятностей
3. Основы математики для Data Science
— Базовые математические объекты и SymPy. Дроби и преобразования.
— Базовые математические объекты и SymPy. Функции и дополнительные объекты.
— Функции одной переменной, их свойства и графики.
— Интерполяция и полиномы: квадратичные и кубические функции.
— Аппроксимация и преобразование функций: сдвиги, растяжения, сжатия.
— Аппроксимация и работа с производными.
— Функции нескольких переменных, их свойства и графики.
— Частные производные функции нескольких переменных.
— Векторы и матрицы. Градиент.
— Линейная регрессия и системы линейных уравнений.
— Разложение матриц. Собственные векторы и значения.
4. Машинное обучение. Начальный уровень
— Основные концепции Machine Learning (ML).
— Жизненный цикл ML-проекта.
— Регрессия: метрики качества, преобразование входных данных.
— Регрессия: регуляризация и градиентный спуск.
— Классификация: kNN, наивный байесовский классификатор, деревья решений.
— Классификация: метрики качества классификации и многоклассовая классификация.
— Кластеризация.
— Дополнительные техники: понижение размерности.
— Дополнительные техники: бустинг и стекинг.
— Знакомство с Kaggle.
— Курсовая работа. Проанализировать данные телекоммуникационной компании и спрогнозировать отток пользователей на основе демографических характеристик, услуг, которыми они пользуются, длительности пользования услугами, метода и размера оплаты.
Специализация
1. Аналитика. Средний уровень
— Язык программирования R: базовые операции и структуры данных.
— Язык программирования R: циклы и функции.
— Язык программирования R: анализ данных и их визуализация.
— Создание аналитических панелей (Dashboard) в R.
— A/B-тестирование: объем выборки и построение доверительных интервалов.
— A/B-тестирование: статистические гипотезы и алгоритмы их проверки (Bootstrap и статистический тест).
— Мастер-класс: A/B-тестирование.
— Performance metrics.
— Мастер-класс: модели атрибуции прибыли.
— Интерактивная визуализация данных с помощью Plotly.
2. Машинное обучение. Средний уровень
— Введение в нейронные сети.
— Обучение нейронных сетей.
— Нейронные сети на практике.
— Свёрточные нейросети для задачи классификации изображений: введение в свёртки (многоканальные свёртки, рецептивное поле).
— Свёрточные нейросети для задачи классификации изображений: продвинутые операции со свёрткой (архитектуры сетей VGG и ResNet, задача Transfer Learning для свёрточных сетей).
— Семантическая сегментация: слабая локализация и полносвёрточные нейросети (FCN).
— Семантическая сегментация: продвинутые архитектуры FCN для семантической сегментации.
— Детектирование объектов. Задачи классификации и локализации.
— Детектирование объектов. Анализ и реализация R-CNN-архитектуры.
— Детектирование объектов. Разбор популярных архитектур (Fast/Faster R-CNN, YOLO, SSD) и знакомство с TensorFlow Object Detection API.
— От дискриминативных моделей к генеративным. Style transfer.
— Генеративные состязательные сети.
— Введение в NLP.
— NLP на нейросетях. Рекуррентные нейросети, классификация текстов.
— NLP на нейросетях. Языковые модели, Attention, Transformer.
— Обучение с подкреплением. Q-Learning.
— Обучение с подкреплением. Deep Q-Learning.
— Ускорение и оптимизация нейронных сетей.
— Внедрение DL моделей в production.
— Введение в рекомендательные системы и задачи ранжирования.
— Современные подходы к построению рекомендательных систем.
Бонусные курсы
1. Универсальные знания программиста
— Как стать первоклассным программистом?
— Вёрстка email-рассылок. Советы на реальных примерах.
— The state of soft skills.
— Как мы создавали карту развития для разработчиков?
— Как общаться по email и эффективно работать с почтой?
— Повышение своей эффективности.
— Спор о первом языке программирования.
— Саморазвитие: как я не усидел на двух стульях и нашёл третий.
— Data-driven-подход к продуктивности — инсайты из данных миллиона людей.
— Протокол HTTP.
— Введение в алгоритмы.
2. Английский для IT-специалистов
— IT Resume and CV.
— Job interview: questions and answers.
— Teamwork.
— Workplace communication.
— Business letter.
— Software development.
— System concept development and SRS.
— Design.
— Development and Testing.
— Deployment and Maintenance.
Дипломные проекты
1. Рекомендательная система для онлайн-гипермаркета Instacart.
2. Система по распознаванию эмоций.
После обучения вы получите диплом об успешном прохождение курса «Профессия Data Scientist», который станет дополнительным аргументом при устройстве на работу.
Отправить комментарий