Изучив курс "Профессия Data Scientist" от Skillbox, Вы станете специалистом по анализу данных, алгоритмам машинного обучения и нейросетям, сможете построить карьеру в крупной технологической компании — в России или за рубежом.
1,5 года стажа в Data Science в ваше резюме. 2 специальности в одной программе. Обучение на реальных данных. Трудоустройство после обучения.
Вы научитесь:
- Программировать на Python. - Визуализировать данные. - Работать с библиотеками и базами данных. - Программировать на R. - Применять нейронные сети для решения реальных задач. - Создавать рекомендательные системы.
Программа курса "Профессия Data Scientist" состоит из 94 тематических модулей и 2 бонусных курса:
Введение в анализ данных и машинное обучение
1. Аналитика. Начальный уровень
- Введение в Data Science. - Введение в Python. - Основы Python: установка PyCharm. - Основы Python: базовые структуры данных. - Основы Python: циклы и условия. - Основы Python: функции. - Мастер-класс: воронки. - Основы Python: классы и объекты. - Основы Python: исключения. - Библиотека NumPy: методы анализа массивов. - Библиотека NumPy: способы преобразования массивов. - Библиотека pandas: индексация и выбор данных. - Библиотека pandas: применение функций, группировка, сортировка. - Визуализация данных с помощью matplotlib. - Мастер-класс: разведочный анализ (EDA). - Курсовая работа. Подготовка аналитического отчёта на основе имеющихся данных в качестве помощи продюсерам образовательных программ эффективно выстраивать стратегию по обновлению и улучшению курсов. - Чтение и запись данных: CSV, HTML, XML, XLSX. - Основы SQL. - Чтение и запись данных: JSON, HDF5, Работа с БД: SQLite3, postgreSQL, MongoDB. - Работа со строками. - Курсовая работа. Часть 1. Подготовка аналитического отчёта для HR-отдела. На основе аналитики необходимо составить рекомендации для отдела кадров по стратегии набора персонала и взаимодействию с сотрудниками. - Курсовая работа. Часть 2. подготовка аналитического отчёта для SMM-отдела компании Skillbox на основе паблика Skillbox «ВКонтакте».
2. Статистика и теория вероятностей
3. Основы математики для Data Science
- Базовые математические объекты и SymPy. Дроби и преобразования. - Базовые математические объекты и SymPy. Функции и дополнительные объекты. - Функции одной переменной, их свойства и графики. - Интерполяция и полиномы: квадратичные и кубические функции. - Аппроксимация и преобразование функций: сдвиги, растяжения, сжатия. - Аппроксимация и работа с производными. - Функции нескольких переменных, их свойства и графики. - Частные производные функции нескольких переменных. - Векторы и матрицы. Градиент. - Линейная регрессия и системы линейных уравнений. - Разложение матриц. Собственные векторы и значения.
4. Машинное обучение. Начальный уровень
- Основные концепции Machine Learning (ML). - Жизненный цикл ML-проекта. - Регрессия: метрики качества, преобразование входных данных. - Регрессия: регуляризация и градиентный спуск. - Классификация: kNN, наивный байесовский классификатор, деревья решений. - Классификация: метрики качества классификации и многоклассовая классификация. - Кластеризация. - Дополнительные техники: понижение размерности. - Дополнительные техники: бустинг и стекинг. - Знакомство с Kaggle. - Курсовая работа. Проанализировать данные телекоммуникационной компании и спрогнозировать отток пользователей на основе демографических характеристик, услуг, которыми они пользуются, длительности пользования услугами, метода и размера оплаты.
Специализация
1. Аналитика. Средний уровень
- Язык программирования R: базовые операции и структуры данных. - Язык программирования R: циклы и функции. - Язык программирования R: анализ данных и их визуализация. - Создание аналитических панелей (Dashboard) в R. - A/B-тестирование: объем выборки и построение доверительных интервалов. - A/B-тестирование: статистические гипотезы и алгоритмы их проверки (Bootstrap и статистический тест). - Мастер-класс: A/B-тестирование. - Performance metrics. - Мастер-класс: модели атрибуции прибыли. - Интерактивная визуализация данных с помощью Plotly.
2. Машинное обучение. Средний уровень
- Введение в нейронные сети. - Обучение нейронных сетей. - Нейронные сети на практике. - Свёрточные нейросети для задачи классификации изображений: введение в свёртки (многоканальные свёртки, рецептивное поле). - Свёрточные нейросети для задачи классификации изображений: продвинутые операции со свёрткой (архитектуры сетей VGG и ResNet, задача Transfer Learning для свёрточных сетей). - Семантическая сегментация: слабая локализация и полносвёрточные нейросети (FCN). - Семантическая сегментация: продвинутые архитектуры FCN для семантической сегментации. - Детектирование объектов. Задачи классификации и локализации. - Детектирование объектов. Анализ и реализация R-CNN-архитектуры. - Детектирование объектов. Разбор популярных архитектур (Fast/Faster R-CNN, YOLO, SSD) и знакомство с TensorFlow Object Detection API. - От дискриминативных моделей к генеративным. Style transfer. - Генеративные состязательные сети. - Введение в NLP. - NLP на нейросетях. Рекуррентные нейросети, классификация текстов. - NLP на нейросетях. Языковые модели, Attention, Transformer. - Обучение с подкреплением. Q-Learning. - Обучение с подкреплением. Deep Q-Learning. - Ускорение и оптимизация нейронных сетей. - Внедрение DL моделей в production. - Введение в рекомендательные системы и задачи ранжирования. - Современные подходы к построению рекомендательных систем.
Бонусные курсы
1. Универсальные знания программиста
- Как стать первоклассным программистом? - Вёрстка email-рассылок. Советы на реальных примерах. - The state of soft skills. - Как мы создавали карту развития для разработчиков? - Как общаться по email и эффективно работать с почтой? - Повышение своей эффективности. - Спор о первом языке программирования. - Саморазвитие: как я не усидел на двух стульях и нашёл третий. - Data-driven-подход к продуктивности — инсайты из данных миллиона людей. - Протокол HTTP. - Введение в алгоритмы.
2. Английский для IT-специалистов
- IT Resume and CV. - Job interview: questions and answers. - Teamwork. - Workplace communication. - Business letter. - Software development. - System concept development and SRS. - Design. - Development and Testing. - Deployment and Maintenance.
Дипломные проекты
1. Рекомендательная система для онлайн-гипермаркета Instacart.
2. Система по распознаванию эмоций.
После обучения вы получите диплом Skillbox об успешном прохождение курса "Профессия Data Scientist", который станет дополнительным аргументом при устройстве на работу.