О курсе
С помощью этого курса Вы научитесь:
- Писать на Python
Выучите синтаксис одного из самых популярных языков программирования, сможете создавать и применять функции
- Понимать особенности машинного обучения
Узнаете ключевые инструменты Machine Learning и научитесь их применять
- Работать с рекомендательными системами
Изучите типы и задачи рекомендательных систем, а также сможете создавать собственные
- Переносить проекты на Hadoop
Попрактикуемся в работе с Hadoop и разберем подход MapReduce
Программа курса:
Блок 1: "Python, быстрый старт: типы данных, функции, циклы, классы, ошибки"
- синтаксис
- форматирование строк, следования, ветвления и циклы
- создание и применение функций
Блок 2: "Библиотеки для анализа данных: Pandas, Numpy, Matplotlib, Plotly"
- существующие библиотеки и их различия
- подключение и практика с Pandas, Numpy
- работа с Matplotlib и Plotly
Блок 3: "Знакомство с машинным обучением. Этапы построение ML системы"
- задачи машинного обучения
- ключевые инструменты Machine Learning и их применение
- задачи предобработки данных и практика
Блок 4: "Основные модели машинного обучения: линейная и логистическая регрессии"
- что такое модели машинного обучения?
- практика основных моделей
- использование линейных методов и логистической регрессии
Блок 5: "Ваш первый Machine Learning проект на Python"
- сбор Machine Learning проекта
- разбор типовых ошибок
- обзор примеров проектов и создание своего
Блок 6: "Построение надежных стратегий валидации - важность локальной валидации"
- проблема переобучения и недообучения
- валидация на отложенной выборке
- бутстрап и построение доверительных интервалов
- KFold и Stratified KFold валидация
Блок 7: "Деревья решений и knn"
- определение и процесс построения решающего дерева
- критерии информативность для задачи регрессии и задачи классификации
- принцип работы дерево с количественными и категориальными признаками
- сравнение дерева решений с линейными моделями
Блок 8: "Алгоритмы кластеризации и оценка качества"
- постановка задачи кластеризации, примеры задач
- метрики для оценки качества решения задачи кластеризации
- KMeans, Иерархическая кластеризация
- практика кластеризации
Блок 9: "Feature Engineering, Feature Selection"
- базовые подходы к созданию признаков: агрегации, отношения, статистики
- базовые подходы к обработке категориальных признаков
- продвинутые подходы к созданию признаков: mean-target encoding, признаки на основе KNN
- оценка важности признаков на основе перестановочного критерия
Блок 10: "Предсказание оттока пользователей с сервиса и другие прикладные задачи"
- практическая задача по предсказанию оттока пользователей
- применяем логистическую и линейную регрессию на рабочем проекте
Блок 11: "Работа над дипломной работой"
- практическая задача по скорингу заявок и скорингу кредитного портфеля
- разбираем типовые ошибки из ДЗ
- собираем дипломный проект и отдаём на оценку ментору
Перспективы:
- Цифровой сертификат - Выпускники получают сертификат об успешном прохождении курса — что, вместе с дипломным проектом, будет хорошим аргументом при трудоустройстве
- Средняя зарплата от 180 000 ₽
- Помощь с трудоустройством и стажировкой