Курс «Курс «Специалист по Data Science плюс»»

Направление
Data Science
Формат
Вебинар
Домашние задания
Есть
Итоговый экзамен
Есть
Количество уроков
7
Документ об обучении
Сертификат
Обратная связь
Есть
Доступ
Сразу после покупки
Последнее обновление 03.07.2022

О курсе

Расширенная программа для тех, кто хочет построить карьеру в сфере data science.

Программа курса

  1. Вводный курс, из которого вы узнаете, что такое анализ данных и чем занимаются специалисты по data science. Решая кейсы из разных областей, вы изучите азы Python и библиотеки Pandas, научитесь строить некоторые графики и верно их трактовать. Но главное — оцените свои силы, мотивацию и запас времени, чтобы решить, идти ли дальше.
  2. сякое исследование проходит три стадии:

    1. На этапе предобработки данные очищают от ошибок.
    2. В исследовательском анализе учатся применять графики и описательную статистику. Тогда появляются первые гипотезы.
    3. С помощью статистического анализа оценивают, насколько данные позволяют предсказывать будущие события.
    Навыки и технологии

    pandas, seaborn;
    предобработка данных, EDA, проверка гипотез.
  3. Один из способов обучить алгоритм — показать исходные данные и желаемый результат. Алгоритм обучится на данных и сможет сам достигать того же результата. Похоже на шахматы: сначала новички изучают партии мастеров и потом побеждают сами.
    Этот метод обучения алгоритмов вы опробуете на реальных бизнес-кейсах.
    Навыки и технологии

    Задачи классификации и регрессии;
    проработка бизнес-задач;
    бизнес-метрики;
    оценка качества моделей.
  4. Python — основной язык программирования в data science. Достаточно простой, даже если вы никогда не писали код.

    Приложения для командной строки заменят визуальный интерфейс: они быстрее и гибче.

    Git — для совместной работы и хранения изменений в коде. Впереди сложные проекты, но вы с самого начала научитесь раскладывать всё по полочкам.
    Навыки и технологии

    Python и pandas;
    bash, virtualenv, docker;
    управление git-репозиторием,
    ветвями кода.
  5. В зависимости от задачи специалисты подбирают разные алгоритмы и структуры данных. Всё ради эффективности: данных бывает много, а алгоритмы должны справляться быстро.

    Для оценки эффективности пригодятся основы линейной алгебры и численных методов. При необходимости мы поможем разобраться в математике. Так вы сможете глубже разобраться в устройстве машинного обучения и особенностях моделей.
    Навыки и технологии

    Алгоритмы и структуры данных: сложность алгоритма, алгоритмы на графах, динамическое программирование;

    линейная алгебра: векторы, матрицы, расстояния;

    численные методы: приближённые алгоритмы, алгоритмы оптимизации, градиентный спуск;

    алгоритмы машинного обучения: решающие деревья, бустинг и бэггинг, линейные и модели.
  6. Данных так много, что их хранение и получение — отдельная область знания. Мы расскажем, как организовать хранение больших объёмов информации, чтобы доступ к ней оставался простым и быстрым.

    Почти в любой вакансии в сфере data science требуют знание SQL — на этом языке управляют популярными базами данных. Вы отработаете основные сценарии запроса данных, чтобы работа с SQL вошла в привычку.
    Навыки и технологии

    Анализ данных на SQL;

    Spark, MapReduce, распределённые системы.
  7. Это предпоследний модуль программы. Поэтому практических задач станет больше, а теории меньше.

    Вы отработаете навыки на задачах из разных областей бизнеса и узнаете, как улучшить модели машинного обучения.
    Навыки и технологии

    Регуляризация, выбор моделей и гиперпараметров, объединение моделей;

    временные ряды;

    обучение без учителя.

Другие курсы по этой теме