Курс «Курс «Специалист по Data Science»»

Направление
Data Science
Домашние задания
Есть
Итоговый экзамен
Есть
Количество уроков
20
Документ об обучении
Диплом
Обратная связь
Есть
Доступ
Сразу после покупки
Последнее обновление 05.07.2022

О курсе

Научитесь анализировать большие объёмы данных, применять машинное обучение, чтобы предсказывать события, прогнозировать значения и искать неочевидные закономерности в данных, помогать создавать и улучшать продукты в бизнесе, промышленности и науке.

Программа курса

  1. Узнаете основные концепции анализа данных и поймёте, чем занимаются аналитики данных и специалисты по Data Science. Решите пять кейсов по работе с данными из разных областей:

    выясните причину массовой поломки гаджетов,
    проверите окупаемость рекламы мобильного приложения,
    найдёте лучшее место для нового магазина,
    поможете выбрать стратегию развития ИИ-стартапа,
    оцените эффективность роботов в службе поддержки.
  2. Глубже погрузитесь в язык программирования Python и работу с библиотекой pandas.
  3. Научитесь очищать данные от выбросов, пропусков и дубликатов, а также преобразовывать разные форматы данных.
  4. Изучите основы теории вероятностей и статистики. Примените их для исследования основных свойств данных, поиска закономерностей, распределений и аномалий. Познакомитесь с библиотеками scipy и matplotlib. Отрисуете диаграммы, поупражняетесь в анализе графиков.
  5. Научитесь анализировать взаимосвязи в данных методами статистики. Узнаете, что такое статистическая значимость, гипотезы и доверительные интервалы.
  6. Вспомните или узнаете базовые термины в теории вероятностей: независимые, противоположные, несовместные события и т. д. На простых примерах и забавных задачах потренируетесь работать с числами и выстраивать логику решения.
    Это необязательный спринт. Значит, каждый студент сам выбирает один из вариантов прохождения:

    Освоить дополнительный курс из десяти коротких уроков, освежить в памяти теорию и решить задачи.
    Открыть только блок с задачами для собеседований, вспомнить практику без теории.
    Пропустить курс совсем или вернуться к нему, когда будет время и необходимость.
  7. Научитесь предварительному исследованию данных, сформулируете и проверите гипотезы.
  8. Освоите основные концепции машинного обучения. Познакомитесь с библиотекой scikit-learn и примените её для создания первого проекта с машинным обучением.
  9. Углубитесь в самую востребованную область машинного обучения — обучение с учителем. Узнаете, как обращаться с несбалансированными данными.
  10. Узнаете, как машинное обучение (сокр. МО) помогает бизнесу, как собирать данные и как продуктовые метрики связаны с показателями МО. Научитесь запускать новую функциональность сервиса, применяя МО. Узнаете, что такое бизнес-метрики, KPI и A/B-тестирование.
  11. Подготовите данные для машинного обучения. С помощью модели оцените её качество.
  12. Заглянете внутрь нескольких изученных ранее алгоритмов и лучше поймёте, как их применять. На практике освоите с нуля главные концепции линейной алгебры: линейные пространства, линейные операторы, евклидовы пространства.
  13. Разберёте ряд алгоритмов и приспособите их к решению практических задач с использованием численных методов. Освоите приближённые вычисления, оценки сложности алгоритма, градиентный спуск. Узнаете, как обучаются нейронные сети и что такое градиентный бустинг.
  14. Временные ряды описывают, как меняются параметры, например, объём потребления электроэнергии или количество заказов такси, с течением времени. Вы научитесь анализировать ряды, искать тренды и выявлять сезонность. Узнаете, как создавать табличные данные и задачу регрессии из временных рядов.
  15. Научитесь делать числовые векторы из текстов и решать для них задачи классификации и регрессии. Узнаете, как вычисляются признаки TF-IDF и познакомитесь с языковыми представлениями word2vec и BERT.
  16. Изучите основы языка запросов SQL и реляционной алгебры для работы с базами данных. Познакомитесь с особенностями работы в PostgreSQL — популярной системе управления базами данных (сокр. СУБД). Научитесь писать запросы разного уровня сложности и переводить бизнес-задачи на язык SQL.
    Вы будете работать с базой данных онлайн-магазина, который специализируется на фильмах и музыке.
  17. Научитесь решать простые задачи компьютерного зрения с привлечением готовых нейронных сетей и библиотеки Keras. Познакомитесь с Deep learning.
  18. Обучение без учителя — это один из способов машинного обучения, при котором система решает задачу без размеченных заранее данных на основе их особенностей и структуры. Познакомитесь с задачами кластеризации и поиска аномалий.
  19. В последнем проекте подтвердите, что освоили новую профессию. Уточните задачу заказчика, пройдёте все стадии анализа данных и машинного обучения. Теперь без уроков и домашних заданий — всё как на реальной работе.

Другие курсы по этой теме