Курс «Data Engineer с нуля до Junior»

Направление
Data Engineering
Формат
Видео в записи
Упражнения на платформе
Домашние задания
Есть
Итоговый экзамен
Нет
Количество уроков
4
Документ об обучении
Сертификат
Обратная связь
Есть
Доступ
Сразу после покупки
Последнее обновление 15.08.2022
Скидка
рассрочка
109 800 руб.
Доступна рассрочка на 22.
4826 руб. / мес.

О курсе

Вы научитесь разворачивать инфраструктуру для сбора, преобразования и загрузки больших данных, освоите Python и SQL. Начнёте с основ, а через год сможете найти работу Junior-специалистом.

Программа курса

  1. Познакомитесь с основными направлениями Data Science, обучите и внедрите свою первую ML-модель. Получите базовые знания по математике, статистике и теории вероятностей. Всё это поможет вам разобраться в основных принципах работы с данными. Среднее время прохождения — 6 месяцев.

    Введение в Data Science

    Пройдёте все этапы работы с данными. Научитесь выявлять проблемы, собирать бизнес-требования. Будете выгружать данные из различных источников, проводить разведочный анализ и готовить датасет к дальнейшему использованию. Обучите и внедрите готовую ML-модель, попробуете себя в роли продуктового и маркетингового аналитика. Узнаете, как формулировать и проверять гипотезы. Освоите базовые инструменты для работы: Python, SQL, Excel, Power Bi, Airflow.

    Основы математики для Data Science

    Получите базовые знания по математике для работы с машинным обучением. Поймёте, что такое аппроксимация, интерполяция, функции, регрессии, матрицы и векторы. Научитесь работать с математическими сущностями в Python-библиотеке SymPy.

    Основы статистики и теории вероятностей

    Поймёте принципы работы со случайными величинами и событиями. Познакомитесь с некоторыми видами распределений и статистическими тестами, которые пригодятся при составлении моделей и проверке гипотез.

    Возможность стажировки

    Базовых знаний и навыков хватит, чтобы устроиться на стажировку — сможете продолжить учиться на курсе и в компании одновременно.
  2. Научитесь собирать сложные наборы данных, подготавливать витрины и выстраивать пайплайны для работы, разворачивать DS-проекты с нуля и тестировать код. Будете готовы работать на позиции Junior Data Engineer. Среднее время прохождения — 6 месяцев.

    Вводный блок

    Узнаете, чем занимается Data Engineer, какую роль играет в Data Science проекте и какие у него пути карьерного развития. Поймёте, как построен курс и какие темы вы будете изучать.

    SQL

    Научитесь манипулировать данными в существующих таблицах, выполнять операции вставки, очистки и обновления данных. Сможете сохранять данные из БД в различные форматы.
    Познакомитесь с оконными функциями и основами подготовки витрин данных, использующих SQL. Научитесь обеспечивать корректную вставку информации в режиме транзакции. Сможете читать и понимать лог транзакций.
    Узнаете, что такое индексы и архитектура индексов, где они применяются. Изучите методы ускорения запросов.

    Python. LVL 2

    Рассмотрите типы данных, возможности их преобразования и принцип совместной работы Python и SQL — получение данных из БД, работа с данными и выполнение запросов. Изучите основные понятия схем данных JSON и XML. Сможете настраивать отладку приложений, писать тесты, обезличивать и шифровать данные.

    Библиотеки для Python

    Узнаете, что такое библиотеки для работы с графиками, обучение с учителем, визуализация метрик и источники датасетов. Научитесь использовать Python и библиотеки для работы с данными. Сможете продолжить изучение Pandas.

    Airflow

    Рассмотрите ключевые понятия и практики по работе с Airflow. Изучите архитектуру и основы взаимодействия от UI до CLI. Построите свой первый data pipeline.

    Основы Spark

    Освоите Spark: узнаете, какими ресурсами вычислений он оперирует, как хранит данные и работает с памятью и диском. Развернёте свой первый локальный стенд.
    Изучите основы RDD: базовые концепции, работу с источниками, actions. Научитесь работать с Dataframe API. Изучите вопросы производительности и оптимизации при использовании Dataframe, источники и типы данных, работу с валидными/невалидными данными, обработку ошибок, UDF, взаимодействие с Python и SQL.

    Основы алгоритмов Machine Learning

    Разберёте основные виды моделей машинного обучения, ключевые термины и определения. Изучите алгоритмы регрессии и алгоритмы кластеризации.

    Deployment

    Изучите основные этапы подготовки модели к деплою, подходы к построению API и способы обработки ошибок и отладки приложений. Сможете устранять проблемы при деплое и освоите основные инструменты swagger.
    Познакомитесь с ключевыми процессами bash: написанием скриптов, работой с переменными и текстовыми редакторами sed и awk.
  3. После прохождения первого уровня — подготовите вводный проект. В конце курса презентуете итоговую работу.

    Введение в Data Science

    Закрепите новые знания на индивидуальном проекте — пройдёте путь от загрузки данных до внедрения модели. Решите задачи дата-инженера, ML-инженера и дата-аналитика, чтобы определиться со специализацией.

    Data Engineer

    Итоговый проект уровня Junior. Проведёте когортный анализ и выгрузите справочники по API. Построите дашборды по полученным данным.
  4. Карьера разработчика: трудоустройство и развитие

    Узнаете, как выбрать подходящую вакансию, подготовиться к собеседованию и вести переговоры с работодателем. Сможете быстрее получить должность, которая соответствует вашим ожиданиям и умениям.

    Система контроля версий Git

    Научитесь версионировать изменения в коде, создавать и управлять репозиториями, ветками, разрешать конфликты версий. Узнаете полезные правила работы с Git.

    Английский для IT-специалистов

    Получите языковые навыки, которые помогут пройти собеседование в иностранную компанию и комфортно общаться в смешанных командах.