Михаил Королев - Data Engineering (2023) Видеокурс

Михаил Королев - Data Engineering (2023) Видеокурс

Data Engineer — это специалист, который собирает данные из разных источников, очищает их и передает в удобном виде аналитикам для принятия бизнес-решений. Аналитикам данных нужно знать, как работает хранилище данных, в каком виде там хранятся данные, как они обрабатываются и как их можно получить для анализа. Курс ориентирован на практику и основные инструменты, подходит для тех, кто имеет базовые знания языка Python.

МОДУЛИ

1 Введение, практический linux
Кто такой Data Engineer и зачем ему Linux?

2 Современные хранилища данных
Разнообразие баз данных и их особенности

3 Экосистема Hadoop
Что такое Hadoop, что он умеет и как им пользоваться

4 Источники данных и работа с ними
Файлы как источники данных, JDBC — структурированные данные, SQL для выгрузки данных

5 Apache Spark и обработка данных
Зачем нужен Apache Spark и как с ним работать

6 Hadoop как хранилище данных
Особенности и нюансы hdfs

7 Apache Airflow для оркестрации конвейеров
Настройка data pipelines

8 Обзор облачных хранилищ
Особенности и нюансы работы с облачными хранилищами: Google, Amazon, Azure

Информация о видео
Название: Data Engineering
Автор: Михаил Королев
Год выхода: 2023
Жанр: Видеокурс
Язык: Русский
Выпущено: Россия
Продолжительность: 09:41:17

Файл
Формат: MKV
Видео: AVC, 1280x720, ~1124 Kbps
Аудио: AAC, 128 Kbps, 48.0 KHz
Размер файла: 3.69 Gb



Внимание! У Вас нет прав для просмотра скрытого текста.

Информация
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.