Ния Нархид, Гвен Шапира, Тодд Палино. Apache Kafka. Потоковая обработка и анализ данных

Ния Нархид, Гвен Шапира, Тодд Палино. Apache Kafka. Потоковая обработка и анализ данных

Сегодня платформу Apache Kafka используют в тысячах компаний, в том числе более чем в трети компаний из списка Fortune 500 Kafka входит в число самых быстрорастущих проектов с открытым исходным кодом и уже породила обширную экосистему. Она находится в самом эпицентре управления потоками данных и их обработки. А начало Kafka положила внутренняя инфраструктурная система, которая была создана в LinkedIn.

Идея создания платформы состояла в том, чтобы не ставить во главу угла хранение больших объемов данных, как в реляционных базах данных, хранилищах пар «ключ/значение», поисковых индексах или кэшах, а рассматривать данные как непрерывно развивающийся и постоянно растущий их поток и проектировать информационные системы — и, конечно, архитектуру данных — на этой основе.

Эта идея нашла даже более широкое применение, чем ожидалось. И хотя первым назначением Kafka было обеспечение функционирования работающих в реальном масштабе времени приложений и потоков данных социальной сети, сейчас она лежит в основе самых передовых архитектур во всех отраслях промышленности Крупные розничные торговцы пересматривают свои основные бизнес-процессы с точки зрения непрерывных потоков данных, автомобильные компании собирают и обрабатывают в режиме реального времени потоки данных, получаемые от подключенных к Интернету автомобилей, и также пересматривают свои фундаментальные процессы и системы с ориентацией на Kafka и банки.

Книга написана для разработчиков, использующих в своей работе API Kafka, а также инженеров-технологов (именуемых также SRE, DevOps или системными администраторами), занимающихся установкой, конфигурацией, настройкой и мониторингом ее работы при промышленной эксплуатации. Также авторы не забыли также об архитекторах данных и инженерах-аналитиках — тех, кто отвечает за проектирование и создание всей инфраструктуры данных компании. Некоторые главы ориентированы на Java -разработчиков . В других главах предполагается, что у читателя есть опыт работы с Linux и он знаком с настройкой сети и хранилищ данных на Linux.

Есть еще одна категория людей, которых может заинтересовать данная книга, — руководители и архитекторы, работающие не непосредственно с Kafka, а с теми, кто работает с ней. Ничуть не менее важно, чтобы они понимали, каковы предоставляемые платформой гарантии и в чем могут заключаться компромиссы, на которые придется идти их подчиненным и сослуживцам при создании основанных на Kafka систем. Эта книга будет полезна тем руководителям, которые хотели бы обучить своих сотрудников работе с Kafka или убедиться, что команда разработчиков владеет нужной информацией.

Название: Потоковая обработка и анализ данных
Автор: Ния Нархид, Гвен Шапира, Тодд Палино
Год выпуска: 2019
Издательство: Питер
Жанр: Программирование, потоки данных
Язык: Русский
Качество: Отличное
Страниц: 320 с илл.
Формат: PDF
Размер файла: 10,1 Mb
Внимание! У Вас нет прав для просмотра скрытого текста.
Информация
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.