- Регистрация
- 09.04.2020
- Сообщения
- 353 752
- Реакции
- 32 713
- Монеты
- 1 191
- Оплачено
- 0
- Баллы
- 0
- #SkladchinaVip
- #1
Apache Iceberg. Полное руководство [Томер Ширан, Джейсон Хьюз]
- Ссылка на картинку
-
О книге:
Традиционные архитектурные шаблоны хранения данных сильно ограничены. Чтобы использовать их, приходится применять довольно дорогостоящие процессы ETL для загрузки данных в каждый инструмент, открывающий доступ к функциям хранилища данных. Отсутствие гибкости в этих шаблонах вынуждает замыкаться на некотором наборе инструментов и форматов, что вызывает дрейф данных. Данная книга демонстрирует более удачное решение. Apache Iceberg предлагает высокую производительность, масштабируемость и экономичность – главные преимущества, свойственные открытым озерам данных.
Прочитав книгу, вы узнаете:
Формат: скан PDF
Традиционные архитектурные шаблоны хранения данных сильно ограничены. Чтобы использовать их, приходится применять довольно дорогостоящие процессы ETL для загрузки данных в каждый инструмент, открывающий доступ к функциям хранилища данных. Отсутствие гибкости в этих шаблонах вынуждает замыкаться на некотором наборе инструментов и форматов, что вызывает дрейф данных. Данная книга демонстрирует более удачное решение. Apache Iceberg предлагает высокую производительность, масштабируемость и экономичность – главные преимущества, свойственные открытым озерам данных.
Прочитав книгу, вы узнаете:
- как организована архитектура таблиц Apache Iceberg;
- что происходит за кулисами, когда вы выполняете операции с таблицами Iceberg;
- как еще больше оптимизировать таблицы Iceberg, чтобы добиться максимальной производительности;
- как использовать Iceberg с популярными движками данных, такими как Apache Spark, Apache Flink и Dremio.
Формат: скан PDF
Зарегистрируйтесь
, чтобы посмотреть скрытый авторский контент.