大規模クラウドのデータ課題を解決するオープンテーブルフォーマットの決定版
現代のビッグデータ基盤は、前処理の複雑さやツールへの依存といった多くの課題を抱えています。こうした問題を解決するために登場したのが、オープンソースのテーブルフォーマットApache Icebergです。本書は、Icebergの基礎から実践的な応用までを網羅したガイドブックです。Icebergの仕組みや使い方を学ぶことで、インタラクティブな分析、バッチ処理、機械学習、ストリーミング処理を効率的に実現できます。
●本書の特徴
○データ活用の障壁をなくす:データの抽出・変換・書き出しといった複雑な前処理をシンプルにし、データ統合を容易にします。これにより、効率的な分析が可能になります。
○Icebergのすべてを体系的に習得:なぜIcebergが生まれたのかという背景から、独自のアーキテクチャ、テーブル操作の裏側で行われる処理まで、その仕組みを深く理解できます。
○主要ツールでの実践ノウハウ:Apache Spark、Dremio、AWS Glue、Apache Flinkなど、人気のデータ処理エンジンでの具体的な使い方をハンズオン形式で学べます。
○本番運用で役立つ知識:メタデータテーブルによる監視、Gitライクなブランチ機能によるデータ変更の分離、リスクを抑えた移行戦略など、本番環境での運用ノウハウを習得できます。
●本書の構成
第1章 Apache Iceberg へようこそ
第2章 Apache Iceberg のアーキテクチャ
第3章 読み書きを行なうクエリのライフサイクル
第4章 Icebergテーブルの最適化
第5章 Icebergカタログ
第6章 Apache Spark
第7章 Dremio SQLクエリエンジン
第8章 AWS Glue
第9章 Apache Flink
第10章 Apache Icebergの本番利用
第11章 Apache Icebergとストリーミング処理
第12章 ガバナンスおよびセキュリティ
第13章 Apache Icebergへの移行
第14章 Apache Iceberg のユースケース
●こんな方におすすめ
○データエンジニア、データアーキテクト
○データレイクハウスの構築・運用に関わる方
○ビッグデータ基盤のパフォーマンスやコストに課題を感じている方
本書を通して、Icebergを自在に操り、複雑なデータ課題をシンプルに解決できるプロフェッショナルを目指してください。
※本書はO'Reilly Media『Apache Iceberg The Definitive Guide』の邦訳です。