AWSではじめるデータレイク
あらすじ
●本電子書籍は「固定レイアウト」で作成されています。説明文の最後に固定レイアウト型に関する説明事項がありますのでご確認ください。
「データレイク」は、大量データ分析/生成データの活用を視野に入れた新しいデータストアのかたちです。従来のデータベース/データウェアハウスの範囲に収まらない多様なデータを大量に保管し、高度な統計分析や機械学習に役立つ情報基盤を作ることが可能です。
本書ではデータレイクの概念や特徴、必要とされる機能などを基本から解説し、さらにAmazonが運営するパブリッククラウドサービスAWS(Amazon Web Services)で実現する方法を解説します。
大量のデータを確実に保管するため、データレイクの世界ではクラウドのようなサービス型インフラストラクチャの活用が注目されます。さらにAWSではオブジェクトストレージS3上のデータを直接分析するAmazon Athena、データウェアハウスのAmazon Redshiftなど、データレイクを支えるさまざまな仕組みが存在します。
本書ではそれらの活用指針を解説するとともに、後半ではシステムの構築例を具体的に解説していきます。ビジネスデータ分析とログなどの生成データ分析を例に、機械学習や統計分析をビジネスの現場で活かすためのヒントを数多く提供します。
●固定レイアウト型に関する説明事項
本電子書籍は、「固定レイアウト型」で配信されます。以下の点にご注意ください
・タブレットなどの大きなディスプレイの端末をご利用ください
・文字拡大、文字のコピー、マーク、ハイライト、文字列検索、辞書の参照、Web検索、引用の機能は使用できません。
・ご利用の端末でプレビュー表示を確認のうえ、ご購入ください。
・Wi-Fiネットワーク経由でのダウンロードが推奨されます。