DB Stories

DBに関する過去、現在、未来の話題をプロフェッショナルの視点で紹介

Star Schema The Complete Referece

データウェアハウスについての書籍

これからのテーマとしてデータウェアハウスというものを取り上げてみたいと考えています。データベースアーキテクチャとして「ビッグデータ」というキーワードとあわさって近年、ホットな領域であるのですが、その議論の中心は「データ分析のための技術」というある一部分の話にとどまります。データをどのように集めて、どのように格納して、どのように利用して、どのように改善(メンテナンス)していくのかという全体的な話についてはじっくりと腰を据えて考える必要があります。そのための書籍というのを見まわしてみても、一定レベル以上にある日本語の書籍は存在しないことに気づきます。企業内においては必須の話でもあるので、ニーズがないわけがないのですが、技術レベルの維持を考えるとかなり心配になってきます。(ニーズはあるけど売れないというのが理由かもしれないのですが)

Star Schema The Complete Referece

そこで、洋書を含めて探し出したのが以下の書籍です。

Star Schema The Complete Reference

Star Schema The Complete Reference

本書を実際に購入して感じた特徴を書いておくと以下のようになります。

  • データウェアハウスのデータモデルの基本形である多次元データモデル(スタースキーマ)についての基礎的な考え方から具体的な適用方法まで、「実用的に」記載されているのが特徴。
  • もっとも基本的な概念であり、非常に重要な考え方にもかかわらず多次元データモデルに関する書籍は存在していない。
  • トピックごとに要点を非常に整理して記載されており、実務上のリファレンスとして活用できる。「包括的」な内容で何度も読み返すことが多い。
  • 「何よりも現場で必要とされる内容」「初心者から上級者までが対象」という点から息の長い利用ができる。
  • スタースキーマというタイトルだが、内容としてはデータウェアハウスを取り巻く全般的な話について記載されている。

amazon.comでの評価も非常に高いのです。

f:id:good-value:20161125233543j:plain

ついでなので、評価コメントも訳しておきます。

素晴らしいリファレンスガイド 多次元モデルについての非常に素晴らしい書籍。実例が包括的に記載されていて、要点が明確に記載されている。つい多くの文章をマーキングしていて、「複数の値を取るディメンジョン」「履歴管理のいくつかの方法」といった高度な技術について読むのを楽しんでいる。この本で読者はデータモデルの基礎を理解することができるだろう。(もし基礎を知りたいのであれば、私自身の著書を推奨する) 最もこの本の気に入っているところは、アーキテクチャに中立で著者のテクニックは多くのデータウェアハウスでも有効である。もっとも有名なアーキテクチャであるHub and Busについてもフィットする有効であると説明されている。 各章の最後にある「さらに知るためには」についても非常によいと感じている。 (19ユーザーがこのレビューを評価)

スター、スノーフレークの両方素晴らしい。 この本は真に5つ星に値する。データウェアハウスについて今まで読んだ中でベストの本である。内容が非常に正確で包括的であるだけでなく、非常によく説明もされている。 データウェアハウスの概念は非常に説明が難しい。それが故に多くのデータウェアハウスについての書籍は(よく書かれていると言われるものであっても)不足していた。もしデータウェアハウス設計について1冊だけ読むのならこれにするべきだ。 題名とは異なり、スノーフレークスキーマについてもしっかり記載されている。著者はスタースキーマとスノーフレークの長所短所を注意深くリストアップしている。スターからスノーフレークへの変更は非常によく考えるべき項目である。 本書はデータ分析とETLも扱っている。この本はスター、スノーフレークスキーマのほぼすべてを扱っていると言える。 (12人がこのレビューを評価)

まず素直に「買ってよかった」と感じるクオリティだと感じます。そして何度も読み返すことができるそれだけの価値があります。

次回以降この本をネタにデータウェアハウスについて技術の深掘りをしていきます。