DB Stories

DBに関する過去、現在、未来の話題をプロフェッショナルの視点で紹介

ディメンションテーブルの整合性(conformed dimensions) (1)

業務プロセス(スタースキーマ)をまたがった分析というのは非常に有用なものといえます。このことは、エンタープライズ、目的別(subject area)データウェアハウスをまたがる検索についても同様です。前回まで業務プロセス(受注、出荷等のプロセス)を中心としてたデータ分析については業務プロセスごとのファクトテーブルが必要であり、業務プロセスをまたいだ分析(データの比較)は、それぞれの結果を組み合わせることで実行する必要があることを説明しました。この種の検索はプロセス横断検索(drilling across)と呼びますが、この時ディメンションテーブルの設計が非常に重要になります。

参考:

データウェアハウスアーキテクチャ(1) - DB Stories

データウェアハウスアーキテクチャ(2) - DB Stories

今回、このプロセス横断検索で重要となるディメンションテーブルの整合性(conformed dimension)について解説を行います。正しいディメンション設計とデータを利用すると、スタースキーマの横断検索だけでなく、エンタープライズデータベースと目的別データウェアハウス間の比較についても可能になります。ディメンションテーブルの整合性が取れていないとそれが実現できないことになり、不効率なstovepipe(サイロ型のデータモデル)になってしまいます。

ディメンションテーブルの整合性というのはルールの集合でもあります。このルールの設定を盲目的に暗記することもできますが、ディメンション設計を学ぶ上では「なぜ」という部分が当然ながら重要になります。「整合性」についての条件を挙げていく前に、ディメンションテーブルとスタースキーマ横断検索との関係について注目します。

ここでは「整合性(conformance)」は様々な面で使われる言葉ですが、今回はディメンションテーブルの整合性について説明を行います。

整合性のとれたディメンションテーブルはプロセス横断検索をより容易にし、企業における分析力の向上をもたらします。コーポレートインフォメーションファクトリ、多次元データウェアハウス、個別データマートといったデータベースモデルそれぞれについてこの整合性についてみていきます。

(つづく)