SQL Server Integration Service (SSIS) による ETL

ここでは Northwind データベースから、BI に必要なデータを取得することを考えます。

Northwind データベースというのは、BIRT の説明でも利用しましたのでそちらを参考にしてください。(「SQL Server データベースと JDBC ドライバーの準備」)

SQL Server 2012 のインストール、及び、Northwind データベースの準備が完了したことを前提にして話を進めますので、準備ができていない方は先に準備して置いてください。

データ取込みの要件

はじめに Northwind データベースのどのテーブルから、どのような情報を取得したいかみてみましょう。

ゴールは次の図のようなレポートです。

これを踏まえ Northwind を確認し、注文のヘッダーテーブルにあたる Orders テーブル、注文の明細行となる Order Details、 顧客の情報が入っている Customers テーブル、さらに従業員の情報となる Employees テーブルの4テーブルから情報を取得するとしましょう。

また、さらに取り込む情報を絞り、上図内の赤色でマークしたフィールドだけを取り込みます。

取込み先のデータベースを作成

一般的には、様々なロケーションにあるデータを取り込み統合することを想定します。しかしながら、今回ははじめてのレポート作成ということで非常に単純化して考えます。

データの取込み先は、Northwind と同じデータベース上にある BI 用のデータベースとします。

ここでは "NorthwindBI" という名前でデータベースを作成してください。

この時点ではデータベースの中身は空っぽです。テーブルはひとつも作成されていません。

» SSDT での SSIS プロジェクト作成