前回に引き続き、Azure Data Factoryのお話。以前はJSONで色々と定義する必要があったようですが、いまはお手軽な対話式のウィザードが公開されてます。

それをつかって、SQL Server → SQL DBをやってみたメモです。今回は同一スキーマの同一名テーブル間だでのコピーです。

SQL ServerはVMを使ってAzure上に立てましたが、オンプレにあっても同じでしょう。

とくにチュートリアル以上のことを解説しているわけではないのであしからず。

ウィザード開始

Data Factoryのアクション画面に、データコピーのタイルがあるので、それをクリック。

f:id:StateMachine:20170530120914p:plain

Pipeline

Pipelineの定義から始まります。いくつか設定項目がありますが、

1回だけか、スケジュール実行か
スケジュールなら期間と、実行頻度

など設定します。最小実行頻度は、15分毎だったと思います。

f:id:StateMachine:20170530121005p:plain

ソース

ソースを選択します。ここでは、SQL Serverを指定。

f:id:StateMachine:20170530121223p:plain

コネクション

コネクションですが、Data FactoryでいうところのLinkedServiceの情報を設定します。したがって、

ゲートウェイ
接続先
ユーザー、パスワード
認証方法

などが設定されます。ゲートウェイはあらかじめVMにインストールして設定しておく必要があります。便利なのがちゃんと接続テストしてくれるので楽チンです。

f:id:StateMachine:20170530121333p:plain

データセット

ソースのテーブル一覧とかが出てくれます。これらを選択していくとDatasetの定義がおわります。JSONいらずで楽です。

f:id:StateMachine:20170530122047p:plain

デストネーション

Data Factoryでは、Sinkとかいいますが、コピー先です。ここでは、SQL Azureこと、SQL Databaseを選択です。

f:id:StateMachine:20170530122357p:plain

コネクション

自分のサブスクリプションから情報を引っ張ってきてくれるので、

サーバー名
DB名
ユーザー、パスワード

等を設定すると接続チェックしてくれます。

f:id:StateMachine:20170530122318p:plain

データセット

テーブルのマッピングを定義します。

f:id:StateMachine:20170530122920p:plain

スーキーマのマッピングを定義します。

f:id:StateMachine:20170530123016p:plain

あとはウィザードにしたがっていけばOKです。ほんとJSON触らなくて良いのは楽チンです。

ダイアグラム

最終的に以下のようなダイアグラムが確認でき、データがコピーされていればOKです。

f:id:StateMachine:20170530123101p:plain

まとめ

意外とキチントした作りでした。ちゃんとしたオーサリングツール然としてる印象です。ウィザード形式ですすめれば、接続情報や、マッピングなので、間違いが入り込む余地がすくないし、おてがるにやるには、これはオススメです。

プロダクションでやるには、色々込み入った事情もアルでしょうから、けっきょくJSONになりそうな気がしなくはないです。

単純コピーだとまいかい全コピーなのか、差分なのかとか色々疑問がわきますが、それらはまた別途。

Azureの小ネタ（改）

～Azureネタを中心に、色々とその他の技術的なことなどを～

Azure Data Factory コピーウィザード（Preview）

ウィザード開始

Pipeline

ソース

コネクション

データセット

デストネーション

コネクション

データセット

ダイアグラム

まとめ