Hadoop on Windows Azure こと、HDInsight ですが、CTPから足かけ2年くらいかけてようやくリリースされました。
1年くらい前にインストールの記事を書いていますが、GAしたので再度現状レベルの物を試したいと思います。インストールは例によって、Web Platform Installer経由でできます。
インストール
Web Plを起動して、hdinsight を検索すると、 Microsoft HDInsight Emulator for Windows Azureが表示されるので、これをインストールします。
依存関係は以下の通りです。
前回のようにインストールに失敗せずに、すんなり終わるでしょう。完了すると、デスクトップに以下のショートカットが作成されます。ちょっといやらしいのは、システムドライブ(例えば、C:\直下)に、Hadoop、Pytyonフォルダを作ってくれちゃうところです。また、システムドライブ以外(例えば、D:\)が存在すると、HadoopFeaturePackSetup、HadoopInstallFiles などを作ってしまうのも注意したいところ。
Javaは、Hadoopフォルダ内に同梱されているので、別途インストールする必要などありません。:-) 以下、Hadoopフォルダ直下の内容です。
実行
よくある円周率計算のサンプルを動かしてみます。Haoop Command Promptを開き、
> hadoop jar hadoop-examples-1.1.0-SNAPSHOT.jar pi 10 1000
等度入力します。さくっと以下のように実行されます。
このまま放置するとHadoop関連のサービスがわんさと起動しちゃうことになります。
Hadoopフォルダに、「stop-onebox.cmd」が用意されているので、これを実行すればHadoop関連サービスを一括で止めることが出来ます。また、マニュアルスタートにする「set-onebox-manualstart.cmd」スクリプトも用意されているので、お試しあれ。
まとめ
少し前はHadoopをWindowsで動かすには、Cygwin入れたり色々苦労した気がするので、お手軽にインストールできてGJだと思ってるよ。ただし、64bit系のOSじゃないと動作しないので注意してね。