Azureの小ネタ (改)

~Azureネタを中心に、色々とその他の技術的なことなどを~

Microsoft HDInsight Server for Windows

従来より Hadoop on Azureとしてプレビュー版が公開されていましたが、Windows Azure HDInsight Service として再度提供されています。これとともに、Windows Serverでも動作する、Microsoft HDInsight Server for Windows もCTPとして提供されています。現在Windows Serverで動作可能なのは、シングルノード版のみです。

Webサイトをみると、SQL Serverの文字がみえますから、将来的にはSQL Serverの一プロダクトとなるのでしょうか。

Server版のインストール

WebPIを起動します。



多数の依存関係が表示されますが、同意してインストールを実行します。ちなみに、実際の実装系はHortonworksで行っているらしく、それらのライセンス条項が以下で読めます。多数Windows向けに手が入っていそうです。


しばし待ち、完了すればOKです。


インストールされるものは、以下の3つとなります。

  • Python
  • Hortonworks Data Platform 1.0.1 Developer Preview
  • Microsoft HDInsight Community Technology Preview



デスクトップ上にHadoop Command Lineが作成されるので実行してみますと、、、、



インストールに失敗します。

エラーリカバリ

どうもインストールスクリプトが悪くて失敗しているようです。


このとき、以下のフォルダができているはずです。

  • C:\Hadoop
  • D:\HadoopFeaturePackSetup
  • D:\HadoopInstallFiles


D:\HadoopInstallFiles\HadoopPackages\hdp-1.0.1-winpkg.zip ファイルを解凍し、scripts\create_hadoop_user.ps1 を開きます。
おっと、どうやら文字化けしているみたいです。



これを以下のように修正し、再度ZIP化します。

$export.PSObject.TypeNames.Insert(0,’ExportedPSCredential’)


再度イントールスクリプトを起動します。

d:\
cd d:\HadoopInstallFiles\HadoopSetupTools
bootstrap_install.cmd d:\HadoopInstallFiles\HadoopSetupTools

これでインストールが継続されるっぽい。


再度コマンドプロンプトを開けば、このとおり。



c:\hadoopは以下のようになっているはずです。



追記

このままだとDashboard系のソフトがインストールされませんでした。

http://prologika.com/CS/blogs/blog/archive/2012/10/31/installing-hdinsight-server-for-windows.aspx

にあるとおり、Powershell を起動し、d:\HadoopFeaturePackSetup\HadoopFeaturePackSetupTools で以下を実行します。

.\winpkg.ps1 ..\Packages\HadoopWebApi-winpkg.zip install -CredentialFilePath c:\Hadoop\Singlenodecreds.xml
.\winpkg.ps1 ..\Packages\HadoopDashboard-winpkg.zip install -CredentialFilePath c:\Hadoop\Singlenodecreds.xml


ダッシュボードが起動します。



雑感

Windowsでは、Cygwin前提であったり、1.0系あたりから擬似分散モードでうまく動作しなくなったりいろいろしていたと思いますが、いくつかパッチをのぞいてみるとSymlink云々の修正が入っていたので、今後にHaoopの実行環境として期待できそうな予感です。

Hadoop on Windows Azure

Hadoop on Windows Azure のCTPが始まっていますが現在招待制となっているようです。
興味があるのでリンクをまとめておきます。特に、Avkash Chauhan's Blog - Site Home - MSDN Blogsには、Hadoopに関する投稿が多々あって大変参考になりそうです。

上から投稿日付順にならんでいるので、斜め読みしていくだけでもなんとなく利用方法がつかめる(ような気がする)でしょう。

  1. Apache Hadoop on Windows Azure CTP Availability - Avkash Chauhan's Blog - Site Home - MSDN Blogs
  2. Apache Hadoop on Windows Azure Part 1- Creating a new Windows Azure Cluster for Hadoop Job - Avkash Chauhan's Blog - Site Home - MSDN Blogs
  3. Apache Hadoop on Windows Azure Part 2 - Creating a Pi Estimator Hadoop Job - Avkash Chauhan's Blog - Site Home - MSDN Blogs
  4. Apache Hadoop on Windows Azure Part 3 - Creating a Word Count Hadoop Job with a few twists - Avkash Chauhan's Blog - Site Home - MSDN Blogs
  5. Apache Hadoop on Windows Azure Part 4- Remote Login to Hadoop node for MapReduce Job and HDFS administration - Avkash Chauhan's Blog - Site Home - MSDN Blogs
  6. Apache Hadoop on Windows Azure Part 5 - Running 10GB Sort Hadoop Job with Teragen, TeraSort and TeraValidate Options - Avkash Chauhan's Blog - Site Home - MSDN Blogs
  7. Apache Hadoop on Windows Azure Part 6 - Running 10GB Sort Hadoop Job with TeraSort Option and understanding MapReduce Job administration - Avkash Chauhan's Blog - Site Home - MSDN Blogs
  8. Apache Hadoop on Windows Azure Part 7 – Writing your very own WordCount Hadoop Job in Java and deploying to Windows Azure Cluster - Avkash Chauhan's Blog - Site Home - MSDN Blogs
  9. Apache Hadoop on Windows Azure Part 8 – Hadoop Map/Reduce Administration from command line in Cluster - Avkash Chauhan's Blog - Site Home - MSDN Blogs
  10. Apache Hadoop on Windows Azure Part 9 – Using Interactive JavaScript for Data Visualization - Avkash Chauhan's Blog - Site Home - MSDN Blogs
  11. Apache Hadoop on Windows Azure Part 10 - Running a JavaScript Map/Reduce Job from Interactive JavaScript Console - Avkash Chauhan's Blog - Site Home - MSDN Blogs
  12. Apache Hadoop on Windows Azure: How Hadoop cluster was setup on Windows Azure - Avkash Chauhan's Blog - Site Home - MSDN Blogs
  13. Apache Hadoop on Windows Azure: Connecting to Windows Azure Storage from Hadoop Cluster - Avkash Chauhan's Blog - Site Home - MSDN Blogs
  14. Using Windows Azure Blob Storage (asv://) for input data and storing results in Hadoop Map/Reduce Job on Windows Azure - Avkash Chauhan's Blog - Site Home - MSDN Blogs
  15. Apache Hadoop on Windows Azure: Few tips and tricks to manage your Hadoop cluster in Windows Azure - Avkash Chauhan's Blog - Site Home - MSDN Blogs
  16. Apache Hadoop on Windows Azure: Few tips and tricks to manage your Hadoop cluster in Windows Azure - Avkash Chauhan's Blog - Site Home - MSDN Blogs
  17. Apache Hadoop on Windows Azure : Running Hive Scripts from Interactive Hive Console - Avkash Chauhan's Blog - Site Home - MSDN Blogs
  18. Running Apache Pig (Pig Latin) at Apache Hadoop on Windows Azure - Avkash Chauhan's Blog - Site Home - MSDN Blogs
  19. Setting Windows Azure Blob Storage (asv) as data source directly from Portal at Hadoop on Azure - Avkash Chauhan's Blog - Site Home - MSDN Blogs