wiki:PigAdvantage

Version 3 (modified by kosuke, 10 years ago) (diff)

--

Pigの強み

作者:kosuke

参考文献:Tom White(2009/6/16) Hadoop: The Definitive Guide O'REILLY 501pp

Pigの強みは簡単にMapReduce処理ができる(hadoopモードのみ)ところにある。

Pigで扱うデータは自動的にMapReduceジョブに変換される。よって、データをどういう風に分析したいかだけ書けばMapReduce処理が実行される.

また、はるかにMapやReduceを書くより簡単に処理できる。例えば、JavaでMapReduce処理をしようとすると、コンパイルやパッケージングなどさまざまなめんどくさい作業を必要とする。しかし、Pigはスクリプト言語(かつSQLのように扱える)であるので、そういった作業を必要としない。また、Streaming(Script言語でMapやReduceをかけるようにしてくれる機能)を使ってpythonやRubyなどで MapReduce処理を使用としても、ジョブをサブミットしなければならず面倒くさいことがある。しかし、Pigの場合は、SQLのようにコンソールに数行クエリを書くだけでMapReduce処理ができる。(つまり、インタラクティブシェルみたいに使える)