wiki:PigWeakPoint

Version 1 (modified by kosuke, 10 years ago) (diff)

--

Pigの弱み

作者:kosuke

参考:オライリー Hadoop p301〜

Pigは全てのタスクに有用というわけではない。例えば、大きなデータからある一部分の小さいデータを触ることができない.一度全体の大きなデータをスキャンしなければならない。一方MapReduceプログラミングはバッチ処理であるためそういった部分的な処理ができる。

また、PigはMapReduceプログラムより、遅い。PigのクエリをいちいちMapReduceジョブに変換しているため、どうしても遅くなる。しかし、その遅さも、Pig開発チームによって、徐々に改善している。