Pigの弱み
作者:kosuke
参考文献:Tom White(2009/6/16) Hadoop: The Definitive Guide O'REILLY 501pp
Pigは全てのタスクに有用というわけではない。例えば、大きなデータからある一部分の小さいデータを触ることができない.一度全体の大きなデータをスキャンしなければならない。一方MapReduceプログラミングはバッチ処理であるためそういった部分的な処理ができる。
また、PigはMapReduceプログラムより、遅い。PigのクエリをいちいちMapReduceジョブに変換しているため、どうしても遅くなる。しかし、その遅さも、Pig開発チームによって、徐々に改善している。
