wiki:HadoopCombine

Version 1 (modified by kosuke, 10 years ago) (diff)

--

Combineとは?(参考:Googleを支える技術)

作者:kosuke

Mapperがkey-valueを出力するとき、key-valueはメモリ上にある。これを効率的に利用することによって処理速度を高める機能。また、中間ファイル(SequenseFile?)があまりにも大きくなってしまって、その容量を節約したい時に使う。