Changes between Version 1 and Version 2 of PigGrunt


Ignore:
Timestamp:
11/11/09 07:52:32 (10 years ago)
Author:
kosuke
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • PigGrunt

    v1 v2  
    77以下に書くのは、Gruntを使ってPigを動かした簡単な例です。 
    88 
    9  例えば、年、温度、データの信頼性、の三つの要素が書かれているテキストファイルの最高温度とその年を解析して表示させるコマンドを紹介する。 
     9例えば、年、温度、データの信頼性、の三つの要素が書かれているテキストファイルの最高温度とその年を解析して表示させるコマンドを紹介する。 
    1010 
    1111'''1.テキストファイルを生成する。''' 
    1212 
    1313 年、温度(測定不能の場合は9999にする)、データの信頼性(0,1,4,5,9の5段階で評価されている)の三つの要素がtabで区切られているテキストファイルを作る。例えば以下のようにすればよい。temperature.txtで保存する. 
    14 {{ 
     14{{{ 
    15151990  34  1 
    16161432  32  9999 
     
    24241432  23  5 
    25251990  12  9 
    26 }} 
     26}}} 
    2727 
    2828'''2.Pig実行''' 
     
    4848 '''grunt>DUMP records;''' 
    4949 
    50   以下のような結果が表示されれば成功。たぶんDUMPを実行した時にはじめて処理が実行されるんだと思う。 
     50 以下のような結果が表示されれば成功。たぶんDUMPを実行した時にはじめて処理が実行されるんだと思う。 
    5151{{{ 
    5252(1990,34,1) 
     
    8282 '''grunt>DUMP filtered_records;''' 
    8383 
    84    以下の用に表示されれば成功である. 
     84 以下の用に表示されれば成功である. 
    8585{{{ 
    8686(1990,34,1) 
     
    129129 '''DUMP max_temp;''' 
    130130 
    131   以下の用に表示されれば成功です。 
     131 以下の用に表示されれば成功です。 
    132132{{{ 
    133133(1254,22) 
     
    141141'''9.補足:もっと高級に表示させる。''' 
    142142 
    143   DUMPではただのタプルが表示されているだけで、どの要素がどういう名前を持っているのか一目でわかりません。また、どれとどれがリレーションしているのかもわかりません。こういったことが一目でわかりやすく表示させるためにはILLUSTRATEコマンドを使うことが有効です. 
     143 DUMPではただのタプルが表示されているだけで、どの要素がどういう名前を持っているのか一目でわかりません。また、どれとどれがリレーションしているのかもわかりません。こういったことが一目でわかりやすく表示させるためにはILLUSTRATEコマンドを使うことが有効です. 
    144144 
    145145 '''grunt>ILLUSTRATE max_temp;''' 
     
    181181------------------------------------------- 
    182182}}} 
    183 この様に表示れれば成功です。 
     183 この様に表示れれば成功です。 
    184184 
    185185'''10.hadoopモード(シングルノード)とローカルモードの比較'''