wiki:HiveDataModel

Hiveのデータモデルについて

作者:kosuke

参考: http://www.facebook.com/note.php?note_id=89508453919

Hiveは、テーブルとプロパティで構成されている。この、テーブルとプロパティはHDFS上で保管されている。当たり前ではあるが、プロパティを賢くわけることによって他のプロパティから検索をかける必要がないため高速に処理できる。

パーティションは、ファイルの名前によって管理されている。テーブルやパーティションの列は、RDBと同じようにint,double,float,stringやもっと複雑なタイプも対応している。