本文へスキップ

Apache ORCとは?

あぱっちおーあーるしー

Hive向けに設計されたHadoopエコシステムの列指向データフォーマット。

Parquetと並ぶ代表的な列指向フォーマットでHiveとSparkが最適化されブルームフィルタインデックス埋め込みで読み取りを高速化する。

使い方・例文

HiveテーブルをORC形式で保存しクエリ速度をTextFileの20倍に改善した。

この用語をシェア

𝕏 でポスト LINE

最終更新:

関連用語