本文へスキップ

Parquetフォーマットとは?

ぱーけっとふぉーまっと

列指向の圧縮効率が高いオープンなビッグデータファイル形式。

Apache Parquetカラム型の圧縮・エンコードに最適化されたオープンソースバイナリファイルフォーマットでSparkやHiveなどのビッグデータツールと互換性が高くストレージ削減に効果的。

使い方・例文

生ログをParquetフォーマットに変換するだけでS3のストレージ量が4分の1になった。

この用語をシェア

𝕏 でポスト LINE

最終更新:

関連用語