本文へスキップ

Parquetとは?

ぱーけっと

列指向のビッグデータストレージフォーマット。

Hadoop・Sparkエコシステム向けに開発された列指向バイリストレージフォーマットで、圧縮率と集計クエリのI/O効率に優れビッグデータ解析の標準になっている。

使い方・例文

AWS S3にParquetで格納したデータをAthenaでSQLクエリすると、列指向のため必要列だけ読み取られスキャン料金が大幅に減る。

この用語をシェア

𝕏 でポスト LINE

最終更新:

関連用語