本文へスキップ

知識蒸留とは?

ちしきじょうりゅう

大きなモデルの知識を小さなモデルに転移してコンパクトなモデルを作る手法。

きくて高精度な教師モデルの出力(ソフトラベル)を使って小さな生徒モデルを学習させることで小型モデルの精度を向上させるモデル圧縮手法。

使い方・例文

BERTを知識蒸留したDistilBERTはサイズが40%小さいが精度の97%を保つ。

この用語をシェア

𝕏 でポスト LINE

最終更新:

関連用語