本文へスキップ

量子化(AI)とは?

りょうしか

AIモデルの数値精度を下げてサイズを小さくする技術。

ニューラルネットワークの重みパラメータを浮動小数点数から整数などより低精度の数値に変換してモデルサイズを削減し、推論を高速化する技術。

使い方・例文

INT8量子化を適用したことで推論速度が3倍になりメモリ使用量が75%削減された。

この用語をシェア

𝕏 でポスト LINE

最終更新:

関連用語