推論サーバーとは？

すいろんさーばー

IT・テクノロジー #AI・インフラ

学習済みAI モデルをリクエストに応じて実行するサービス基盤。

機械学習モデルの学習が終わった後に、リアルタイムのリクエストを受けてモデルの推論（予測・生成）を実行する専用のサーバー・サービス基盤のこと。

使い方・例文

推論サーバーのオートスケールにより、アクセスが集中した時間帯もレイテンシを100ms以下に維持できた。

この用語をシェア

𝕏 でポスト LINE

最終更新: 2026年6月25日

関連用語