本文へスキップ

推論サーバーとは?

すいろんさーばー

学習済みAIモデルをリクエストに応じて実行するサービス基盤。

機械学習モデル学習が終わった後に、リアルタイムリクエストを受けてモデルの推論(予測・生成)を実行する専用のサーバー・サービス基盤のこと。

使い方・例文

推論サーバーのオートスケールにより、アクセスが集中した時間帯もレイテンシを100ms以下に維持できた。

この用語をシェア

𝕏 でポスト LINE

最終更新:

関連用語