AWS

タグ:

#HyperPod

2件のアップデート

SageMaker2026年3月25日

Amazon SageMaker HyperPod、Slurm対応クラスターの継続的プロビジョニングに対応

Amazon SageMaker HyperPodがSlumオーケストレーターを使用するクラスターに対して継続的プロビジョニング機能を拡張しました。これにより、インスタンスグループの一部が完全にプロビジョニングされなくても、利用可能なインスタンスでトレーニングジョブをすぐに開始できるようになりました。複数インスタンスグループの同時スケーリングが可能になり、マニュアル介入なしでクラスターが目標規模に到達することを保証します。

SageMaker2026年3月16日

SageMaker HyperPodがアイドルリソース共有による動的クラスタ利用をサポート

Amazon SageMaker HyperPodのタスク統治機能が、保証されたクォータを超える未割り当てコンピュートリソースの動的共有をサポートするようになりました。管理者はアクセラレータ、vCPU、メモリなどのリソースタイプごとに借用制限を設定できます。高額なコンピュートインスタンスのアイドル化を自動的に検出して効率的に再配置することで、クラスタ利用率の向上と公平なリソース分配が実現します。