Amazon SageMaker Unified StudioのVisual ETLでデータプレビュー高速化
Amazon SageMaker Unified Studio now supports faster data preview in Visual ETL
概要
Amazon SageMaker Unified StudioはVisual ETLに新しいデータプレビューv2.0を導入し、ほぼ瞬時の結果表示を実現しました。ブラウザ内クエリエンジンを使用してデータをローカル処理することで、サーバー側のSparkセッション起動が不要になり、追加コスト無しで約1秒で各変換の出力を確認できます。S3、Redshift、Snowflakeなど多数のデータソースに対応し、開発者はより迅速にETLジョブを反復開発できるようになります。
何が変わったか
- ・ブラウザ内クエリエンジンの導入により、サーバー側Sparkセッション起動が不要に
- ・データプレビュー時間を約1秒に短縮し、セッション起動コストを削減
- ・S3、Redshift、Snowflakeなど複数のデータソースに対応し、ブラウザキャッシング機能を搭載
影響
ユーザーは迅速なETL開発イテレーションが可能になり、プロダクティビティが向上します。Redshift環境ではプレビュー処理による本番クラスタへの負荷が軽減されます。
対象ユーザー
データエンジニアデータアナリストETL開発者AWS SageMaker Unified Studioユーザー
まとめ
ETL開発のデータプレビュー処理をブラウザ内で高速化し、開発効率と本番環境の安定性を両立させた機能強化といえます。
原文タイトル
Amazon SageMaker Unified Studio now supports faster data preview in Visual ETL
AWS公式アナウンスを読む →