データは、クラウドアプリケーションを正常にデプロイする基礎です。評価と計画のプロセスでは、オンプレミスのロケーションからクラウドへのデータ移行に伴う物理的な限界が焦点となる場合があります。Amazon には、ネットワーク、物理的移動およびテクノロジーパートナー経由でのデータ移行をサポートするツール一式が提供されています。
ほとんどのプロジェクトのデータ転送は、圧倒されるようなタスクになります。最低限の中断、コスト、および時間で、現在の場所から新しいクラウドへ適切に移動することや、ペタバイト規模になる場合もある膨大なデータを実際にスマートに移動することについて、
また最も基本的な問題として、どれほどのデータを、どれほど遠くまで、どれほど速く移動できるかを考慮する必要があります。理想的な環境では、以下の式を使用できます。
日数 =(合計バイト数)/(メガビット/秒 * 125 * 1000 * ネットワーク利用率 * 60 秒 * 60 分 * 24 時間)
例えば、T1 接続 (1.544Mbps) を備えており、1 TB(1024 * 1024 * 1024 * 1024 バイト) を AWS 内外へ移動する場合、80% のネットワーク利用率のネットワーク接続での読み込みにかかる理論的最小時間は 82 日です。
ご安心ください。AWS には経験があります。データの移動にアンマネージド型で非常に基本的な機能しかない移行ツールを使用する場合と、Amazon のサービス一式のうちいずれかのサービスを選択して使用する場合では、結果が大きく異なります。
経験に基づく、私たちのご提案は以下の通りです。
| 接続 | データの大きさ | メソッド |
| 10 Mbps 未満 | 500 GB 未満 | アンマネージド型 |
| 10 Mbps 以上 | 500 GB 以上 | マネージド型 |
小規模なデータであれば、お客様のサイトから Amazon のクラウドストレージへの移行を 1 度限りで行える簡単な方式があります。
- rsync。このオープンソースツールを使用すると、データを S3 バケットに直接コピーできます。
- S3 コマンドラインインターフェイス。Amazon S3 CLI を使用すると、S3 バケットにデータを移動するコマンドを記述できます。
- Glacier コマンドラインインターフェイス。Amazon Glacier CLI を使用すると、データを Glacier のボールトに移動できます。
Amazon で作成された移行サービスの一式には、お客様がこのタスクをより効率的に管理するのに役立つ複数の方法が含まれています。それらを 2 つのカテゴリに分類すると以下のようになります。
- インターネットの最適化または置き換え。データをディスクに保存して物理的に輸送する方法も効率が低いわけではありません。このような方法は、大きなアーカイブやデータレイクを移動する場合、または単にそのデータボリュームを移行するのに帯域幅が実際的でない場合に理想的です。
- S3 を簡単に使用するためのインターフェイス。これらの方法により、既存のネイティブアプリケーションで S3 を簡単に使用できるようになります。一度に大きなデータセットのリフトとシフトを行う代わりに、バックアップと復旧、または継続的な IoT のストリームといった既存のプロセスフローとクラウドストレージを統合するのに役立ちます。
| 要件: | 検討対象: |
|---|---|
| インターネット接続の最適化または置き換え |
|
AWS リージョン内のデータセンターに直接接続する |
AWS Direct Connect |
ペタバイト単位のデータのクラウドへのバッチでの移行 |
AWS Import/Export Snowball |
増分的な変更を伴う定期的なジョブの長距離での移行 |
Amazon S3 Transfer Acceleration |
| S3 を直接簡単に使用するためのインターフェイス |
|
ハイブリッドモデルでデータをローカルにキャッシュする (パフォーマンス上の理由) |
ゲートウェイ (AWS またはパートナー) |
最小限の中断でクラウドにバックアップまたはアーカイブをプッシュする |
テクノロジーパートナーシップ |
ストリーミングデータの複数のソースを収集して取り込む |
Amazon Kinesis Firehose |
最善の結果を出すために、複数のサービスを組み合わせることもできます。以下の組み合わせを検討してください。
複数の Snowballs の並列稼働
Direct Connect とテクノロジーパートナーシップ
Direct Connect と Transfer Acceleration
Transfer Acceleration と Storage Gateway またはテクノロジーパートナーシップ
特殊なケースのお客様は、AWS でサポートします。
これらの移行方法をインターネットの補強または置き換えとして使用し、データを現在のロケーションからリフトして、直接 Amazon のデータセンターにシフトできます。開発作業や API はサポートされないため、データ転送によって既存のオンプレミスのプロセスが影響を受けることはありません。
オンプレミステクノロジーをクラウドに拡張するのに役立つ Direct Connect パートナーバンドルについてご覧ください。
Direct Connect の物理的な専用接続を使用すると、社内データセンターと AWS のデータセンターの間のネットワーク転送の速度を上げることができます。
AWS Direct Connect では、お客様のネットワークと AWS Direct Connect のいずれかのロケーション間に専用のネットワーク接続を確立できます。業界標準の 802.1q VLAN を使用して、この専用接続を複数の仮想インターフェースに分割することができます。このようにすると、同じ接続を使用して、パブリックリソース(例えば Amazon S3 に格納されたオブジェクト)にはパブリック IP アドレススペースを使用してアクセスし、プライベートリソース(例えば Amazon Virtual Private Cloud(VPC)内で実行されている Amazon EC2 インスタンス)にはプライベート IP スペースを使用してアクセスすることができるので、パブリック環境とプライベート環境の間でネットワークを分離できます。仮想インターフェイスは、ニーズの変化に合わせていつでも再構成できます。
Direct Connect サービスの詳細については、こちらをご覧ください。
Snowball はセキュアなアプライアンスを使用したペタバイト規模のデータ転送ソリューションで、AWS 内外に大容量データを転送できます。Snowball を使用すると、ネットワークのコストが高い、転送時間が長い、セキュリティに懸念があるといった大容量データの転送に関する一般的な課題を解決できます。Snowball を使うとデータを簡単、迅速、安全に転送でき、コストは高速インターネットの 5 分の 1 ほどで済みます。
Snowball サービスの詳細については、こちらをご覧ください。
|
|||||||||||||||||
Amazon S3 Transfer Acceleration を使用すると、Amazon S3 へのパブリックインターネット経由の転送がより迅速になります。距離やインターネットの状況に関係なく、使用可能な帯域幅を最大化できます。また、特殊なクライアントや独自のネットワークプロトコルはありません。S3 バケットで使用するエンドポイントを変更するのみで、加速が自動的に適用されます。
これは、メディアのアップロード、バックアップ、ローカルデータの処理タスクなど、世界各地から中央の拠点に定期的に転送される定期的なジョブに適しています。
Transfer Acceleration の詳細については、こちらをご覧ください。
データ移動を中断できない状況もあります。レガシーデータストアを時間をかけて段階的に移行する場合、または新しいデータを多くの非クラウドソースから集約する場合には、これらのサービスが適しています。これらの移行サービスによって、バックアップと復旧のソフトウェアや SAN のような既存のリソースを活用および補完でき、AWS Firehose サービスをプログラムとしてお客様のアプリケーションに組み込むこともできます。
ゲートウェイはオンプレミスで設定されており、お客様の環境と AWS クラウドを接続します。ゲートウェイはパフォーマンスやコンプライアンスの理由によりローカルでストレージが必要なハイブリッドシナリオでは理想的なソリューションですが、データを S3 にオフロードできる場合もあります。
パフォーマンスの最適化のため、AWS Direct Connect サービスとお客様のゲートウェイの併用をご検討ください。
AWS Storage Gateway サービスを使用すれば、オンプレミスでの AWS ストレージの導入が簡単にできます。既存のアプリケーションで、業界標準のストレージプロトコルを使用して、Amazon S3 と Amazon Glacier にデータを保存するソフトウェアアプライアンスに接続します。
- データは圧縮され、AWS に安全に転送されます。
- ストレージエリアネットワーク (SAN) 設定を使用すれば、複数のデバイスを使用して、ポイントインタイムのバックアップを Amazon EBS スナップショットとしてキャッシュまたは保存できます。
- 仮想テープライブラリ (VTL) 設定と既存のバックアップソフトウェアを連携させることで、Amazon S3 でコスト効果の高いバックアップを作成し、Amazon Glacier で長期的なアーカイブを行えます。
AWS Storage Gateway の詳細については、こちらをご覧ください。
AWS では、従来のバックアップとクラウドを橋渡しする物理ゲートウェイアプライアンスに関連して、業界内の多くのベンダーとパートナーシップを組んでいます。既存のオンプレミスデータを Amazon のクラウドに接続し、パフォーマンスに影響を与えずに、また既存のバックアップカタログを維持しながらデータを移行できます。
- 既存のインフラストラクチャとのシームレスな統合
- 重複の排除、圧縮、暗号化、または WAN の高速化などを提供
- 最近のバックアップをローカルでキャッシュし、すべてを AWS クラウドのボールトに保管
ゲートウェイパートナーシップの詳細については、こちらをご覧ください。
Amazon では、お客様がバックアップとアーカイブを非常に簡単にクラウドで行えるよう、業界内のベンダーとパートナーシップを組んでいます。データの移動では、既存のバックアップソフトウェアに埋め込まれた S3 コネクタを経由することが最も簡単な方法である場合があります。このアプローチの明確なメリットは、バックアップカタログが一貫性のあるものになり、ディスク、テープ、およびクラウドにまたがるジョブ全体で可視性と制御性を維持できることです。
テクノロジーパートナーシップと埋め込み接続の詳細については、こちらをご覧ください。
Amazon Kinesis Firehose は、ストリーミングデータを AWS にロードする最も簡単な方法です。ストリーミングデータをキャプチャして Amazon S3 および Amazon Redshift に自動的にロードし、現在お使いのビジネスインテリジェンスツールやダッシュボードでほぼリアルタイムに分析することが可能です。完全マネージド型サービスのため、データスループットに応じて自動的にスケールされ、継続的な管理は不要です。ロード前にデータのバッチ処理、圧縮処理、暗号化が行われるため、ロード先でのストレージ量を最小化し、セキュリティを強化できます。AWS マネジメントコンソールから Firehose のデリバリーストリームを簡単に作成し、数回のクリックで設定を行い、継続的に AWS にロードされる数十万のデータソースからデータのストリーミングを開始できます。これらすべての操作にかかる時間はわずか数分です。
AWS Kinesis Firehose の詳細については、こちらをご覧ください。