데이터는 클라우드 응용 프로그램을 성공적으로 배포할 수 있는 주춧돌입니다. 평가 및 계획 프로세스는 온프레미스 위치에서 클라우드로 데이터를 마이그레이션하는 데 따른 근본적인 물리적 한계를 구체화하는 데 효과적입니다. Amazon은 네트워크, 여정 및 기술 파트너를 통해 데이터를 마이그레이션할 수 있는 다양한 도구를 제공하고 있습니다.
데이터 전송의 벅찬 현실은 대부분 프로젝트에 해당합니다. 최소한의 중단, 비용 및 시간으로 현재 위치에서 새로운 클라우드로 원활하게 이전하려면 어떻게 해야 합니까? 실제로 GB, TB 또는 PB 규모의 데이터를 이전하는 가장 똑똑한 방법은 무엇입니까?
얼마나 많은 데이터를 얼마나 멀리 얼마나 빠르게 옮길 수 있는지는 기본적인 질문입니다. 최고의 시나리오를 위해 다음 공식을 사용하십시오.
일 수 = (총 바이트 수)/(초당 메가비트 수 * 125 * 1,000 * 네트워크 사용률 * 60초 * 60분 * 24시간)
예를 들어 T1 연결(1.544Mbps) 상태에서 1TB(1,024 * 1,024 * 1,024 * 1,024바이트)를 AWS에서 송신 또는 수신하는 경우, 네트워크 사용률이 80%인 네트워크 연결을 통해 데이터를 로드하는 데 걸리는 시간은 이론적으로 최소 82일입니다.
놀라지 마십시오. AWS는 충분한 경험이 있습니다. 고객은 2가지 접근 방식을 사용합니다. 매우 기본적인 비관리형 마이그레이션 도구를 사용하여 데이터를 이전하거나, Amazon의 서비스 제품군 중 하나를 선택합니다.
일반적인 경험에 근거한 기준에 따르면 최적의 결과를 얻기 위해서는 다음을 따르는 것이 좋습니다.
| 연결 | 데이터 규모 | 방법 |
| 10Mbps 미만 | 500GB 미만 | 비관리형 |
| 10Mbps 이상 | 500GB 이상 | 관리형 |
작은 규모의 데이터를 사이트에서 Amazon 클라우드 스토리지로 한 번에 쉽게 이동할 수 있는 방법이 있습니다.
- rsync. 고객은 이 오픈 소스 도구를 사용하여 데이터를 S3 버킷으로 바로 복사합니다.
- S3 명령줄 인터페이스 고객은 Amazon S3 CLI를 사용하여 데이터를 S3 버킷으로 이동하도록 명령을 작성할 수 있습니다.
- Glacier 명령줄 인터페이스 고객은 Amazon Glacier CLI를 사용하여 데이터를 Glacier 저장소로 이동할 수 있습니다.
Amazon이 제공하는 마이그레이션 서비스 제품군에서는 이동 작업을 좀 더 효율적으로 관리하는 데 도움이 되는 다양한 방법을 지원합니다. 다음 두 가지 범주에서 이를 고려하시기 바랍니다.
- 인터넷 최적화 또는 교체 디스크를 가득 싣고 고속도로를 질주하는 세미 트럭의 능력을 간과해서는 안 됩니다. 이 방법은 대량 아카이브나 데이터 레이크를 이동하거나 대역폭과 데이터 볼륨이 비현실적으로 큰 경우에 적합합니다.
- S3와 편리한 인터페이스. 이 방법을 사용하면 S3를 간단하게 기존 네이티브 애플리케이션에 사용할 수 있습니다. 한 번에 대규모 데이터 세트를 '리프트 앤 시프트' 방식으로 이동하기보다는 이 방법을 사용하여 백업 및 복구 또는 지속적인 사물 인터넷 스트림과 같은 기존 프로세스 흐름을 직접 클라우드 스토리지와 통합할 수 있습니다.
| 요구 사항: | 고려 사항: |
|---|---|
| 다음을 위해 최적화되거나 교체된 인터넷 연결 |
|
AWS 리전별 데이터 센터에 직접 연결 |
AWS Direct Connect |
페타바이트 규모의 데이터를 배치로 클라우드에 마이그레이션 |
AWS Import/Export Snowball |
반복되는 작업에서 변경된 부분만 먼 거리로 마이그레이션 |
Amazon S3 Transfer Acceleration |
| 다음을 위해 S3와 직접 간편하게 인터페이스 |
|
하이브리드 모델에서 데이터를 로컬로 캐시(성능 목적) |
게이트웨이(AWS 또는 파트너) |
백업 또는 아카이브를 중단이 거의 없이 클라우드에 푸시 |
기술 파트너십 |
여러 스트리밍 데이터 소스를 수집 |
Amazon Kinesis Firehose |
최적의 결과를 위해 여러 서비스를 결합할 수도 있습니다. 아래 예제 참조:
여러 Snowball을 병렬로 실행
Direct Connect 및 기술 파트너십
Direct Connect 및 Transfer Acceleration
Transfer Acceleration 및 Storage Gateway 또는 기술 파트너십
특정 사례를 위한 도움이 필요하십니까? 도와 드리겠습니다.
이 마이그레이션 방법은 데이터를 현재 위치에서 바로 Amazon 데이터 센터로 '리프트 앤 시프트' 방식으로 이동하기 위해 인터넷을 개선하거나 교체하는 방법입니다. 개발 작업이나 API가 지원되지 않으며, 전송이 기존 온프레미스 프로세스에 영향을 줄 수 있습니다.
온프레미스 기술을 클라우드로 확장할 수 있는 Direct Connect 파트너 번들에 대해 알아보십시오.
고객은 자체 데이터 센터와 AWS 데이터 센터 간의 네트워크 전송을 가속화하기 위해 Direct Connect 전용 물리적 연결을 선택합니다.
AWS Direct Connect를 통해 사용자의 네트워크와 AWS Direct Connect 위치 중 하나 사이에 전용 네트워크 연결을 설정할 수 있습니다. 업계 표준의 802.1q VLAN을 사용하여 이 전용 연결을 여러 가상 인터페이스로 나눌 수 있습니다. 이렇게 하면 퍼블릭 환경과 프라이빗 환경 간의 네트워크 분리를 유지하면서도 동일한 연결을 사용하여 퍼블릭 리소스(예: 퍼블릭 IP 주소 공간을 사용하는 Amazon S3에 저장된 객체)뿐 아니라 프라이빗 리소스(예: 프라이빗 IP 공간을 사용하는 Amazon Virtual Private Cloud(VPC)에서 실행되고 있는 Amazon EC2 인스턴스)에도 액세스할 수 있습니다. 가상 인터페이스는 변화하는 요구를 충족하기 위해 언제든지 다시 구성할 수 있습니다.
Direct Connect 서비스에 대해 자세히 알아보기.
Snowball은 안전한 어플라이언스를 사용하여 AWS의 대용량 데이터를 송수신하는 페타바이트 규모의 데이터 전송 솔루션입니다. Snowball을 사용하면 고속 네트워크 비용, 오랜 전송 시간, 보안 문제 등 흔히 발생하는 대규모 데이터 전송과 관련된 문제를 해결할 수 있습니다. Snowball을 통한 데이터 전송은 빠르고 간편하며 안전합니다. 비용 또한 고속 인터넷 비용의 1/5 정도로 저렴합니다.
Snowball 서비스에 대해 자세히 알아보기.
|
|||||||||||||||||
Amazon S3 Transfer Acceleration은 퍼블릭 인터넷을 통해 Amazon S3로 전송되는 속도를 높여줍니다. 거리나 달라지는 인터넷 날씨와 관계없이 대역폭의 가용성을 극대화할 수 있으며, 특별한 클라이언트 또는 소유 네트워크 프로토콜이 필요 없습니다. 사용하는 엔드포인트를 S3 버킷으로 변경하기만 하면, 자동으로 가속화가 적용됩니다.
이 서비스는 미디어 업로드, 백업, 정기적으로 한 곳으로 전송되는 로컬 데이터 처리 작업 등과 같이 전 세계로 이동하는 반복 작업에 적합합니다.
Transfer Acceleration에 대해 자세히 알아보기
중단이 발생해서는 안 되는 경우가 있습니다. 이 서비스는 레거시 데이터 스토어를 시간을 두고 점진적으로 마이그레이션할 수 있거나, 새 데이터가 클라우드가 아닌 다양한 소스에서 집계되고 있는 경우에 적합합니다. 이 마이그레이션 서비스는 백업 및 복구 소프트웨어 또는 SAN과 같은 기존 설치를 활용하거나 보완할 수 있습니다. 또한, AWS Firehose 서비스를 자체 애플리케이션에 프로그래밍할 수도 있습니다.
게이트웨이는 온프레미스에 있으며, 고객의 환경을 AWS 클라우드로 연결합니다. 성능이나 규정 준수 목적으로 일부 스토리지가 로컬에 있어야 하는 하이브리드 시나리오에 적합한 솔루션입니다. 하지만 일부는 S3로 오프로드될 수 있습니다.
AWS Direct Connect 서비스를 게이트웨이와 결합하여 최적의 성능을 확보하는 것도 고려해보십시오.
AWS Storage Gateway 서비스는 AWS 스토리지에서 온프레미스를 간편하게 도입할 수 있게 해줍니다. 기존 애플리케이션에서 업계 표준 스토리지 프로토콜을 사용하여 Amazon S3와 Amazon Glacier에 데이터를 저장하는 소프트웨어 어플라이언스에 연결합니다.
- 데이터는 압축되어 안전하게 AWS로 전송됩니다.
- Storage Area Network(SAN) 구성은 저장되거나 캐시된 디바이스에 Amazon EBS 스냅샷으로 특정 시점 백업을 제공합니다.
- 가상 테이프 라이브러리(VTL) 구성은 기존 백업 소프트웨어와 연동되어 Amazon S3의 비용 효과적인 백업과 Amazon Glacier의 장기 보관을 지원합니다.
AWS Storage Gateway에 대해 자세히 알아보기.
AWS는 기존 백업과 클라우드 간의 차이를 메우는 물리적 게이트웨이 어플라이언스를 공급하는 여러 업체와 협력하고 있습니다. 기존 온프레미스 데이터를 Amazon 클라우드에 연결하여, 성능에 영향을 주지 않고 기존 백업 카탈로그를 유지하면서 데이터를 이동합니다.
- 기존 인프라와 원활하게 통합
- 중복 제거, 압축, 암호화 또는 WAN 가속화 제공
- 최근 백업을 로컬에 캐시, 모든 것을 AWS 클라우드에 저장
게이트웨이 파트너십에 대해 자세히 알아보기.
Amazon Kinesis Firehose는 스트리밍 데이터를 AWS로 로드하는 가장 쉬운 방법입니다. 스트리밍 데이터를 캡처하여 자동으로 Amazon S3 및 Amazon Redshift로 로드하여 기존 비즈니스 인텔리전스 도구 및 이미 사용하고 있는 대시보드를 통해 거의 실시간으로 분석할 수 있습니다. Amazon Kinesis Firehose는 완전관리형 서비스로서 데이터 처리량에 대응하여 자동으로 확장되며 지속적인 관리가 필요 없습니다. 또한, 데이터를 로드하기 전에 배치, 압축 및 암호화하여 대상 스토리지의 사용량을 최소화하고 보안을 강화할 수 있습니다. AWS Management Console에서 Firehose 전송 스트림을 손쉽게 생성하고, 클릭 몇 번으로 구성하고, AWS로 지속적으로 로드되도록 수많은 데이터 소스에서 스트림으로 데이터 전송을 시작할 수 있습니다. 이 모든 작업이 몇 분 만에 완료됩니다.
AWS Kinesis Firehose에 대해 자세히 알아보기.