La migración de datos a la cloud hace referencia al proceso de trasladar datos on-premise a una nueva ubicación de almacenamiento en la cloud. La mayoría de las aplicaciones requieren el almacenamiento de datos durante la progresión hacia la cloud.
Existen tres maneras básicas de enfocar la migración del almacenamiento, aunque una organización puede desarrollarlas todas al mismo tiempo.
Un único movimiento de "elevación y transferencia".
Este método puede ser necesario antes de poder comenzar nuevas cargas de trabajo en la cloud.
Un modelo híbrido orientado hacia las instalaciones.
Con este método, los almacenes de datos heredados pueden trasladarse a la cloud con el tiempo.
Un modelo híbrido orientado hacia la cloud.
Un modelo que suele resultar de proyectos nativos en la cloud de nuevo diseño, combinados con datos on-premise heredados.
La abrumadora realidad del transporte de datos se aplica a la mayoría de proyectos. ¿Cómo puede trasladarse con fluidez de la ubicación actual a la nueva cloud, con el mínimo de interrupción, costo y tiempo? ¿Cuál es la forma más inteligente de hacer efectivo el traslado de sus GB, TB o PB de datos?
Se trata de un problema subyacente básico: ¿qué cantidad de datos puede trasladar, a qué distancia y con qué rapidez? Para la mejor situación posible, utilice esta fórmula:
Número de días = (Bytes totales)/(Megabits por segundo * 125 * 1 000 * Uso de red * 60 segundos * 60 minutos * 24 horas)
Por ejemplo, si tiene una conexión T1 (1,544 Mbps) y 1 TB (1024 * 1024 * 1024 * 1024 bytes) que introducir o sacar de AWS, el tiempo mínimo teórico que tardaría en cargarse a través de la conexión de red a un uso de red del 80% sería 82 días.
Relájese. Ya hemos hecho esto antes. Hemos podido constatar que los clientes abordan esta cuestión de dos formas: utilizan herramientas de migración no administradas muy básicas para trasladar los datos o seleccionan uno de los conjuntos de servicios de Amazon.
Como regla básica general, para obtener los mejores resultados sugerimos lo siguiente:
| Conexión | Escala de datos | Método |
| Menos de 10 Mbps | Menos de 500 GB | No administrada |
| Más de 10 Mbps | Más de 500 GB | Administrada |
Existen métodos sencillos en un solo procedimiento para trasladar datos en escalas pequeñas desde su sitio hacia el almacenamiento en la cloud de Amazon.
- rsync. Los clientes utilizan esta herramienta de código abierto para copiar datos directamente en buckets de S3.
- Interfaz de línea de comandos de S3. Los clientes utilizan la CLI de Amazon S3 para escribir comandos que permiten trasladar datos hacia buckets de S3.
- Interfaz de línea de comandos de Glacier. Los clientes utilizan la CLI de Amazon Glacier para trasladar datos hacia almacenes de Glacier.
El conjunto de servicios de migración creado por Amazon incluye varios métodos distintos que le ayudan a administrar esta tarea de forma más eficiente. Plantéeselos en dos categorías:
- Optimización o sustitución de Internet. Nunca se debe subestimar el ancho de banda de un camión semirremolque cargado de discos recorriendo a toda velocidad la autopista. Estos métodos son idóneos para trasladar grandes archivos, repositorios de datos masivos o en situaciones en las que el ancho de banda y los volúmenes de datos no son realistas.
- Interfaces intuitivas para S3. Estos métodos facilitan el uso de S3 con sus aplicaciones nativas existentes. En lugar de elevar y transferir conjuntos de datos grandes de una vez, le ayudan a integrar flujos de procesos existentes como backup y recuperación o las transmisiones continuas del Internet de las cosas directamente con el almacenamiento en la cloud.
| Si necesita: | Considere: |
|---|---|
| Una conexión a Internet optimizada o de sustitución para: |
|
conectarse directamente a un centro de datos regional de AWS |
AWS Direct Connect |
Migre petabytes de datos en lotes a la cloud |
AWS Import/Export Snowball |
Migre trabajos periódicos con cambios incrementales a largas distancias |
Amazon S3 Transfer Acceleration |
| Una interfaz intuitiva directamente a S3 para: |
|
almacenar localmente datos en caché en un modelo híbrido (por motivos de desempeño) |
Gateways (AWS o socio) |
Enviar backups o archivos a la cloud con interrupciones mínimas |
Asociaciones de tecnología |
recopilar e incorporar varias fuentes de datos de streaming |
Amazon Kinesis Firehose |
También es posible combinar servicios para obtener resultados óptimos. Considere estos ejemplos:
Varios Snowball que se ejecutan en paralelo
Direct Connect y una asociación de tecnología
Direct Connect y Transfer Acceleration
Transfer Acceleration y una Storage Gateway o una asociación de tecnología
¿Necesita ayuda con un caso concreto? Deje que le ayudemos.
Estos métodos de migración mejoran o sustituyen Internet para elevar y transferir datos desde la ubicación actual directamente a los centros de datos de Amazon. No se admiten trabajos de desarrollo o API, y las transferencias pueden afectar a los procesos en las instalaciones existentes.
Explore nuestros paquetes de socio de Direct Connect que ayudan a ampliar las tecnologías en las instalaciones hacia la cloud.
El cliente selecciona una conexión física dedicada de Direct Connect para acelerar las transferencias de red entre sus centros de datos y los nuestros.
AWS Direct Connect le permite establecer una conexión de red dedicada entre su red y una de las ubicaciones de AWS Direct Connect. Mediante VLAN 802.1q, estándares de la industria, esta conexión dedicada se puede particionar en varias interfaces virtuales. Esto le permite utilizar la misma conexión para obtener acceso a recursos públicos como, por ejemplo, objetos almacenados en Amazon S3 utilizando un espacio de direcciones IP públicas y a recursos privados como, por ejemplo, instancias de Amazon EC2 que se ejecuten dentro de una Amazon Virtual Private Cloud (VPC) utilizando un espacio de IP privado al tiempo que se mantiene la separación de red entre los entornos públicos y privados. Las interfaces virtuales se pueden reconfigurar en cualquier momento para que satisfagan las distintas necesidades.
Más información acerca del servicio de Direct Connect.
Snowball es una solución de transferencia de datos con escalado de petabytes que usa dispositivos seguros para transferir grandes volúmenes de datos hacia y desde AWS. La utilización de Snowball permite atajar los desafíos propios de las transferencias de datos a gran escala, entre otros, los altos costos de red, los largos períodos de transferencias y los riesgos de seguridad. La transferencia de datos con Snowball resulta sencilla, rápida y segura, por un precio que supone solo una quinta parte del costo de Internet de alta velocidad.
Más información acerca del servicio de Snowball.
|
|||||||||||||||||
Amazon S3 Transfer Acceleration incrementa la velocidad de las transferencias a Amazon S3 a través del Internet público. Puede maximizar su ancho de banda independientemente de la distancia o de las variaciones en la capacidad de Internet, sin necesidad de clientes especiales o protocolos de red propios. Simplemente cambie el extremo que utiliza con el bucket de S3 y se aplicará la aceleración automáticamente.
Es ideal para trabajos periódicos que se transfieren de una parte a otra del mundo, como cargas de medios, backups y tareas de procesamiento de datos locales que se envían de forma frecuente a una ubicación central.
Obtener más información acerca de Transfer Acceleration
En ocasiones la interrupción no es una opción. Cuando los almacenes de datos heredados pueden migrarse gradualmente a lo largo del tiempo, o cuando se agregan nuevos datos desde fuentes no basadas en la cloud, estos servicios son una buena opción. Estos servicios de migración pueden aprovechar o complementar las instalaciones existentes como el software de backup y recuperación o una SAN, y también puede programar el servicio de AWS Firehose en sus propias aplicaciones.
Una gateway se ubica en las instalaciones y enlaza su entorno con la cloud de AWS. Es una solución idónea para situaciones híbridas en las que se necesita cierto almacenamiento localmente por motivos de desempeño o conformidad, pero parte se puede descargar en S3.
Plantéese combinar el servicio de AWS Direct Connect con su gateway para garantizar un desempeño óptimo.
El servicio de AWS Storage Gateway simplifica la adopción en las instalaciones de almacenamiento de AWS. Las aplicaciones existentes utilizan protocolos de almacenamiento estándar del sector para conectarse a un dispositivo de software que almacena los datos en Amazon S3 y Amazon Glacier.
- Los datos se comprimen y se transfieren de forma segura a AWS.
- Las configuraciones de red de área de almacenamiento (SAN) ofrecen dispositivos almacenados o en caché con backups de un momento dado como snapshots de Amazon EBS.
- La configuración de biblioteca de cintas virtuales (VTL) funciona con su software de backup existente para realizar backups rentables en Amazon S3 y archivado a largo plazo en Amazon Glacier.
Más información acerca de AWS Storage Gateway.
AWS se ha asociado con una serie de proveedores del sector para el uso de dispositivos de gateway física que cierran la brecha entre el backup tradicional y la cloud. Enlace los datos en las instalaciones existentes con la cloud de Amazon para realizar el traslado sin que se vea afectado el desempeño y conservando los catálogos de backups existentes.
- Se integra a la perfección en la infraestructura existente
- Puede ofrecer anulación de duplicación, compresión, cifrado o aceleración de WAN
- Almacena en caché backups recientes localmente, lo almacena todo en la cloud de AWS
Más información acerca de asociaciones de gateway.
Amazon se ha asociado con proveedores del sector para facilitar en gran medida el traslado de las backups y los archivos a la cloud. La forma más sencilla de trasladar sus datos puede ser a través de un conector de S3 integrado en su software de backup existente. La principal ventaja de este enfoque es que el catálogo de backups sigue siendo coherente, por lo que mantiene la visibilidad y el control en todos los trabajos que abarcan disco, cinta y la cloud.
Más información acerca de las asociaciones de tecnología y la conectividad integrada.
Amazon Kinesis Firehose es la forma más fácil de cargar los datos de streaming en AWS. Puede capturar y cargar automáticamente los datos de streaming en Amazon S3 y Amazon Redshift para habilitar el análisis casi en tiempo real con las herramientas de inteligencia empresarial existentes y los paneles que ya usa. Es un servicio totalmente administrado que escala automáticamente para ajustarse al desempeño de los datos y no requiere una administración permanente. También puede disponer en lotes, comprimir y cifrar los datos antes de cargarlos para minimizar la cantidad de almacenamiento utilizado en el destino y aumentar la seguridad. Puede crear fácilmente una transmisión de entrega de Firehose desde la consola de administración de AWS, configurarla con unos clics y comenzar a enviar datos a la transmisión desde cientos de miles de fuentes de datos para que se carguen continuamente en AWS, y todo en pocos minutos.
Más información acerca de AWS Kinesis Firehose.