Amazon Redshift è una soluzione di data warehousing agile, completamente gestita e scalabile a livello di petabyte in grado analizzare i dati in modo semplice e conveniente senza rivoluzionare gli strumenti di business intelligence già in uso. Puoi iniziare con una soluzione di base a un costo di 0,25 USD all'ora, senza impegni né pagamenti anticipati, per poi ricalibrare la capacità fino a petabyte a una tariffa pari a 1.000 USD per terabyte all'anno, meno di un decimo dei costi delle soluzioni tradizionali. Spesso i nostri clienti ottengono una compressione tre volte superiore, che riduce le loro spese di 333 USD all'anno per ogni terabyte di dati non compressi.

Introduzione al data warehousing di Amazon Redshift (3:22)

AUvn49gey8Y-thumb
Scopri il data warehousing di AWS con Amazon Redshift. Amazon Redshift è un servizio di data warehousing potente, agile e completamente gestito che si integra con gli strumenti di analisi esistenti. Bastano pochi clic nella Console di gestione AWS per configurare ed avviare il servizio di data warehousing, pronto per la raccolta di dati senza dover imparare nuovi linguaggi: scopri come. Amazon Redshift si integra a perfezione con gli strumenti di business intelligence esistenti ed è operativo in pochi minuti.

Prova Amazon Redshift gratis

Richiedi la prova gratuita
Ulteriori informazioni

Per 2 mesi avrai a disposizione 750 ore di nodo DC1.Large. Per richiedere la prova gratuita:

Crea un account AWS e accedi alla console di Amazon Redshift

Avvia un cluster Amazon Redshift e seleziona il tipo di nodo DC1.Large

Carica ed elabora i dati senza spese grazie alla prova gratuita per i partner




Amazon Redshift offre elevate prestazioni in elaborazione di query perché le carica in modo parallelo su più nodi e sfrutta una tecnologia di storage basata su colonne che migliora l'efficienza in I/O. Amazon Redshift impiega driver JDBC e ODBC personalizzati scaricabili dalla scheda Connect Client della console, consentendo l'utilizzo di un'ampia gamma di client SQL comuni. È anche possibile impiegare driver PostgreSQL JDBC e ODBC standard. La velocità di carico dei dati può essere ridimensionata in modo lineare a seconda delle dimensioni del cluster, sfruttando l'integrazione con Amazon S3, Amazon DynamoDB, Amazon Elastic MapReduce, Amazon Kinesis o qualsiasi host compatibile con SSH.

L'architettura di data warehousing di Amazon Redshift consente di automatizzare la maggior parte delle attività di amministrazione più comuni associate a provisioning, configurazione e monitoraggio di un data warehouse su cloud. I backup su Amazon S3 sono continui, incrementali e automatici. Il ripristino di dati è rapido; l'elaborazione di query è pronta in pochi minuti, mentre lo spool dei dati viene eseguito in background. Abilitare le funzioni di disaster recovery su più regioni richiede pochi clic.

Le funzioni di protezione sono già integrate. È possibile crittografare sia i dati su disco sia quelli in transito tramite i protocolli AES-256 e SSL con accelerazione hardware, isolare i cluster utilizzando Amazon VPC, oppure gestire le proprie chiavi utilizzando AWS Key Management Service (KMS)Hardware Security Module (HSM, moduli di protezione hardware). Tutte le chiamate API, i tentativi di connessione, le query e le modifiche ai cluster sono registrate e disponibili per gli audit. Per creare audit delle chiamate API di Redshift è possibile usare AWS CloudTrail.

Le elevate prestazioni in elaborazione di query sono garantite da una serie di importanti innovazioni, che si applicano a dataset di qualsiasi ordine di grandezza, dalle centinaia di gigabyte ai petabyte. Per ridurre la quantità di I/O necessari per elaborare le query, Amazon Redshift impiega storage basato su colonne, compressione dei dati e mappature di zona. Inoltre l'architettura MPP (Massively Parallel Processing, elaborazione parallela di massa) del suo data warehouse consente di caricare in parallelo e distribuire le operazioni SQL, in modo da sfruttare al massimo tutte le risorse disponibili. L'hardware utilizzato è stato progettato per fornire prestazioni di alto livello in elaborazione dei dati: si serve di storage locali per massimizzare il throughput tra CPU e unità e di reti mesh a 10 Gigabit Ethernet per massimizzare il throughput tra nodi.

Con pochi comandi della Console di gestione AWS, oppure tramite una semplice chiamata API, potrai modificare in modo semplice la quantità o il tipo di nodi del data warehouse su cloud in base alle prestazioni o alla capacità richieste. Con i nodi Dense Storage (DS) si creano data warehouse di grandi dimensioni composti di dischi rigidi (HDD) a prezzi molto competitivi. Con i nodi Dense Compute (DC) si creano data warehouse ad alte prestazioni composti di dischi allo stato solido (SSD), CPU performanti ed elevate quantità di RAM. Con Amazon Redshift è possibile iniziare da un singolo nodo DC1.Large da 160 GB e ampliare il servizio a vari petabyte di dati utente compressi su nodi DS2.8XLarge da 16 TB. Quando è in atto un ridimensionamento delle risorse, Amazon Redshift imposta il cluster esistente in modalità di sola lettura, effettua il provisioning del nuovo cluster secondo le dimensioni desiderate, quindi copia in parallelo i dati dal vecchio al nuovo. Mentre è in corso il provisioning del nuovo cluster, è possibile proseguire nell'invio di query su quello vecchio. Una volta completata la copia dei dati, le query saranno automaticamente redirette verso il nuovo cluster, mentre quello precedente verrà rimosso.

I prezzi sono calcolati in base alle risorse effettive di cui è stato effettuato il provisioning. È possibile scegliere tra un modello di pagamento on demand, senza pagamenti anticipati né impegni di lungo termine, e istanze riservate che consentono tariffe molto più contenute. La tariffa on demand parte da 0,25 USD all'ora per un nodo DC1.Large da 160 GB, oppure da 0,85 USD all'ora per un nodo DS2.XLarge da 2 TB. Con le istanze riservate e un pagamento anticipato parziale, il prezzo effettivo può scendere a 0,10 USD all'ora per un nodo DC1.Large (5.500 USD per TB all'anno) oppure 0,228 USD all'ora per un nodo DS2.XLarge (999 USD per TB all'anno). Per ulteriori informazioni, visita la pagina Prezzi di Amazon Redshift.

Con pochi comandi della Console di gestione AWS, oppure tramite semplici chiamate API, potrai creare un cluster, specificarne le dimensioni, il tipo di nodo che sottende e il profilo di sicurezza. Amazon Redshift eseguirà il provisioning dei nodi, configurerà le connessioni tra loro e proteggerà il cluster. Il tuo data warehouse sarà operativo in pochi minuti.

Amazon Redshift si occuperà di tutto il lavoro necessario per gestire, monitorare e ampliare il data warehouse, dal monitoraggio dell'integrità del cluster e la creazione dei backup all'applicazione di patch e aggiornamenti. Ridimensionare il cluster in base alle esigenze di prestazioni e di capacità aziendali è estremamente semplice. Il cliente è così sollevato da una serie di attività lunghe e complesse e può concentrarsi sulle informazioni e sul business.

Amazon Redshift dispone di numerose funzionalità che rafforzano l'affidabilità del cluster del data warehouse. Tutte le informazioni scritte su un nodo nel cluster vengono automaticamente replicate su altri nodi all'interno dello stesso cluster; al contempo, viene eseguito un backup continuo di tutti i dati su Amazon S3. Amazon Redshift monitora inoltre senza soluzione di continuità l'integrità del cluster, replicando una seconda volta i dati provenienti da unità con errori e procedendo, quando necessario, alla sostituzione dei nodi.

La funzione di snapshot automatizzata di Amazon Redshift consente di eseguire backup continui dei nuovi dati scritti nel cluster su Amazon S3. Gli snapshot sono continui, incrementali e automatici. Amazon Redshift memorizza gli snapshot per un periodo di tempo stabilito dal cliente, che va da 1 a 35 giorni. Sfruttando gli snapshot di sistema esistenti, è comunque possibile scegliere di acquisire uno snapshot in qualsiasi momento, che verrà conservato finché non si sceglie di rimuoverlo manualmente. Amazon Redshift è anche in grado di replicare gli snapshot in modo asincrono su Amazon S3 in una regione differente, a scopo di disaster recovery. Una volta eliminato un cluster, gli snapshot di sistema vengono rimossi, mentre gli snapshot acquisiti dall'utente sono disponibili finché non vengono rimossi manualmente.

È possibile utilizzare snapshot di sistema o creati manualmente per ripristinare un cluster mediante la Console di gestione AWS oppure le API di Amazon Redshift. Il cluster è disponibile non appena viene completato il ripristino dei metadati del sistema ed è possibile avviare query mentre ancora viene eseguito lo spool dei dati in background.

Configurando alcune semplici impostazioni, Amazon Redshift può applicare il protocollo SSL per proteggere i dati in transito e il protocollo di crittografia AES a 256 bit per i dati su disco. Se si sceglie di abilitare la crittografia dei dati su disco, tutti i dati scritti sulle unità saranno crittografati, inclusi i backup. Per impostazione predefinita, la gestione delle chiavi è prerogativa di Amazon Redshift, ma puoi decidere di gestire di persona le chiavi utilizzando HSM (moduli di protezione hardware), AWS CloudHSM o AWS Key Management Service.

Amazon Redshift consente di configurare le regole del firewall in modo da controllare gli accessi al cluster del data warehouse. Amazon Redshift può essere eseguito all'interno di Amazon Virtual Private Cloud (Amazon VPC) in modo da isolare il cluster del data warehouse in una rete virtuale a sé stante e collegarlo all'infrastruttura IT esistente tramite VPN IPsec con crittografia standard di settore.

Amazon Redshift si integra con AWS CloudTrail per creare audit di tutte le chiamate API di Redshift API. Inoltre registra tutte le operazioni SQL, inclusi i tentativi di connessione, le query e le modifiche ai database. Per accedere a questi log è possibile utilizzare query SQL su tabelle di sistema oppure scaricarle in un percorso sicuro su Amazon S3. Amazon Redshift è conforme ai requisiti di controllo SOC1, SOC2, SOC3 e PCI DSS Level 1. Visita il centro di conformità AWS per ulteriori informazioni.

Amazon Redshift è una soluzione di data warehousing SQL che impiega le connessioni ODBC e JDBC standard di settore. È possibile scaricare i driver JDBC e ODBC personalizzati dalla scheda Connect Client della console. Sono già numerosi i produttori di software che hanno certificato i propri prodotti per Amazon Redshift, consentendoti di continuare a utilizzare gli strumenti su cui fai affidamento oggi. Per ulteriori dettagli, consulta la pagina Web Partner Amazon Redshift.

Amazon Redshift si integra con altri servizi AWS e consente di caricare dati in parallelo su più nodi da Amazon S3, Amazon DynamoDB o dai server EC2 e locali tramite SSH. Anche AWS Data PipelineAmazon Kinesis e AWS Lambda si integrano con Amazon Redshift come destinazioni dati. È inoltre possibile caricare flussi di dati in Amazon Redshift tramite Amazon Kinesis Firehose.