Amazon Elastic MapReduce (Amazon EMR) 是一種 Web 服務,讓您能夠輕鬆快速且經濟實惠地處理大量資料。

Amazon EMR 簡化了大數據處理,提供受管的 Hadoop 框架,讓您以輕鬆、快速且節省成本的方式跨越各個動態可擴展的 Amazon EC2 執行個體,以分發和處理大量資料。您也可以執行其他常用的分散式架構 (例如 Amazon EMR 中的 Apache Spark 和 Presto),並與其他 AWS 資料存放區 (例如 Amazon S3 和 Amazon DynamoDB) 中的資料進行互動。

Amazon EMR 能夠安全可靠地處理大數據使用案例,包括日誌分析、Web 索引、資料倉儲、機器學習、財務分析、科學模擬和生物資訊學。

Amazon EMR 簡介 (3:06)

thumb-S6Ja55n-o0M-3

按一下以放大

Amazon EMR 發行速度

Amazon EMR 發行速度

在 Amazon EMR 上使用版本控制發行功能,您可以輕鬆地在 EMR 叢集選取和使用最新的開放原始碼專案,包括 Apache Hadoop 和 Spark 生態系統中的應用程式。Amazon EMR 會安裝和設定軟體,所以您會花較少的時間在管理任務上,而專注於提高資料的價值。


易於使用

您只需幾分鐘就可以啟動 Amazon EMR 叢集。您不必擔心節點佈建、叢集設定、Hadoop 配置或叢集調校。Amazon EMR 會處理這些任務,您只需集中精力進行分析即可。

低成本

Amazon EMR 定價不僅簡單且可預估:為所使用的執行個體小時數按照小時費率支付費用。您可以用最低每小時 0.15 USD 的價格來啟動 10 節點 Hadoop 叢集。因為 Amazon EMR 原生支援 Amazon EC2 競價型和預留執行個體,您還可以節省 50% 到 80% 的基礎執行個體成本。

彈性

使用 Amazon EMR,您可以佈建一個、數百個或者甚至數千個運算執行個體來處理任何規模的資料。您可以輕鬆增加或減少執行個體的數量,並且按使用情況支付費用。

可靠

您用於調校和監控叢集的時間將更少。Amazon EMR 的 Hadoop 已經針對雲端進行優化,它還會監控您的叢集,重新嘗試失敗的任務,並自動替換效能不佳的執行個體。

安全

Amazon EMR 會自動配置 Amazon EC2 防火牆設定以控制對執行個體的網路存取,並且您可以在 Amazon Virtual Private Cloud (VPC) (由您定義的邏輯隔離網路) 中啟動叢集。  針對儲存在 Amazon S3 的物件,您可以使用 Amazon S3 伺服器端加密或 Amazon S3 用戶端加密搭配 EMRFS、AWS Key Management Service 或客戶受管金鑰。

安全

您可以完全掌控您的叢集。您擁有每個執行個體的根存取權,因此,您可以輕鬆安裝額外的應用程式和自訂每個叢集。Amazon EMR 還支援多個 Hadoop 分發和應用程式。

Amazon EMR 可用於分析點擊流資料,以便細分使用者並了解各種使用者偏好。廣告商還可以分析點擊流和廣告的展示次數日誌,以提供更有效率的廣告。

了解 Razorfish 如何使用 EMR 來進行點擊流分析 »

Amazon EMR 可快速、有效地處理大量的基因體資料及其他大型科學資料集。研究人員可以存取 AWS 上託管的免費基因體資料。

閱讀更多有關 1000 個基因體專案和 AWS 的資訊 »

Amazon EMR 可用於處理 Web 和行動應用程式產生的各種日誌。Amazon EMR 可幫助客戶將數 PB 的非結構化或者半結構化資料轉變為有用的應用程式或使用者見解。

了解 Yelp 如何使用 EMR 提升主要網站功能 »

準備好啟動第一個叢集嗎?按一下此處查看入門教學。在教學中,您將建立可計算範例文字檔案中的詞語出現頻率的叢集。在幾分鐘的時間內,您的叢集就能正常執行。