1.hadoop 1.x
JobTracker,TaskTracker
缺點:JobTracker負載過重,存在單點故障;與MapReduce強耦合,其他計算框架需要重復實現(xiàn)資源管理;
2.hadoop 2.x
App Mstr (Application Master進程)
3.工作流程
如架構圖所示,大致的工作流程如下:
用戶使用客戶端向 RM 提交一個任務,同時指定提交到哪個隊列和需要多少資源。用戶可以通過每個計算引擎的對應參數(shù)設置,如果沒有特別指定,則使用默認設置。
RM 在收到任務提交的請求后,先根據(jù)資源和隊列是否滿足要求選擇一個 NM,通知它啟動一個特殊的 container,稱為 Application Master(App Mstr,AM),后續(xù)流程由它發(fā)起。
AM 向 RM 注冊后根據(jù)自己任務的需要,向 RM 申請 container,包括數(shù)量、所需資源量、所在位置等因素。
如果隊列有足夠資源,RM 會將 container 分配給有足夠剩余資源的 NM,由 AM 通知 NM 啟動 container。
container 啟動后執(zhí)行具體的任務,處理分給自己的數(shù)據(jù)。NM 除了負責啟動 container,還負責監(jiān)控它的資源使用狀況以及是否失敗退出等工作,如果 container 實際使用的內存超過申請時指定的內存,會將其殺死,保證其他 container 能正常運行。
各個 container 向 AM 匯報自己的進度,都完成后,AM 向 RM 注銷任務并退出,RM 通知 NM 殺死對應的 container,任務結束。
更多關于“大數(shù)據(jù)培訓”的問題,歡迎咨詢千鋒教育在線名師。千鋒教育多年辦學,課程大綱緊跟企業(yè)需求,更科學更嚴謹,每年培養(yǎng)泛IT人才近2萬人。不論你是零基礎還是想提升,都可以找到適合的班型,千鋒教育隨時歡迎你來試聽。