久久精品国产亚洲高清|精品日韩中文乱码在线|亚洲va中文字幕无码久|伊人久久综合狼伊人久久|亚洲不卡av不卡一区二区|精品久久久久久久蜜臀AV|国产精品19久久久久久不卡|国产男女猛烈视频在线观看麻豆

千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機(jī)構(gòu)

手機(jī)站
千鋒教育

千鋒學(xué)習(xí)站 | 隨時隨地免費(fèi)學(xué)

千鋒教育

掃一掃進(jìn)入千鋒手機(jī)站

領(lǐng)取全套視頻
千鋒教育

關(guān)注千鋒學(xué)習(xí)站小程序
隨時隨地免費(fèi)學(xué)習(xí)課程

當(dāng)前位置:首頁  >  技術(shù)干貨  > 大數(shù)據(jù)開發(fā)面試題詳解:Hadoop的運(yùn)行原理

大數(shù)據(jù)開發(fā)面試題詳解:Hadoop的運(yùn)行原理

來源:千鋒教育
發(fā)布人:千鋒老師
時間: 2019-01-02 16:14:00 1546416840

  hadoop的核心思想是MapReduce,但shuffle又是MapReduce的核心。shuffle的主要工作是從Map結(jié)束到Reduce開始之間的過程。

  Hadoop不僅僅是大數(shù)據(jù)技術(shù)的核心重點(diǎn),還是我們面試官面試的時候經(jīng)常會問道的問題,本文將詳細(xì)介紹Hadoop的運(yùn)行原理。

圖片1

  hadoop運(yùn)行原理包括HDFS和Mapreduce兩部分。

  1)HDFS自動保存多個副本,移動計算。缺點(diǎn)是小文件存取占用namenode內(nèi)存,寫入只支持追加,不能隨機(jī)修改。

  它存儲的邏輯空間稱為block,文件的權(quán)限類似linux。整體架構(gòu)分三種節(jié)點(diǎn),NN,SNN,DN

  NN 負(fù)責(zé)讀寫操作保存metadata(Ownership Permission blockinfo)

  SNN 負(fù)責(zé)輔助NN合并fsimage和edits,減少nn啟動時間

  DN 負(fù)責(zé)存數(shù)據(jù),每個數(shù)據(jù)(文件)分割成若干block,每個block默認(rèn)3個副本。啟動后像NN發(fā)送心跳保持聯(lián)系

  NN保存的metadata在hdfs啟動后加載到計算機(jī)內(nèi)存,除block位置信息的metadata保存在OS文件系統(tǒng)中的fsimage文件中,對metadata的操作日志保存在OS文件系統(tǒng)中的edits文件中。block位置信息是hdfs啟動后由DN上報NN再加載到內(nèi)存的。

  HDFS的安全模式:直到NN完全加載完metadata之前的這段時間。期間不能寫入文件,DN檢查各個block完整性,并修復(fù)。

  2)MapReduce

  離線計算框架,過程分為split map shuffle reduce四個過程

  架構(gòu)節(jié)點(diǎn)有:Jobtracker TaskTracker

  Split將文件分割,傳輸?shù)絤apper,mapper接收KV形式的數(shù)據(jù),經(jīng)過處理,再傳到shuffle過程。

  Shuffle先進(jìn)行HashPartition或者自定義的partition,會有數(shù)據(jù)傾斜和reduce的負(fù)載均衡問題;再進(jìn)行排序,默認(rèn)按字典排序;為減少mapper輸出數(shù)據(jù),再根據(jù)key進(jìn)行合并,相同key的數(shù)據(jù)value會被合并;最后分組形成(key,value{})形式的數(shù)據(jù),輸出到下一階段

  Reduce輸入的數(shù)據(jù)就變成了,key+迭代器形式的數(shù)據(jù),再進(jìn)行處理。

  以上是對大數(shù)據(jù)技術(shù)面試題的詳細(xì)解析,當(dāng)然了,既然是面試題不可能只有一道,千鋒老師還在積極預(yù)測備選中,針對大數(shù)據(jù)技術(shù)的重點(diǎn)內(nèi)容進(jìn)行詳細(xì)講解和階段測試,讓同學(xué)們真正掌握大數(shù)據(jù)技術(shù),通過一周一小測,一個月一大測的培訓(xùn)原則,給學(xué)生外界的學(xué)習(xí)推力。更多精彩,歡迎持續(xù)關(guān)注~

tags:
聲明:本站稿件版權(quán)均屬千鋒教育所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
10年以上業(yè)內(nèi)強(qiáng)師集結(jié),手把手帶你蛻變精英
請您保持通訊暢通,專屬學(xué)習(xí)老師24小時內(nèi)將與您1V1溝通
免費(fèi)領(lǐng)取
今日已有369人領(lǐng)取成功
劉同學(xué) 138****2860 剛剛成功領(lǐng)取
王同學(xué) 131****2015 剛剛成功領(lǐng)取
張同學(xué) 133****4652 剛剛成功領(lǐng)取
李同學(xué) 135****8607 剛剛成功領(lǐng)取
楊同學(xué) 132****5667 剛剛成功領(lǐng)取
岳同學(xué) 134****6652 剛剛成功領(lǐng)取
梁同學(xué) 157****2950 剛剛成功領(lǐng)取
劉同學(xué) 189****1015 剛剛成功領(lǐng)取
張同學(xué) 155****4678 剛剛成功領(lǐng)取
鄒同學(xué) 139****2907 剛剛成功領(lǐng)取
董同學(xué) 138****2867 剛剛成功領(lǐng)取
周同學(xué) 136****3602 剛剛成功領(lǐng)取
相關(guān)推薦HOT
云原生存儲和云存儲有什么區(qū)別?

一、架構(gòu)設(shè)計不同云原生存儲是指在云原生環(huán)境下設(shè)計和構(gòu)建的存儲系統(tǒng)。它是基于云原生計算模式和原則進(jìn)行設(shè)計,充分利用容器、微服務(wù)和自動化管...詳情>>

2023-10-14 06:50:34
如何刪除需要使用管理員權(quán)限才能刪除的文件?

如何刪除需要使用管理員權(quán)限才能刪除的文件在Windows系統(tǒng)中,有時候我們可能會遇到一些需要管理員權(quán)限才能刪除的文件。這是因為這些文件可能是...詳情>>

2023-10-14 06:27:57
有什么好用的redis可視化管理工具?

一、Redis Desk較好 ManagerRedis Desk較好 Manager是一款非常受歡迎的Redis數(shù)據(jù)庫管理工具。它支持直接進(jìn)行數(shù)據(jù)修改、刪除和新增等操作,而且...詳情>>

2023-10-14 06:24:43
市場上C++主要是用來做什么的?

C++是一種廣泛應(yīng)用于市場上的編程語言,具有高性能和強(qiáng)大的功能。它的設(shè)計目標(biāo)是提供高效的底層控制和與硬件交互的能力,同時保持可移植性和可...詳情>>

2023-10-14 06:01:51
為什么說PHP與Swoole是優(yōu)異組合?

PHP與Swoole在Web開發(fā)和網(wǎng)絡(luò)編程領(lǐng)域中,共同構(gòu)成了一種強(qiáng)大的解決方案。什么是PHPPHP是一種廣泛使用的開源服務(wù)器端腳本語言,特別適用于Web開...詳情>>

2023-10-14 05:08:41