Persist 的 MEMORY_ONLY 級別的存儲(chǔ)等于 Cache,Persist 其他的配置只是存儲(chǔ)的方式不同,作用和原理是和 Cache 類似的,他們二者的區(qū)別如下:
* Cache、Persist 是轉(zhuǎn)化類算子,和其他算子一樣,觸發(fā)的時(shí)機(jī)是在對應(yīng)分區(qū)的上游算子計(jì)算完成之后。
* Cache、Persist 會(huì)把 RDD 緩存到指定位置,這個(gè)操作不會(huì)改變 Lineage 血緣的依賴關(guān)系,且 Job 執(zhí)行完成之后,緩存的數(shù)據(jù)會(huì)被清除。
* Cache、Persist 一般應(yīng)用于需要訪問重復(fù)數(shù)據(jù)的應(yīng)用(如迭代型算法和交互式應(yīng)用)緩存可以運(yùn)行得更快。
* CheckPoint 執(zhí)行完畢后,會(huì)產(chǎn)生 CheckPointRDD,此時(shí) lineage 血緣關(guān)系已經(jīng)改變了,容錯(cuò)會(huì)從 CheckPointRDD 開始。
* CheckPoint 將 RDD 持久化到 HDFS ,會(huì)被永久保存,可以給其他的 Driver 使用
* 雖然Presist 也可以持久化數(shù)據(jù)到磁盤,但是它有BlockManager管理,一旦Driver結(jié)束,BlockManager 也會(huì) stop,
被 cache 到磁盤上的 RDD 也會(huì)被清空,而 checkpoint 將 RDD 持久化到HDFS或本地文件,如果不被手動(dòng) remove 掉,是一直存在的。
更多關(guān)于IT(替換成當(dāng)前文章主詞)培訓(xùn)的問題,歡迎咨詢千鋒教育在線名師。千鋒教育擁有多年IT培訓(xùn)服務(wù)經(jīng)驗(yàn),采用全程面授高品質(zhì)、高體驗(yàn)培養(yǎng)模式,擁有國內(nèi)一體化教學(xué)管理及學(xué)員服務(wù),助力更多學(xué)員實(shí)現(xiàn)高薪夢想。
注:本文部分文字和圖片來源于網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系刪除。版權(quán)歸原作者所有!