MVCC(Multi Version Consistency Control),簡單地說,是一種通過數(shù)據(jù)的多版本來解決讀寫一致性問題的解決方案。我們知道 HBase 是會保留多版本的數(shù)據(jù)的,每次寫入都會產(chǎn)生一個新版本的數(shù)據(jù),每次讀取都會默認讀最新版本的數(shù)據(jù),那么 HBase 是在并發(fā)請求的場景下是怎么控制這些多版本的呢?下面是對HBase的MVCC多版本并發(fā)機制的具體介紹。
如圖所示,LinkedList 每個元素里面有兩個屬性:
writeNumber:即 Region 級別的事務 ID,每個客戶端請求都會分配一個事務 ID。
completed: 數(shù)據(jù)寫入是否完成,初始狀態(tài)為 Flase,數(shù)據(jù)寫入成功后會更新為 True。
客戶端寫入事務請求到達 Region,先寫入到 LinkedList 中,10 是當前事務的 ID,F(xiàn)alse 表示當前事務還在進行中,數(shù)據(jù)還不可讀。
Client 將數(shù)據(jù)寫入 memstore 和 WAL ,寫入完成即可結束事務。
將 completed 更新為 true,表示事務結束。
同時,Client 會按順序遍歷 LinkedList 里的元素,若 completed:true 則將 readPoint 更新到這個位置,說明此處的數(shù)據(jù)是可讀的,遍歷到 completed:false 則停止。
此時數(shù)據(jù)寫入還不會返回成功,即事務 10 還是不可讀的狀態(tài),因為需要保證時序,client2 和 3 還在寫事務 7 和 9 沒有完成,當前可讀的數(shù)據(jù)只到事務 6 的位置。等到 client2 和 3 完成事務并將 readPoint 更新到 10,則事務 10 返回寫入成功,數(shù)據(jù)可讀。
更多關于大數(shù)據(jù)培訓的問題,歡迎咨詢千鋒教育在線名師,如果想要了解我們的師資、課程、項目實操的話可以點擊咨詢課程顧問,獲取試聽資格來試聽我們的課程,在線零距離接觸千鋒教育大咖名師,讓你輕松從入門到精通。
注:本文部分文字和圖片來源于網(wǎng)絡,如有侵權,請聯(lián)系刪除。版權歸原作者所有!