什么是MVCC?
MVCC,全稱Multi-Version Concurrency Control,即多版本并發(fā)控制。MVCC是一種并發(fā)控制的方法,一般在數(shù)據(jù)庫管理系統(tǒng)中,實(shí)現(xiàn)對數(shù)據(jù)庫的并發(fā)訪問,在編程語言中實(shí)現(xiàn)事務(wù)內(nèi)存。 在Mysql的InnoDB引擎中就是指在已提交讀(READ COMMITTD)和可重復(fù)讀(REPEATABLE READ)這兩種隔離級別下的事務(wù)對于SELECT操作會訪問版本鏈中的記錄的過程。 這就使得別的事務(wù)可以修改這條記錄,反正每次修改都會在版本鏈中記錄。SELECT可以去版本鏈中拿記錄,這就實(shí)現(xiàn)了讀-寫,寫-讀的并發(fā)執(zhí)行,提升了系統(tǒng)的性能。
MySQL的InnoDB引擎實(shí)現(xiàn)MVCC的3個(gè)基礎(chǔ)點(diǎn)
1.隱式字段
如上圖,DB_ROW_ID是數(shù)據(jù)庫默認(rèn)為該行記錄生成的唯一隱式主鍵;DB_TRX_ID是當(dāng)前操作該記錄的事務(wù)ID; 而DB_ROLL_PTR是一個(gè)回滾指針,用于配合undo日志,指向上一個(gè)舊版本;delete flag沒有展示出來。
2.undo log
從上面,我們就可以看出,不同事務(wù)或者相同事務(wù)的對同一記錄的修改,會導(dǎo)致該記錄的undo log成為一條記錄版本線性表,既鏈表,undo log的鏈?zhǔn)拙褪亲钚碌呐f記錄,鏈尾就是最早的舊記錄
3.ReadView
已提交讀和可重復(fù)讀的區(qū)別就在于它們生成ReadView的策略不同。
ReadView中主要就是有個(gè)列表來存儲我們系統(tǒng)中當(dāng)前活躍著的讀寫事務(wù),也就是begin了還未提交的事務(wù)。通過這個(gè)列表來判斷記錄的某個(gè)版本是否對當(dāng)前事務(wù)可見。假設(shè)當(dāng)前列表里的事務(wù)id為[80,100]。
a) 如果你要訪問的記錄版本的事務(wù)id為50,比當(dāng)前列表最小的id80小,那說明這個(gè)事務(wù)在之前就提交了,所以對當(dāng)前活動(dòng)的事務(wù)來說是可訪問的。
b) 如果你要訪問的記錄版本的事務(wù)id為90,發(fā)現(xiàn)此事務(wù)在列表id最大值和最小值之間,那就再判斷一下是否在列表內(nèi),如果在那就說明此事務(wù)還未提交,所以版本不能被訪問。如果不在那說明事務(wù)已經(jīng)提交,所以版本可以被訪問。
c) 如果你要訪問的記錄版本的事務(wù)id為110,那比事務(wù)列表最大id100都大,那說明這個(gè)版本是在ReadView生成之后才發(fā)生的,所以不能被訪問。
這些記錄都是去undo log 鏈里面找的,先找最近記錄,如果最近這一條記錄事務(wù)id不符合條件,不可見的話,再去找上一個(gè)版本再比較當(dāng)前事務(wù)的id和這個(gè)版本事務(wù)id看能不能訪問,以此類推直到返回可見的版本或者結(jié)束。
舉個(gè)例子 ,在已提交讀隔離級別下:
比如此時(shí)有一個(gè)事務(wù)id為100的事務(wù),修改了name,使得的name等于小明2,但是事務(wù)還沒提交。則此時(shí)的版本鏈?zhǔn)?/p>
那此時(shí)另一個(gè)事務(wù)發(fā)起了select 語句要查詢id為1的記錄,那此時(shí)生成的ReadView 列表只有[100]。那就去版本鏈去找了,首先肯定找最近的一條,發(fā)現(xiàn)trx_id是100,也就是name為小明2的那條記錄,發(fā)現(xiàn)在列表內(nèi),所以不能訪問。
這時(shí)候就通過指針繼續(xù)找下一條,name為小明1的記錄,發(fā)現(xiàn)trx_id是60,小于列表中的最小id,所以可以訪問,直接訪問結(jié)果為小明1。
那這時(shí)候我們把事務(wù)id為100的事務(wù)提交了,并且新建了一個(gè)事務(wù)id為110也修改id為1的記錄,并且不提交事務(wù)
這時(shí)候版本鏈就是
這時(shí)候之前那個(gè)select事務(wù)又執(zhí)行了一次查詢,要查詢id為1的記錄。
已提交讀隔離級別下的事務(wù)在每次查詢的開始都會生成一個(gè)獨(dú)立的ReadView,而可重復(fù)讀隔離級別則在第一次讀的時(shí)候生成一個(gè)ReadView,之后的讀都復(fù)用之前的ReadView。
1.如果你是已提交讀隔離級別,這時(shí)候你會重新一個(gè)ReadView,那你的活動(dòng)事務(wù)列表中的值就變了,變成了[110]。按照上的說法,你去版本鏈通過trx_id對比查找到合適的結(jié)果就是小明2。
2.如果你是可重復(fù)讀隔離級別,這時(shí)候你的ReadView還是第一次select時(shí)候生成的ReadView,也就是列表的值還是[100]。所以select的結(jié)果是小明1。所以第二次select結(jié)果和第一次一樣,所以叫可重復(fù)讀!
這就是Mysql的MVCC,通過版本鏈,實(shí)現(xiàn)多版本,可并發(fā)讀-寫,寫-讀。通過ReadView生成策略的不同實(shí)現(xiàn)不同的隔離級別。