有沒有想過,Python中的字典為什么這么高效穩(wěn)定。原因是他是建立在hash表上。了解Python中的hash表有助于更好的理解Python,因?yàn)镻ython中字典無處不在。
hash函數(shù)
哈希函數(shù)是一個(gè)可以將任意長度的數(shù)據(jù)塊映射到固定長度的值,這個(gè)步驟稱為hash,也就是散列。
hash函數(shù)有三個(gè)主要的特征:
計(jì)算迅速:計(jì)算一個(gè)數(shù)據(jù)塊的hash值非常快
確定性:相同用字符串會產(chǎn)生相同的hash值
結(jié)果固定長度:不管輸入的是,一個(gè)字節(jié)還是十個(gè)字節(jié),或者上萬個(gè)字節(jié),結(jié)果總是預(yù)先確定的長度。
另一個(gè)特征在hash函數(shù)中非常普遍,即他們是單方向的:通過函數(shù)實(shí)現(xiàn)后,原始數(shù)據(jù)丟失了,我們可以通過字符串得到一個(gè)hash值,但不能通過一個(gè)hash也就是散列得到原始的字符串(因?yàn)橛袑?shù)據(jù)降維的方法會造成數(shù)據(jù)的丟失)。這種特性并不是對所有hash函數(shù)的強(qiáng)制性規(guī)定,但是當(dāng)需要加密安全時(shí),這種性質(zhì)還是挺好用的。
一些比較受歡迎的算法包括:MD5、SHA-1、SHA-2,NTLM.
關(guān)于hash的一些使用方法
很多東西都依賴hash,hash表就是其中一例,另一些用法是出于加密和的原因
一個(gè)具體的例子就是當(dāng)你嘗試從網(wǎng)上下載開源軟件時(shí)。通常你都會發(fā)現(xiàn)一個(gè)關(guān)聯(lián)文件,這個(gè)關(guān)聯(lián)文件就是這個(gè)文件簽名。這個(gè)簽名僅僅是源文件的散列值它非常有用,你為你可以自己通過計(jì)算下載好的文件的散列值并與網(wǎng)站上提供的簽名進(jìn)行對比,這樣就可以確認(rèn)你自己下載的文件沒有損壞。
另一種用法是存儲用戶的密碼。你有沒有問過你自己,當(dāng)你忘掉了一個(gè)網(wǎng)站的登錄密碼的時(shí)候,你還想從這個(gè)網(wǎng)站上恢復(fù)登錄,它只會讓你重新確定一個(gè)新的登錄密碼而不是給你原來你選擇的密碼,這是因?yàn)榫W(wǎng)站并不會儲存你完整的密碼,而是你密碼的hash值。
這么做是出于安全因素,因?yàn)槿绻诳透愕搅藬?shù)據(jù)庫的權(quán)限,他們不會知道你真實(shí)的密碼,而是僅僅得到你密碼的哈希值,又因?yàn)楣:瘮?shù)是單向的,他們根本不可能從哈希值得到你的密碼
以上內(nèi)容為大家介紹了Python中的hash,希望對大家有所幫助,如果想要了解更多Python相關(guān)知識,請關(guān)注IT培訓(xùn)機(jī)構(gòu):千鋒教育。