1. 先了解一下HashCode
Java中的集合有兩類,一類是List,一類是Set。
List:元素有序,可以重復(fù);
Set:元素?zé)o序,不可重復(fù);
要想保證元素的不重復(fù),拿什么來判斷呢?這就是Object.equals方法了。如果元素有很多,增加一個元素,就要判斷n次嗎?
顯然不現(xiàn)實,于是,Java采用了哈希表的原理。哈希算法也稱為散列算法,是將數(shù)據(jù)依特定算法直接指定到一根地址上,初學(xué)者可以簡單的理解為,HashCode方法返回的就是對象存儲的物理位置(實際上并不是)。
這樣一來,當(dāng)集合添加新的元素時,先調(diào)用這個元素的hashcode()方法,就一下子能定位到他應(yīng)該放置的物理位置上。如果這個位置上沒有元素,他就可以直接存儲在這個位置上,不用再進(jìn)行任何比較了。如果這個位置上有元素,就調(diào)用它的equals方法與新元素進(jìn)行比較,想同的話就不存了,不相同就散列其它的地址。所以這里存在一個沖突解決的問題。這樣一來實際上調(diào)用equals方法的次數(shù)就大大降低了,幾乎只需要一兩次。
簡而言之,在集合查找時,hashcode能大大降低對象比較次數(shù),提高查找效率。
Java對象的equals方法和hashCode方法時這樣規(guī)定的:
相等的對象就必須具有相等的hashcode。
如果兩個對象的hashcode相同,他們并不一定相同。
如果兩個對象的hashcode相同,他們并不一定相同。
如果兩個Java對象A和B,A和B不相等,但是A和B的哈希碼相等,將A和B都存入HashMap時會發(fā)生哈希沖突,也就是A和B存放在HashMap內(nèi)部數(shù)組的位置索引相同,這時HashMap會在該位置建立一個鏈接表,將A和B串起來放在該位置,顯然,該情況不違反HashMap的使用規(guī)則,是允許的。當(dāng)然,哈希沖突越少越好,盡量采用好的哈希算法避免哈希沖突。
equals()相等的兩個對象,hashcode()一定相等;equals()不相等的兩個對象,卻并不能證明他們的hashcode()不相等。
2. HashMap和HashSet的區(qū)別
HashSet 是如何保證不重復(fù)的?
向 HashSet 中 add ()元素時,判斷元素是否存在的依據(jù),不僅要比較hash值,同時還要結(jié)合 equles 方法比較。
HashSet 中的 add ()方法會使用 HashMap 的 add ()方法。以下是 HashSet 部分源碼:
private static final Object PRESENT = new Object();
private transient HashMap<e,object> map;
public HashSet() {
map = new HashMap<>();
}
public boolean add(E e) {
return map.put(e, PRESENT)==null;
}
HashMap 的 key 是唯一的,由上面的代碼可以看出 HashSet 添加進(jìn)去的值就是作為 HashMap 的key。所以不會重復(fù)( HashMap 比較key是否相等是先比較 hashcode 在比較 equals )。
更多關(guān)于“Java培訓(xùn)”的問題,歡迎咨詢千鋒教育在線名師。千鋒已有十余年的培訓(xùn)經(jīng)驗,課程大綱更科學(xué)更專業(yè),有針對零基礎(chǔ)的就業(yè)班,有針對想提升技術(shù)的好程序員班,高品質(zhì)課程助力你實現(xiàn)java程序員夢想。