第一:
Set集合没有顺序,也不允许重复。
为什么要这样:模拟现实的集合。
这里的重复只是:对象的重复
何为对象的重复:指的就是同一个对象。
何为同一个对象:内存中,所在的内存编号一致。
内存编号的表示是什么:哈希码(哈希码一般是 类名 和 对象所在内存地址的十六进制数字表示 的组合)。
第二:
这种设置和实现中的矛盾在什么地方:
现实生活中只要属性相同,我们就认为那是同一个对象。
这与计算机比较同一个对象的方法不同(计算机使用内存地址,即哈希码)
于是,就需要重写equals方法和hashCode方法(&&)来让程序的运行结果符合现实生活
基本数据类型的实现类都已经重写了上面的两个方法。
第三:
为什么要重写equals方法和hashCode方法(技术实现原理):
程序向HashSet中添加一个对象时,先用hashCode方法计算出该对象的哈希码。
比较:
(1),如果该对象哈希码与集合已存在对象的哈希码不一致,则该对象没有与其他对象重复,添加到集合中!
(2),如果存在于该对象相同的哈希码,那么通过equals方法判断两个哈希码相同的对象是否为同一对象(判断的标准是:属性是否相同)
1>,相同对象,不添加。
2>,不同对象,添加!
这时有两个疑问:
1,为什么哈希码相同了还有可能是不同对象?
2,为什么经过比较哈希码还需要借助equals方法判断?
答:
首先:
按照Object类的hashCode方法,是不可能返回两个相同的哈希码的。(哈希码唯一标志了对象)
然后:
Object类的hashCode方法返回的哈希码具有唯一性(地址唯一性),但是这样不能让程序的运行逻辑符合现实生活。(这个逻辑就是:属性相同的对象被看作同一个对象。)
为了让程序的运行逻辑符合现实生活,Object的子类重写了hashCode的方法(基本数据类型的实现类都已经重写了两个方法,自定义的类要软件工程
师自己重写。)
那么:
重写的宗旨是什么?
重写就是为了实现这样的目的:属性相同的不同对象在调用其hashCode方法后,返回的是同样的哈希码。
但是
我们在重写的时候,发现几乎所有的写法都无法避免一个bug:有一些属性不同的对象(当然是不同的对象),会返回相同的哈希码。(即
重码)
最后:
为了解决这个问题:在哈希码相同的时候,再用equals方法比较两个对象的对应属性是否相同,这样,确保了万无一失。
这样:上面两个问题得到解决。
下面给出一个属性不同但哈希码相同的例子:
import java.util.HashSet;
import java.util.Iterator;
import java.util.Set;
class Person {
private String name;
private int id;
Person(String name,int id) {
this.name = name;
this.id = id;
}
public void setName(String name){
this.name = name;
}
public String getName(){
return name;
}
public void setId(int id){
this.id = id;
}
public int getId(){
return id;
}
public int hashCode(){
return name.hashCode()+id; //使用字符串哈希值与Integer的哈希值的组合
//这样会产生重码,实际上重码率很高
}
public boolean equals(Object obj){
if(obj instanceof Person){ //
Person p = (Person)obj;
return(name.equals(p.name) && id == p.id);
}
return super.equals(obj);
}
}
public class TestHashSet2 {
public static void main(String[] args) {
Person p1 = new Person("a",1);
Person p2 = new Person("b",0);
Set set = new HashSet();
set.add(p1);
set.add(p2);
Iterator it = set.iterator();
while(it.hasNext()){
System.out.println(it.next().getName());
}
}
}
Tip:
hashCode不同时,则必为不同对象。hashCode相同时,根据equlas()方法判断是否为同一对象。
在HashSet,HashMap,HashTable中都存在该问题。