06 集合处理
【强制】 关于
hashCode和equals的处理,遵循如下规则:- 只要覆写
equals,就必须覆写hashCode。 - 因为
Set存储的是不重复的对象,依据hashCode和equals进行判断,所以Set存储的对象必须覆写这两种方法。 - 如果自定义对象作为
Map的键,那么必须覆写hashCode和equals。
说明
String因为覆写了hashCode和equals方法,所以可以愉快地将String对象作为 key 来使用。- 只要覆写
【强制】 判断所有集合内部的元素是否为空,使用
isEmpty()方法,而不是size() == 0的方式。说明
在某些集合中,前者的时间复杂度为 O(1),而且可读性更好。
正例
javaMap<String, Object> map = new HashMap<>(16); if (map.isEmpty()) { System.out.println("no element in this map."); }【强制】 在使用
java.util.stream.Collectors类的toMap()方法转为Map集合时,一定要使用参数类型为BinaryOperator,参数名为mergeFunction的方法,否则当出现相同 key 时会抛出IllegalStateException异常。说明
参数
mergeFunction的作用是当出现 key 重复时,自定义对 value 的处理策略。正例
javaList<Pair<String, Double>> pairArrayList = new ArrayList<>(3); pairArrayList.add(new Pair<>("version", 12.10)); pairArrayList.add(new Pair<>("version", 12.19)); pairArrayList.add(new Pair<>("version", 6.28)); // 生成的 map 集合中只有一个键值对:{version=6.28} Map<String, Double> map = pairArrayList.stream() .collect(Collectors.toMap(Pair::getKey, Pair::getValue, (v1, v2) -> v2));反例
javaString[] departments = new String[]{"RDC", "RDC", "KKB"}; // 抛出 IllegalStateException 异常 Map<Integer, String> map = Arrays.stream(departments) .collect(Collectors.toMap(String::hashCode, str -> str));【强制】 在使用
java.util.stream.Collectors类的toMap()方法转为Map集合时,一定要注意当 value 为null时会抛NPE异常。说明
在
java.util.HashMap的merge方法里会进行如下的判断:javaif (value == null || remappingFunction == null) throw new NullPointerException();反例
javaList<Pair<String, Double>> pairArrayList = new ArrayList<>(2); pairArrayList.add(new Pair<>("version1", 8.3)); pairArrayList.add(new Pair<>("version2", null)); // 抛出 NullPointerException 异常 Map<String, Double> map = pairArrayList.stream() .collect(Collectors.toMap(Pair::getKey, Pair::getValue, (v1, v2) -> v2));【强制】
ArrayList的subList结果不可强转成ArrayList,否则会抛出ClassCastException异常:java.util.RandomAccessSubList cannot be cast to java.util.ArrayList。说明
subList()返回的是ArrayList的内部类SubList,并不是ArrayList本身,而是ArrayList的一个视图,对于SubList的所有操作最终会反映到原列表上。【强制】 使用
Map的方法keySet()/values()/entrySet()返回集合对象时,不可以对其进行添加元素操作,否则会抛出UnsupportedOperationException异常。【强制】
Collections类返回的对象,如:emptyList()/singletonList()等都是 immutable list,不可对其进行添加或者删除元素的操作。反例
如果查询无结果,返回
Collections.emptyList()空集合对象,调用方一旦在返回的集合中进行了添加元素的操作,就会触发UnsupportedOperationException异常。【强制】 在
subList场景中,高度注意对父集合元素的增加或删除,均会导致子列表的遍历、增加、删除产生ConcurrentModificationException异常。说明
抽查表明,90% 的程序员对此知识点都有错误的认知。
【强制】 使用集合转数组的方法,必须使用集合的
toArray(T[] array),传入的是类型完全一致、长度为 0 的空数组。反例
直接使用
toArray无参方法存在问题,此方法返回值只能是Object[]类,若强转其它类型数组将出现ClassCastException错误。正例
javaList<String> list = new ArrayList<>(2); list.add("guan"); list.add("bao"); String[] array = list.toArray(new String[0]);说明
使用
toArray带参方法,数组空间大小的length:- 等于 0,动态创建与
size相同的数组,性能最好。 - 大于 0 但小于
size,重新创建大小等于size的数组,增加 GC 负担。 - 等于
size,在高并发情况下,数组创建完成之后,size正在变大的情况下,负面影响与 2 相同。 - 大于
size,空间浪费,且在size处插入null值,存在NPE隐患。
- 等于 0,动态创建与
【强制】 使用
Collection接口任何实现类的addAll()方法时,要对输入的集合参数进行NPE判断。说明
在
ArrayList#addAll方法的第一行代码即Object[] a = c.toArray();其中c为输入集合参数,如果为null,则直接抛出异常。【强制】 使用工具类
Arrays.asList()把数组转换成集合时,不能使用其修改集合相关的方法,它的add/remove/clear方法会抛出UnsupportedOperationException异常。说明
asList的返回对象是一个Arrays内部类,并没有实现集合的修改方法。Arrays.asList体现的是适配器模式,只是转换接口,后台的数据仍是数组。javaString[] str = new String[]{ "yang", "guan", "bao" }; List<String> list = Arrays.asList(str);第一种情况:
list.add("yangguanbao");运行时异常。 第二种情况:str[0] = "change";list中的元素也会随之修改,反之亦然。【强制】 泛型通配符
<? extends T>来接收返回的数据,此写法的泛型集合不能使用add方法,而<? super T>不能使用get方法,两者在接口调用赋值的场景中容易出错。说明
扩展说一下
PECS(Producer Extends Consumer Super) 原则,即频繁往外读取内容的,适合用<? extends T>,经常往里插入的,适合用<? super T>。【强制】 在无泛型限制定义的集合赋值给泛型限制的集合时,在使用集合元素时,需要进行
instanceof判断,避免抛出ClassCastException异常。说明
毕竟泛型是在 JDK5 后才出现,考虑到向前兼容,编译器是允许非泛型集合与泛型集合互相赋值。
反例
javaList<String> generics = null; List notGenerics = new ArrayList(10); notGenerics.add(new Object()); notGenerics.add(new Integer(1)); generics = notGenerics; // 此处抛出 ClassCastException 异常 String string = generics.get(0);【强制】 不要在
foreach循环里进行元素的remove/add操作。remove元素请使用iterator方式,如果并发操作,需要对iterator对象加锁。正例
javaList<String> list = new ArrayList<>(); list.add("1"); list.add("2"); Iterator<String> iterator = list.iterator(); while (iterator.hasNext()) { String item = iterator.next(); if (删除元素的条件) { iterator.remove(); } }反例
javafor (String item : list) { if ("1".equals(item)) { list.remove(item); } }说明
反例中的执行结果肯定会出乎大家的意料,那么试一下把“1”换成“2”会是同样的结果吗?
【强制】 在 JDK7 版本及以上,
Comparator实现类要满足如下三个条件,不然Arrays.sort,Collections.sort会抛IllegalArgumentException异常。说明 三个条件如下
x,y的比较结果和y,x的比较结果相反。x > y,y > z,则x > z。x = y,则x,z比较结果和y,z比较结果相同。
反例
下例中没有处理相等的情况,交换两个对象判断结果并不互反,不符合第一个条件,在实际使用中可能会出现异常。
javanew Comparator<Student>() { @Override public int compare(Student o1, Student o2) { return o1.getId() > o2.getId() ? 1 : -1; } };【推荐】 泛型集合使用时,在 JDK7 及以上,使用
diamond语法或全省略。说明
菱形泛型,即
diamond,直接使用<>来指代前边已经指定的类型。正例
java// diamond 方式,即 <> HashMap<String, String> userCache = new HashMap<>(16); // 全省略方式 ArrayList<User> users = new ArrayList(10);【推荐】 集合初始化时,指定集合初始值大小。
说明
HashMap使用构造方法HashMap(int initialCapacity)进行初始化时,如果暂时无法确定集合大小,那么指定默认值(16)即可。正例
initialCapacity = (需要存储的元素个数 / 负载因子) + 1。注意负载因子(即loaderfactor)默认为 0.75,如果暂时无法确定初始值大小,请设置为 16(即默认值)。反例
HashMap需要放置 1024 个元素,由于没有设置容量初始大小,随着元素增加而被迫不断扩容,resize()方法总共会调用 8 次,反复重建哈希表和数据迁移。当放置的集合元素个数达千万级时会影响程序性能。【推荐】 使用
entrySet遍历Map类集合KV,而不是keySet方式进行遍历。说明
keySet其实是遍历了 2 次,一次是转为Iterator对象,另一次是从hashMap中取出 key 所对应的 value。而entrySet只是遍历了一次就把 key 和 value 都放到了entry中,效率更高。如果是JDK8,使用Map.forEach方法。正例
values()返回的是V值集合,是一个list集合对象;keySet()返回的是K值集合,是一个Set集合对象;entrySet()返回的是K-V值组合的Set集合。【推荐】 高度注意
Map类集合K/V能不能存储null值的情况,如下表格:集合类 Key Value Super 说明 Hashtable不允许为 null 不允许为 null Dictionary线程安全 TreeMap不允许为 null 允许为 null AbstractMap线程不安全 ConcurrentHashMap不允许为 null 不允许为 null AbstractMap锁分段技术(JDK8:CAS) HashMap允许为 null 允许为 null AbstractMap线程不安全 反例
由于
HashMap的干扰,很多人认为ConcurrentHashMap是可以置入null值,而事实上,存储null值时会抛出NPE异常。参考:合理利用好集合的有序性(
sort)和稳定性(order),避免集合的无序性(unsort)和不稳定性(unorder)带来的负面影响。说明
有序性是指遍历的结果是按某种比较规则依次排列的,稳定性指集合每次遍历的元素次序是一定的。如:
ArrayList是order/unsort;HashMap是unorder/unsort;TreeSet是order/sort。参考:利用
Set元素唯一的特性,可以快速对一个集合进行去重操作,避免使用List的contains()进行遍历去重或者判断包含操作。