java常用容器简要性能分析(List。Map。Set)

嗯,实习的时候看到这个,感觉蛮好,这里摘录学习,生活加油:

我曾经害怕别人嘲笑的目光,后来,发现他们的目光不会在我身上停留太久,人们更愿意把目光放在自己身上。 知乎上看到,讲给自己。

List

List和Set都属于Collection的子接口,List集合中的元素是按照插入顺序进行排列的,允许出现重复元素,

List接口下的常用实现类有 ArrayList和LinkedList ,对于List来讲,

元素只能是通过set更新,不能通过add更新,通过add只能在指定索引位置添加元素,不会实现元素的覆盖,通过remove移除

接口继承关系:

ArrayList :

// 查找指定位置元素的下标
public int indexOf(Object o);
// 查找指定元素最后一次出现的位置
public int lastIndexOf(Object o) ;
// 清空集合元素
public void clear();
// 等等......

ArrayList的特点: **

  • ArrayList内部是使用 数组来存储数据 ,并且是一个 “动态”的数组 ,在添加元素时,如果发现 容量不够时,会进 行扩容
  • ArrayList支持 随机访问元素随机访问元素的效率是O(1)
  • ArrayList在 尾部添加元素的效率为O(1)add方法默认在尾部进行添加,在使用的时候最好在尾部添加元素 效率更佳
  • ArrayList在进行 删除元素或者在中间、头部插入元素时会导致数组内部移动 ,进行 数组拷贝,平均时间复杂度 为O(n)  

ArrayList的迭代方式:

  1. 1、下标迭代
// 使用下标对List进行外部迭代
for (int i = 0; i < list.size(); i++) { System.out.println(list.get(i));}
  1. 2、可以使用增强for进行迭代
// 采用增强for的迭代方式其实底层是使用迭代器进行迭代,在迭代的过程中不允许对元素进行修改
for (String s : list) { System.out.println(s);}
  1. 3、采用内部迭代的方式
// 内部迭代forEach,在迭代的过程中仍然不允许对元素进行修改过删除操作
list.forEach(item -> System.out.println(item));
// 内部迭代还支持并行方式对元素进行迭代 如果数据量非常大的时候可以采用该方式(一般不采用)迭代出来的元素可能无序
list.parallelStream().forEach(System.out::println);
list.stream().forEach(System.out::print);
  1. 4、内部迭代底层实现
public void forEach(Consumer action) { Objects.requireNonNull(action);
final int expectedModCount = modCount; @SuppressWarnings("unchecked")
final E[] elementData = (E[]) this.elementData; final int size = this.size;
for (int i=0; modCount == expectedModCount && i < size; i++) { action.accept(elementData[i]);
}
if (modCount != expectedModCount) {
throw new ConcurrentModificationException();
}
}
  1. 5、使用迭代器进行迭代
// 直接使用迭代器进行迭代 这种迭代方式允许在迭代中对元素进行修改和删除操作
Iterator iterator = list.iterator(); while (iterator.hasNext()){
System.out.println(iterator.next());
}

几种迭代方式的性能比较

在数据规模为 一千万的情况下内部迭代表现较好 ,尽管在千万级的数据量并 行迭代依然速度不快,因为在线程的频换 切换和销毁等因素造成了一定的开销。

百万数据规模 的情况下, 增强for的性能较好 ,可以根据数据量来对元素进行迭代, fori方式和增强for性能差异不是很大。

LinkedList:

LinkedList继承自AbstractSequentialList可以知道LinkedList的元素是 顺序访问的 ,随机访问元素需要对链表进行遍历, 同样实现了克隆和序列化接口LinkedList还实现了 Deque相关的方法 ,可以当做一个队列来使用

LinkedList的类继承关系

LinkedList的特点:

  1. LinkedList的内部数据结构是一个 双向链表有一个头结点和一个尾部节点,在头部和尾部插入的效率非常高O(1)
  2. LinkedList的 平均查找效率为O(n)
  3. LinkedList的 删除和修改都需要先定位元素的位置,但是对于删除操作本身只需要O(1)的时间复杂度 LinkedList因为 采用了链表结构,所以理论空间是没有限制的,不需要扩容
  4. LinkedList在使用 下标访问元素的时候使用了折半查找,但是在数据量大的情况下,查找效率依然很慢 便于用作LRU

LinkedList的迭代方式

  • LinkedList的迭代方式其实和ArrayList大同小异,但是ArrayList在进行get(index)的操作只需要O(1)的时间复杂度

所以我们在使用LinkedList的时候不采用fori形式的遍历

  • 增强for方式进行遍历,其实相当于使用迭代器进行访问,增强for反编译以后其实就是iterator
  • 使用 迭代器对链表进行迭代,Linked的迭代器内部就是从头节点开始依次向下寻找节点
  • 使用内部迭代forEach方式

几种迭代方式的比较:

  1. LinkedList使用 增强for方式进行遍历速度较快 ,使用该fori进行遍历时候, 在百万级数据量程序直接卡死,所以LinkedList严禁使用fori遍历
    1.  
  2. 在千万级别数据量的情况下, 速度和ArrayList差不多,但ArrayList较快,因为ArrayList数据空间是连续的
    1.  

ArrayList和LinkedList的区别

  • 是否保证线程安全 : ArrayList 和 LinkedList 都是 不同步的,也就是不保证线程安全;
  • 底层数据结构 : Arraylist 底层使用的是 Object数组 ;LinkedList 底层使用的是 双向链表数据结构JDK1.6之前为循环链表,JDK1.7取消了循环。注意双向链表和双向循环链表的区别 ,下面有介绍到!)
  • 插入和删除是否受元素位置的影响:
    • ① ArrayList 采用 数组存储所以插入和删除元素的时间复杂度受元素位置的影响 。 比如:执行add(E e)方法的时候, ArrayList 会默认在 将指定的元素追加到此列表的末尾 ,这种情况时间复杂度就是O(1)。但是如果要在指定 位置 i 插入和删除元素的话(add(int index, E element))时间复杂度就为 O(n-i) 。因为在进行上述操作的时候集合中第 i 和第 i 个元素之后的(n-i)个元素都要执行向后位/向前移一位的操作。
    • ② LinkedList 采用 链表存储 ,所以 插入,删除元素时间复杂度不受元素位置的影响,都是近似 O(1)而数组为近似 O(n)
  • 否支持快速随机访问: LinkedList 不支持高效的随机元素访问,而 ArrayList 支持 。快速随机访问就是通过元素的序号快速获取元素对象(对应于get(int index)方法)。
  • 内存空间占用ArrayList的空 间浪费主要体现在在list列表的结尾会预留一定的容量空间,而LinkedList的空间花费则体现在它的每一个元素都需要消耗比ArrayList更多的空间 (因为要存放直接后继和直接前驱以及数据)

Map:

Map双列集合,即存储元素的时候是键值对的形式在Map中存储的,一个Entry结构的键值对映射,一个键对 应一个值,不允许出现重复的键,

HashMap

HashMap的类继承关系:

  • HashMap继承自AbstractMap同样一个抽象类的出现是为了实现一些子类通用的方法,一些个性化的方法还需要子类 去实现
  • HashMap内部是使用了 散列表+红黑树 进行存储数据的,即 数组+链表+红黑树

HashMap的特点

  • HashMap使用 位运算将HashMap中数组的大小一定是2的N次方 ,保证了在取出元素时候通过与运算能更高效 和更精确的定位数组下标 
  • 即使两个不一样的元素也可能会出现同样的 hashCode ,HashMap使用 拉链法设计解决了Hash冲突问题 ,同一个 散列槽(在我们这里就是数组的每一个槽)中的所有元素放到一个链表中
  • HashMap在 某一个槽上的 链表长度大于等于8 的时候并且 HashMap中数组的长度大于等于64 会进行 树化 ,将 链表转换成红黑树以提升查询效率
  • 增删改查元素的时候平均时间复杂度为O(1)非常高效
  • HashMap在插入的时候 允许空键空值
  • HashMap是 非同步的 ,多线程同时操作的时候会发生并发修改异常

HashMap的迭代方式

  • 通过keySet||value Set 进行遍历
// 获取到所有的key然后依次进行获取
Set keySet = map.keySet(); Integer val = 0;
for (Integer key : keySet) { val = map.get(key);
System.out.print("");
}
  • 通过entrySet对map进行遍历
Set<Map.Entry> entrySet = map.entrySet();
for (Map.Entry entry : entrySet) {
System.out.print("");
}
  • 使用内部迭代
Map objectObjectMap = new HashMap();
objectObjectMap.forEach( (o1, o2) ->System.out.println(o1.toString()+o2));
// 内部迭代底层依然是使用entrySet进行迭代,效率不如直接使用外部迭代
default void forEach(BiConsumer action) { Objects.requireNonNull(action);
for (Map.Entry entry : entrySet()) { K k;
V v; try {
k = entry.getKey();
v = entry.getValue();
} catch(IllegalStateException ise) {
// this usually means the entry is no longer in the map. throw new ConcurrentModificationException(ise);
}
action.accept(k, v);
}
}

几种迭代方式的性能差异

LinkedHashMap:

LinkedHashMap是HashMap的一个子类,内部维护了一个双向链表保证了元素插入的顺序

HashMap的类继承关系

LinkedHashMap的数据结构

LinkedHashMap的特点

  • LinkedHashMap是 HashMap的子类,其增删改查的平均时间复杂度依然是O(1)
  • LinkedHashMap的 节点占用了更多的空间,包括指向前一个节点的指针before和指向后一个节点的after指针
  • LinkedHashMap默认使用 插入顺序进行遍历,也可以使用访问顺序 ,将accessOrder置为true即可

LinkedHashMap的迭代方式

  • 使用 keySet进行遍历 ,keySet返回的是一个LinkedKeySet,LinkedKeySet的遍历方式是按照插入时候的顺序
  • 使用 entrySet进行遍历 ,返回LinkedEntrySet
  • 使用 内部迭代forEach
public void forEach(BiConsumer action) { if (action == null)
throw new NullPointerException(); int mc = modCount;
for (LinkedHashMap.Entry e = head; e != null; e = e.after) action.accept(e.key, e.value);
if (modCount != mc)
throw new ConcurrentModificationException();
}

TreeMap

TreeMap中的元素默认按照keys的自然排序排列。(对Integer来说,其自然排序就是数字的升序;对String来说,其自然排序就是按照字母表排序)

TreeMap的定义如下:

public class TreeMap
extends AbstractMap
implements NavigableMap, Cloneable, java.io.Serializable

TreeMap继承AbstractMap,实现NavigableMap、Cloneable、Serializable三个接口。其中AbstractMap表明TreeMap为一个Map即支持key-value的集合, NavigableMap(更多)则意味着它支持一系列的导航方法,具备针对给定搜索目标返回最接近匹配项的导航方法 。

TreeMap中同时也包含了如下几个重要的属性:

//比较器,因为TreeMap是有序的,通过comparator接口我们可以对TreeMap的内部排序进行精密的控制
private final Comparator comparator;
//TreeMap红-黑节点,为TreeMap的内部类
private transient Entry root = null;
//容器大小
private transient int size = 0;
//TreeMap修改次数
private transient int modCount = 0;
//红黑树的节点颜色--红色
private static final boolean RED = false;
//红黑树的节点颜色--黑色
private static final boolean BLACK = true;

对于叶子节点Entry是TreeMap的内部类,它有几个重要的属性:

//键
K key;
//值
V value;
//左孩子
Entry left = null;
//右孩子
Entry right = null;
//父亲
Entry parent;
//颜色
boolean color = BLACK;

数据结构:基于红黑树的一种实现,红黑树是自平横的二叉搜索树。二叉搜索树是排序好的二叉树。

Set

Set集合存储元素的特点就是, set存储元素都是无序并且不可重复的,比较常用的两种有HashSet和TreeSet

HashSet:

HashSet的类继承关系

Hashset的顶级接口是 Collection接口,属于单列集合,即每次存储一个元素

HashSet的数据结构

private transient HashMap map;// 内部维护了一个map,其底层实现靠的就是HashMap,键用于存放值

// Dummy value to associate with an Object in the backing Map
private static final Object PRESENT = new Object();// 这个空的Object对象作为所有的默认Value

/**
*Constructs a new, empty set; the backing HashMap instance has
*default initial capacity (16) and load factor (0.75).
*/
public HashSet() {
map = new HashMap();
}

// add方法其实就是调用了map的put,并传入一个空的value 
public boolean add(E e) {
return map.put(e, PRESENT)==null;
}

因为Set的元素和HashMap中的键是有相同的特征的,HashSet充分利用了HashMap的功能

HashSet的特点:

  • 存储元素时会去重,即集合中的元素都是不可重复的
  • HashSet 没有get方法 ,其实道理也很显而易见,因为元素是无序的所以不能根据下标来访问元素
  • HashSet的 本质就是HashMap

HashSet的迭代方式:

  • 使用迭代器进行迭代,其实本质上返回的就是HashMap的keySet
public Iterator iterator() { return map.keySet().iterator();
}
  • 使用forEach进行内部迭代,性能不如直接使用迭代器
set.forEach(k->System.out.println(k));

TreeSet

TreeSet是基于TreeMap实现的,TreeSet的元素支持2种排序方式:自然排序或者根据提供的Comparator进行排序。

继承关系:

TreeSet的特点

  • TreeSet中存储的元素是有序且不可重复的,所谓有序就是按照元素自身的排序顺序,或者使用者自定义比较 方式
  • 和HashSet类似TreeSet的底层实现就是 TreeMap
public TreeSet() {
this(new TreeMap());
}