我一直是一个简单使用的人:
List<String> names = new ArrayList<>();
我使用接口作为可移植性的类型名称,因此当我提出这样的问题时,我可以重新编写我的代码。
何时应在 ArrayList
上使用 LinkedList
,反之亦然?
std::vector
(如 Java ArrayList
)和 std::list
(如 Java LinkedList
)广泛讨论了这一点。
总结 ArrayList
与 ArrayDeque
在许多 比 LinkedList
更多的用例中更可取。如果您不确定 — 只需从 ArrayList
开始。
TLDR,在 ArrayList
中访问元素需要恒定时间 [O(1)],添加元素需要 O(n) 时间 [最坏情况]。在 LinkedList
中,插入元素需要 O(n) 时间,访问也需要 O(n) 时间,但 LinkedList
使用的内存比 ArrayList
多。
LinkedList
和 ArrayList
是 List 接口的两种不同实现。 LinkedList
使用双向链表实现它。 ArrayList
使用动态调整大小的数组来实现它。
与标准链表和数组操作一样,各种方法将具有不同的算法运行时。
get(int index) 是 O(n) (平均有 n/4 步),但是当 index = 0 或 index = list.size() - 1 时为 O(1) (在这种情况下,您也可以使用 getFirst( ) 和 getLast())。 LinkedList
add(int index, E element) 为 O(n) (平均有 n/4 步),但当 index = 0 或 index = list.size() - 1 时为 O(1) (在这种情况下,您也可以使用 addFirst() 和 addLast()/add())。 LinkedList
remove(int index) 是 O(n) (平均有 n/4 步),但是当 index = 0 或 index = list.size() - 1 时为 O(1) (在这种情况下,您也可以使用 removeFirst( ) 和 removeLast())。 LinkedList
Iterator.remove() 是 O(1)。 LinkedList
ListIterator.add(E 元素) 是 O(1)。 LinkedList
注意:许多操作平均需要 n/4 步,最佳情况下的步数恒定(例如 index = 0),最坏情况下需要 n/2 步(列表中间)
获取(整数索引)是 O(1)。 ArrayList
add(E element) 是 O(1) 摊销,但 O(n) 最坏情况,因为必须调整数组的大小和复制
add(int index, E element) 是 O(n) (平均有 n/2 步)
remove(int index) 是 O(n) (平均有 n/2 步)
Iterator.remove() 是 O(n) (平均有 n/2 步)
ListIterator.add(E element) 是 O(n) (平均有 n/2 步)
注意:许多操作平均需要 n/2 步,最佳情况下(列表末尾)的步数恒定,最坏情况下(列表开头)需要 n 步
LinkedList<E>
允许使用迭代器 进行恒定时间的插入或删除,但只能按顺序访问元素。换句话说,您可以向前或向后遍历列表,但在列表中查找位置所花费的时间与列表的大小成正比。 Javadoc 说 “索引到列表中的操作将从开头或结尾遍历列表,以较近者为准”,因此这些方法是 O(n) (n/4 步),但对于 index = 0
O(1)。
另一方面,ArrayList<E>
允许快速随机读取访问,因此您可以在恒定时间内抓取任何元素。但是从任何地方添加或删除,但最后需要将所有后面的元素转移过来,要么打开一个开口,要么填补空白。此外,如果添加的元素多于基础数组的容量,则会分配一个新数组(大小的 1.5 倍),并将旧数组复制到新数组,因此添加到 ArrayList
是 O (n) 在最坏的情况下但平均保持不变。
因此,根据您打算执行的操作,您应该相应地选择实现。迭代任何一种 List 实际上同样便宜。 (迭代 ArrayList
在技术上更快,但除非您正在做一些真正对性能敏感的事情,否则您不必担心这一点——它们都是常量。)
当您重新使用现有迭代器来插入和删除元素时,使用 LinkedList
的主要好处就出现了。这些操作可以在 O(1) 中通过仅在本地更改列表来完成。在数组列表中,数组的其余部分需要移动(即复制)。另一方面,在 LinkedList
中搜索意味着在最坏的情况下遵循 O(n) 中的链接(n/2 步),而在 ArrayList
所需位置可以通过数学计算并在 O(1) 中访问。
使用 LinkedList
的另一个好处是当您从列表的头部添加或删除时,因为这些操作是 O(1),而它们是 O(n) 对于 ArrayList
。请注意,ArrayDeque
可能是 LinkedList
的一个很好的替代方法,用于添加和删除头部,但它不是 List
。
此外,如果您有大型列表,请记住内存使用量也不同。 LinkedList
的每个元素都有更多开销,因为还存储了指向下一个和前一个元素的指针。 ArrayLists
没有这种开销。但是,无论是否实际添加了元素,ArrayLists
都会占用为容量分配的内存。
ArrayList
的默认初始容量非常小(Java 1.4 - 1.8 为 10)。但是由于底层实现是一个数组,如果添加很多元素,则必须调整数组的大小。为避免在您知道要添加大量元素时调整大小的高成本,请构造具有更高初始容量的 ArrayList
。
如果从数据结构的角度来理解这两种结构,LinkedList 基本上是一个包含头节点的顺序数据结构。 Node 是两个组件的包装器:一个 T 类型的值 [通过泛型接受] 和另一个对链接到它的 Node 的引用。所以,我们可以断言它是一个递归数据结构(一个节点包含另一个节点,另一个节点有另一个节点,依此类推......)。如上所述,在 LinkedList 中添加元素需要线性时间。
ArrayList 是一个可增长的数组。它就像一个常规数组。在幕后,当添加一个元素并且 ArrayList 已经满载时,它会创建另一个大小大于先前大小的数组。然后将元素从先前的数组复制到新数组,并且要添加的元素也放置在指定的索引处。
到目前为止,除了 LinkedList
比 ArrayList
“多得多”这一普遍共识之外,似乎没有人解决每个列表的内存占用问题,所以我做了一些数字运算来准确证明两个列表占用了多少对于 N 个空引用。
由于引用在其相关系统上是 32 位或 64 位(即使为空),因此我为 32 位和 64 位 LinkedLists
和 ArrayLists
包含了 4 组数据。
注意: ArrayList
行显示的大小适用于修剪后的列表 - 实际上,ArrayList
中的后备数组的容量通常大于其当前的容量元素计数。
注意 2:(感谢 BeeOnRope)由于 CompressedOops 现在是 JDK6 中期及更高版本的默认值,因此以下 64 位机器的值将基本匹配它们的 32 位对应物,当然除非您特别将其关闭。
https://i.imgur.com/f83xDyz.png
结果清楚地表明 LinkedList
比 ArrayList
多得多,尤其是在元素数量非常多的情况下。如果内存是一个因素,请避开 LinkedLists
。
我使用的公式如下,如果我做错了什么,请告诉我,我会修复它。对于 32 位或 64 位系统,“b”是 4 或 8,“n”是元素的数量。注意 mods 的原因是因为 java 中的所有对象无论是否全部使用都会占用 8 字节空间的倍数。
数组列表:
ArrayList object header + size integer + modCount integer + array reference + (array oject header + b * n) + MOD(array oject, 8) + MOD(ArrayList object, 8) == 8 + 4 + 4 + b + (12 + b * n) + MOD(12 + b * n, 8) + MOD(8 + 4 + 4 + b + (12 + b * n) + MOD(12 + b * n, 8), 8)
链表:
LinkedList object header + size integer + modCount integer + reference to header + reference to footer + (node object overhead + reference to previous element + reference to next element + reference to element) * n) + MOD(node object, 8) * n + MOD(LinkedList object, 8) == 8 + 4 + 4 + 2 * b + (8 + 3 * b) * n + MOD(8 + 3 * b, 8) * n + MOD(8 + 4 + 4 + 2 * b + (8 + 3 * b) * n + MOD(8 + 3 * b, 8) * n, 8)
int
的对象进行建模,即 4 或 8 个字节的数据。在链表中,基本上有 4 个“词”的开销。因此,您的图表给人的印象是链表使用了“五倍”的数组列表存储空间。这是错误的。开销是每个对象 16 或 32 个字节,作为附加调整,而不是缩放因子。
ArrayList
是您想要的。 LinkedList
几乎总是一个(性能)错误。
为什么 LinkedList
很烂:
它使用大量的小内存对象,因此会影响整个进程的性能。
许多小对象不利于缓存局部性。
任何索引操作都需要遍历,即具有 O(n) 性能。这在源代码中并不明显,导致算法 O(n) 比使用 ArrayList 慢。
获得良好的性能是棘手的。
即使 big-O 性能与 ArrayList 相同,它也可能会明显变慢。
在源代码中看到 LinkedList 令人震惊,因为它可能是错误的选择。
Algorithm ArrayList LinkedList
seek front O(1) O(1)
seek back O(1) O(1)
seek to index O(1) O(N)
insert at front O(N) O(1)
insert at back O(1) O(1)
insert after an item O(N) O(1)
Algorithms: Big-Oh Notation(存档)
ArrayLists 适用于一次写入多次读取或附加程序,但不适合从前面或中间添加/删除。
O(1)
的中间。它必须遍历列表的一半才能找到插入点。
LinkedList
is O(1)
如果您有一个指向插入位置的迭代器,即 ListIterator.add
应该是 LinkedList
的 O(1)
.
作为一个在超大规模 SOA Web 服务上进行操作性能工程大约十年的人,我更喜欢 LinkedList 的行为而不是 ArrayList。虽然 LinkedList 的稳态吞吐量更差,因此可能会导致购买更多硬件 - ArrayList 在压力下的行为可能会导致集群中的应用程序以近乎同步的方式扩展其阵列,并且对于大阵列大小可能会导致缺乏响应能力在应用程序和中断,而在压力下,这是灾难性的行为。
同样,您可以从默认吞吐量的终身垃圾收集器中获得更好的应用程序吞吐量,但是一旦您获得具有 10GB 堆的 Java 应用程序,您可能会在 Full GC 期间锁定应用程序 25 秒,这会导致 SOA 应用程序超时和失败如果它发生得太频繁,就会破坏你的 SLA。尽管 CMS 收集器占用更多资源并且无法达到相同的原始吞吐量,但它是一个更好的选择,因为它具有更高的可预测性和更小的延迟。
如果您所说的性能是吞吐量并且您可以忽略延迟,那么 ArrayList 只是性能更好的选择。根据我的工作经验,我不能忽视最坏情况下的延迟。
更新(2021 年 8 月 27 日——10 年后):这个答案(我对 SO 历史上最受好评的答案)很可能是错误的(原因在下面的评论中列出)。我想补充一点,ArrayList 将优化内存的顺序读取并最大限度地减少缓存行和 TLB 未命中等。相比之下,当数组增长超过界限时的复制开销可能是无关紧要的(并且可以通过高效的 CPU 操作来完成)。考虑到硬件趋势,随着时间的推移,这个答案也可能变得更糟。 LinkedList 可能有意义的唯一情况是高度做作的事情,您有数千个列表,其中任何一个都可能增长到 GB 大小,但是在分配列表和设置它们时无法做出好的猜测所有到 GB 大小的都会炸毁堆。如果你发现了这样的问题,那么它确实需要重新设计你的解决方案(我不喜欢轻易建议重新设计旧代码,因为我自己维护成堆的旧代码,但那将是一个非常好的案例,原始设计只是跑出了跑道,确实需要被淘汰)。不过,我仍然会将我几十年前的糟糕观点留在那里供您阅读。简单,合乎逻辑而且非常错误。
LinkedList
always 分配的内存是普通引用数组的五倍,因此即使内存没有回收,临时需要 2.5 倍的 ArrayList
仍然消耗更少的内存。由于大数组分配绕过了 Eden 空间,它们对 GC 行为没有任何影响,除非内存确实不够,在这种情况下,LinkedList
会更早地爆炸……
是的,我知道,这是一个古老的问题,但我会投入两分钱:
LinkedList 在性能方面几乎总是错误的选择。有一些非常特殊的算法需要 LinkedList,但这些算法非常非常罕见,并且该算法通常特别依赖于 LinkedList 在列表中间相对快速地插入和删除元素的能力,一旦你导航到那里使用 ListIterator。
LinkedList 优于 ArrayList 的一个常见用例是:队列。但是,如果您的目标是性能,而不是 LinkedList,您还应该考虑使用 ArrayBlockingQueue(如果您可以提前确定队列大小的上限,并且可以负担预先分配所有内存),或者这个 {1 }。 (是的,它是从 2001 年开始的,因此您需要对其进行泛化,但我得到的性能比与刚刚在最近的 JVM 中引用的文章中的内容相当)
ArrayDeque
。 docs.oracle.com/javase/6/docs/api/java/util/ArrayDeque.html
ArrayDeque
比 LinkedList
慢,除非所有操作都在同一端。用作堆栈时还可以,但它不能构成一个好的队列。
ArrayDeque
用作堆栈时可能比 Stack
快,而用作队列时可能比 LinkedList
快。
ArrayDeque
文档的引用。
LinkedList 的作者 Joshua Bloch:
有人真的使用 LinkedList 吗?我写了它,我从不使用它。
链接:https://twitter.com/joshbloch/status/583813919019573248
我很抱歉这个答案没有像其他答案那样信息丰富,但我认为如果不透露的话,这将是最不言自明的。
这是一个效率问题。 LinkedList
添加和删除元素的速度很快,但访问特定元素的速度很慢。 ArrayList
访问特定元素的速度很快,但添加到任一端可能会很慢,尤其是在中间删除很慢。
Array vs ArrayList vs LinkedList vs Vector 更深入,Linked List 也是如此。
LinkedList
仅在第一个和最后一个位置添加/删除速度很快 - 那么复杂度将是 O(1),但在中间添加仍然是 O(n),因为我们需要运行LinkedList
的大约 n/2 个元素。
正确或错误:请在本地执行测试并自行决定!
LinkedList
中的编辑/删除比 ArrayList
快。
ArrayList
,以Array
为后盾,需要加倍大小,在大容量应用中效果更差。
下面是每个操作的单元测试结果。时间以纳秒为单位。
Operation ArrayList LinkedList
AddAll (Insert) 101,16719 2623,29291
Add (Insert-Sequentially) 152,46840 966,62216
Add (insert-randomly) 36527 29193
remove (Delete) 20,56,9095 20,45,4904
contains (Search) 186,15,704 189,64,981
这是代码:
import org.junit.Assert;
import org.junit.Test;
import java.util.*;
public class ArrayListVsLinkedList {
private static final int MAX = 500000;
String[] strings = maxArray();
////////////// ADD ALL ////////////////////////////////////////
@Test
public void arrayListAddAll() {
Watch watch = new Watch();
List<String> stringList = Arrays.asList(strings);
List<String> arrayList = new ArrayList<String>(MAX);
watch.start();
arrayList.addAll(stringList);
watch.totalTime("Array List addAll() = ");//101,16719 Nanoseconds
}
@Test
public void linkedListAddAll() throws Exception {
Watch watch = new Watch();
List<String> stringList = Arrays.asList(strings);
watch.start();
List<String> linkedList = new LinkedList<String>();
linkedList.addAll(stringList);
watch.totalTime("Linked List addAll() = "); //2623,29291 Nanoseconds
}
//Note: ArrayList is 26 time faster here than LinkedList for addAll()
///////////////// INSERT /////////////////////////////////////////////
@Test
public void arrayListAdd() {
Watch watch = new Watch();
List<String> arrayList = new ArrayList<String>(MAX);
watch.start();
for (String string : strings)
arrayList.add(string);
watch.totalTime("Array List add() = ");//152,46840 Nanoseconds
}
@Test
public void linkedListAdd() {
Watch watch = new Watch();
List<String> linkedList = new LinkedList<String>();
watch.start();
for (String string : strings)
linkedList.add(string);
watch.totalTime("Linked List add() = "); //966,62216 Nanoseconds
}
//Note: ArrayList is 9 times faster than LinkedList for add sequentially
/////////////////// INSERT IN BETWEEN ///////////////////////////////////////
@Test
public void arrayListInsertOne() {
Watch watch = new Watch();
List<String> stringList = Arrays.asList(strings);
List<String> arrayList = new ArrayList<String>(MAX + MAX / 10);
arrayList.addAll(stringList);
String insertString0 = getString(true, MAX / 2 + 10);
String insertString1 = getString(true, MAX / 2 + 20);
String insertString2 = getString(true, MAX / 2 + 30);
String insertString3 = getString(true, MAX / 2 + 40);
watch.start();
arrayList.add(insertString0);
arrayList.add(insertString1);
arrayList.add(insertString2);
arrayList.add(insertString3);
watch.totalTime("Array List add() = ");//36527
}
@Test
public void linkedListInsertOne() {
Watch watch = new Watch();
List<String> stringList = Arrays.asList(strings);
List<String> linkedList = new LinkedList<String>();
linkedList.addAll(stringList);
String insertString0 = getString(true, MAX / 2 + 10);
String insertString1 = getString(true, MAX / 2 + 20);
String insertString2 = getString(true, MAX / 2 + 30);
String insertString3 = getString(true, MAX / 2 + 40);
watch.start();
linkedList.add(insertString0);
linkedList.add(insertString1);
linkedList.add(insertString2);
linkedList.add(insertString3);
watch.totalTime("Linked List add = ");//29193
}
//Note: LinkedList is 3000 nanosecond faster than ArrayList for insert randomly.
////////////////// DELETE //////////////////////////////////////////////////////
@Test
public void arrayListRemove() throws Exception {
Watch watch = new Watch();
List<String> stringList = Arrays.asList(strings);
List<String> arrayList = new ArrayList<String>(MAX);
arrayList.addAll(stringList);
String searchString0 = getString(true, MAX / 2 + 10);
String searchString1 = getString(true, MAX / 2 + 20);
watch.start();
arrayList.remove(searchString0);
arrayList.remove(searchString1);
watch.totalTime("Array List remove() = ");//20,56,9095 Nanoseconds
}
@Test
public void linkedListRemove() throws Exception {
Watch watch = new Watch();
List<String> linkedList = new LinkedList<String>();
linkedList.addAll(Arrays.asList(strings));
String searchString0 = getString(true, MAX / 2 + 10);
String searchString1 = getString(true, MAX / 2 + 20);
watch.start();
linkedList.remove(searchString0);
linkedList.remove(searchString1);
watch.totalTime("Linked List remove = ");//20,45,4904 Nanoseconds
}
//Note: LinkedList is 10 millisecond faster than ArrayList while removing item.
///////////////////// SEARCH ///////////////////////////////////////////
@Test
public void arrayListSearch() throws Exception {
Watch watch = new Watch();
List<String> stringList = Arrays.asList(strings);
List<String> arrayList = new ArrayList<String>(MAX);
arrayList.addAll(stringList);
String searchString0 = getString(true, MAX / 2 + 10);
String searchString1 = getString(true, MAX / 2 + 20);
watch.start();
arrayList.contains(searchString0);
arrayList.contains(searchString1);
watch.totalTime("Array List addAll() time = ");//186,15,704
}
@Test
public void linkedListSearch() throws Exception {
Watch watch = new Watch();
List<String> linkedList = new LinkedList<String>();
linkedList.addAll(Arrays.asList(strings));
String searchString0 = getString(true, MAX / 2 + 10);
String searchString1 = getString(true, MAX / 2 + 20);
watch.start();
linkedList.contains(searchString0);
linkedList.contains(searchString1);
watch.totalTime("Linked List addAll() time = ");//189,64,981
}
//Note: Linked List is 500 Milliseconds faster than ArrayList
class Watch {
private long startTime;
private long endTime;
public void start() {
startTime = System.nanoTime();
}
private void stop() {
endTime = System.nanoTime();
}
public void totalTime(String s) {
stop();
System.out.println(s + (endTime - startTime));
}
}
private String[] maxArray() {
String[] strings = new String[MAX];
Boolean result = Boolean.TRUE;
for (int i = 0; i < MAX; i++) {
strings[i] = getString(result, i);
result = !result;
}
return strings;
}
private String getString(Boolean result, int i) {
return String.valueOf(result) + i + String.valueOf(!result);
}
}
LinkedList
的内存开销要大得多,因为每个元素都有一个具有五个字段的节点对象。在许多产生 20 字节开销的系统上。 ArrayList
的每个元素的平均内存开销为一个半字,即 6 个字节,最坏情况下为 8 个字节。
removeIf(element -> condition)
,与通过迭代器循环和删除相比,ArrayList
可以明显更快,因为不需要为每个单独的元素移动整个余数。这是否比 LinkedList
表现更好或更差取决于特定场景,因为理论上 LinkedList
是 O(1),但仅删除单个节点需要多次内存访问,这很容易超过 { 2} 删除大量元素时。
ArrayList
本质上是一个数组。 LinkedList
实现为双链表。
get
非常清楚。 ArrayList
的 O(1),因为 ArrayList
允许使用索引进行随机访问。 LinkedList
的 O(n),因为它需要先找到索引。注意:add
和 remove
有不同的版本。
LinkedList
的添加和删除速度更快,但获取速度较慢。简而言之,如果出现以下情况,应该首选 LinkedList
:
没有大量的元素随机访问 有大量的添加/删除操作
=== 数组列表 ===
add(E e) 在 ArrayList 末尾添加需要内存调整成本。 O(n) 最差,O(1) 摊销
在 ArrayList 末尾添加
需要调整内存大小的成本。
O(n) 最差,O(1) 摊销
add(int index, E element) 添加到特定索引位置需要移位和可能的内存调整成本 O(n)
添加到特定的索引位置
需要转移和可能的内存调整成本
上)
remove(int index) 删除指定元素需要移位和可能的内存调整成本 O(n)
移除指定元素
需要转移和可能的内存调整成本
上)
remove(Object o) 从此列表中删除第一次出现的指定元素需要先搜索元素,然后移位和可能的内存调整成本 O(n)
从此列表中删除第一次出现的指定元素
需要先搜索元素,然后转移和可能的内存调整成本
上)
=== 链表 ===
add(E e) 添加到列表的末尾 O(1)
添加到列表的末尾
O(1)
add(int index, E element) 在指定位置插入需要先找到位置 O(n)
在指定位置插入
需要先找到位置
上)
remove() 删除列表的第一个元素 O(1)
删除列表的第一个元素
O(1)
remove(int index) 删除指定索引的元素 需要先找到元素 O(n)
移除指定索引的元素
需要先找到元素
上)
remove(Object o) 删除第一次出现的指定元素 需要先找到该元素 O(n)
删除指定元素的第一次出现
需要先找到元素
上)
这是programcreek.com中的一个图(add
和remove
是第一种,即在列表末尾添加一个元素并在列表中删除指定位置的元素。):
https://i.stack.imgur.com/pdKaZ.png
TL;DR 由于现代计算机体系结构,ArrayList
对于几乎所有可能的用例都会显着提高效率 - 因此除了一些非常独特和极端的情况外,应避免使用 LinkedList
。
理论上,LinkedList 对于 add(E element)
有一个 O(1)
此外,在列表中间添加一个元素应该非常有效。
实践非常不同,因为 LinkedList 是一个 Cache Hostile 数据结构。从性能 POV 来看 - 在极少数情况下,LinkedList
可能比 缓存友好 ArrayList
的性能更好。
以下是在随机位置插入元素的基准测试结果。如您所见 - 数组列表效率更高,尽管理论上列表中间的每个插入都需要“移动”数组的 n 个后面的元素(较低的值更好):
https://i.stack.imgur.com/edAd8.png
在下一代硬件上工作(更大、更高效的缓存)——结果更具决定性:
https://i.stack.imgur.com/XtdBP.png
LinkedList 需要更多的时间来完成同样的工作。 source Source Code
这有两个主要原因:
主要是 - LinkedList 的节点随机分散在内存中。 RAM(“随机存取存储器”)并不是真正随机的,需要提取内存块进行缓存。这个操作需要时间,而且当这种抓取频繁发生时——缓存中的内存页需要一直被替换->缓存未命中->缓存效率不高。 ArrayList 元素存储在连续内存上——这正是现代 CPU 架构正在优化的目标。二级 LinkedList 需要保留后向/前向指针,这意味着与 ArrayList 相比,存储的每个值的内存消耗是 3 倍。
顺便说一句,DynamicIntArray 是一个自定义 ArrayList 实现,它包含 Int
(原始类型)而不是对象 - 因此所有数据实际上都是相邻存储的 - 因此效率更高。
要记住的一个关键因素是,获取内存块的成本比访问单个内存单元的成本更重要。这就是为什么读取器 1MB 的顺序内存比从不同的内存块读取这么多的数据快 400 倍:
Latency Comparison Numbers (~2012)
----------------------------------
L1 cache reference 0.5 ns
Branch mispredict 5 ns
L2 cache reference 7 ns 14x L1 cache
Mutex lock/unlock 25 ns
Main memory reference 100 ns 20x L2 cache, 200x L1 cache
Compress 1K bytes with Zippy 3,000 ns 3 us
Send 1K bytes over 1 Gbps network 10,000 ns 10 us
Read 4K randomly from SSD* 150,000 ns 150 us ~1GB/sec SSD
Read 1 MB sequentially from memory 250,000 ns 250 us
Round trip within same datacenter 500,000 ns 500 us
Read 1 MB sequentially from SSD* 1,000,000 ns 1,000 us 1 ms ~1GB/sec SSD, 4X memory
Disk seek 10,000,000 ns 10,000 us 10 ms 20x datacenter roundtrip
Read 1 MB sequentially from disk 20,000,000 ns 20,000 us 20 ms 80x memory, 20X SSD
Send packet CA->Netherlands->CA 150,000,000 ns 150,000 us 150 ms
来源:Latency Numbers Every Programmer Should Know
为了更清楚地说明这一点,请检查将元素添加到列表开头的基准。这是一个用例,从理论上讲,LinkedList
应该真正发挥作用,而 ArrayList
应该呈现较差甚至更坏的结果:
https://i.stack.imgur.com/2EygL.png
注意:这是 C++ 标准库的基准测试,但我之前的经验表明 C++ 和 Java 的结果非常相似。 Source Code
复制连续的大量内存是现代 CPU 优化的操作 - 改变理论并实际上再次使 ArrayList
/Vector
更加高效
致谢:此处发布的所有基准均由 Kjell Hedström 创建。在 his blog 上可以找到更多数据
ArrayList
数组的中间使用本地方法 java.lang.System.arraycopy()
,该方法是在 OpenJDK 中用 C++ 编写的。因此,虽然理论上 LinkedList
在实践中要做的工作较少,但有很多语言外的机制使得“大 O”在很大程度上无关紧要。根据这个出色的答案,特别是缓存友好的东西。
ArrayList
可以随机访问,而 LinkedList
扩展和删除元素的成本非常低。对于大多数情况,ArrayList
很好。
除非您创建了大型列表并测量了瓶颈,否则您可能永远不需要担心差异。
如果您的代码有 add(0)
和 remove(0)
,请使用 LinkedList
,它是更漂亮的 addFirst()
和 removeFirst()
方法。否则,使用 ArrayList
。
当然,Guava 的 ImmutableList 是您最好的朋友。
我通常根据我在该特定列表上执行的操作的时间复杂性使用一个而不是另一个。
|---------------------|---------------------|--------------------|------------|
| Operation | ArrayList | LinkedList | Winner |
|---------------------|---------------------|--------------------|------------|
| get(index) | O(1) | O(n) | ArrayList |
| | | n/4 steps in avg | |
|---------------------|---------------------|--------------------|------------|
| add(E) | O(1) | O(1) | LinkedList |
| |---------------------|--------------------| |
| | O(n) in worst case | | |
|---------------------|---------------------|--------------------|------------|
| add(index, E) | O(n) | O(n) | LinkedList |
| | n/2 steps | n/4 steps | |
| |---------------------|--------------------| |
| | | O(1) if index = 0 | |
|---------------------|---------------------|--------------------|------------|
| remove(index, E) | O(n) | O(n) | LinkedList |
| |---------------------|--------------------| |
| | n/2 steps | n/4 steps | |
|---------------------|---------------------|--------------------|------------|
| Iterator.remove() | O(n) | O(1) | LinkedList |
| ListIterator.add() | | | |
|---------------------|---------------------|--------------------|------------|
|--------------------------------------|-----------------------------------|
| ArrayList | LinkedList |
|--------------------------------------|-----------------------------------|
| Allows fast read access | Retrieving element takes O(n) |
|--------------------------------------|-----------------------------------|
| Adding an element require shifting | o(1) [but traversing takes time] |
| all the later elements | |
|--------------------------------------|-----------------------------------|
| To add more elements than capacity |
| new array need to be allocated |
|--------------------------------------|
让我们比较一下 LinkedList 和 ArrayList wrt 下面的参数:
一、实施
ArrayList 是 list 接口的可调整大小的数组实现,而 LinkedList 是 list 接口的双向链表实现。
2. 性能
get(int index) 或搜索操作 ArrayList get(int index) 操作在恒定时间内运行,即 O(1) 而 LinkedList get(int index) 操作运行时间为 O(n) 。 ArrayList 比 LinkedList 快的原因是 ArrayList 对其元素使用基于索引的系统,因为它在内部使用数组数据结构,另一方面,LinkedList 不为其元素提供基于索引的访问,因为它从开始或结束(以更接近者为准)以检索指定元素索引处的节点。
insert() 或 add(Object) 操作 LinkedList 中的插入通常比 ArrayList 快。在 LinkedList 添加或插入是 O(1) 操作。而在 ArrayList 中,如果数组是完整的,即最坏的情况,调整数组大小和将元素复制到新数组会产生额外的成本,这使得 ArrayList 中添加操作的运行时间为 O(n),否则为 O(1) .
remove(int) 操作 LinkedList 中的Remove 操作一般与ArrayList 相同,即O(n)。在 LinkedList 中,有两个重载的 remove 方法。一种是不带任何参数的 remove(),它删除列表的头部并以恒定时间 O(1) 运行。 LinkedList 中另一个重载的删除方法是 remove(int) 或 remove(Object),它删除作为参数传递的 Object 或 int。此方法遍历 LinkedList 直到找到 Object 并将其从原始列表中取消链接。因此,此方法运行时间为 O(n)。而在 ArrayList remove(int) 方法涉及将元素从旧数组复制到新的更新数组,因此它的运行时间是 O(n)。
3. 反向迭代器
LinkedList 可以使用 descendingIterator() 进行反向迭代,而 ArrayList 中没有 descendingIterator(),因此我们需要编写自己的代码来反向迭代 ArrayList。
4. 初始容量
如果构造函数没有重载,那么 ArrayList 会创建一个初始容量为 10 的空列表,而 LinkedList 只构造没有任何初始容量的空列表。
5. 内存开销
与 ArrayList 相比,LinkedList 中的内存开销更大,因为 LinkedList 中的节点需要维护下一个和前一个节点的地址。而在 ArrayList 中,每个索引只保存实际的对象(数据)。
我知道这是一篇旧帖子,但老实说,我不敢相信没有人提到 LinkedList
实现了 Deque
。只需查看 Deque
(和 Queue
)中的方法;如果您想要公平比较,请尝试针对 ArrayDeque
运行 LinkedList
并进行功能比较。
这是 ArrayList
和 LinkedList
以及 CopyOnWrite-ArrayList
中的 Big-O 表示法:
数组列表
get O(1)
add O(1)
contains O(n)
next O(1)
remove O(n)
iterator.remove O(n)
链表
get O(n)
add O(1)
contains O(n)
next O(1)
remove O(1)
iterator.remove O(1)
CopyOnWrite-ArrayList
get O(1)
add O(n)
contains O(n)
next O(1)
remove O(n)
iterator.remove O(n)
基于这些,您必须决定选择什么。 :)
LinkedList.add()
也不是,尽管这里的大多数答案都是这样说的。
除了上面的其他好参数之外,您应该注意到 ArrayList
实现了 RandomAccess
接口,而 LinkedList
实现了 Queue
。
因此,它们以某种方式解决了略有不同的问题,效率和行为有所不同(请参阅他们的方法列表)。
这取决于您将在列表中执行更多操作。
ArrayList
访问索引值的速度更快。插入或删除对象时情况更糟。
要了解更多信息,请阅读任何有关数组和链表之间区别的文章。
请参阅the Java Tutorials - List Implementations。
数组列表本质上是一个具有添加项目等方法的数组(您应该改用通用列表)。它是可以通过索引器访问的项目集合(例如 [0])。它意味着从一个项目到下一个项目的进展。
链表指定从一个项目到下一个项目的进展(项目 a -> 项目 b)。您可以使用数组列表获得相同的效果,但链表绝对说明了应该在前一个之后的项目。
链表的一个重要特征(我在另一个答案中没有读到)是两个列表的串联。对于数组,这是 O(n)(+ 一些重新分配的开销)对于链表,这只是 O(1) 或 O(2) ;-)
重要提示:对于 Java,它的 LinkedList
不正确!请参阅Is there a fast concat method for linked list in Java?
next
指向第二个列表中的第一个节点。唯一的方法是使用按顺序添加元素的 addAll()
,尽管它比循环并为每个元素调用 add()
要好。要在 O(1) 中快速完成此操作,您需要一个合成类(如 org.apache.commons.collections.collection.CompositeCollection),但这适用于任何类型的列表/集合。
ArrayList 和 LinkedList 各有优缺点。
ArrayList 使用连续的内存地址,而 LinkedList 使用指向下一个节点的指针。因此,当您想在 ArrayList 中查找元素时,比使用 LinkedList 进行 n 次迭代要快。
另一方面,LinkedList 中的插入和删除要容易得多,因为您只需更改指针,而 ArrayList 意味着对任何插入或删除都使用移位操作。
如果您的应用程序中有频繁的检索操作,请使用 ArrayList。如果您经常插入和删除,请使用 LinkedList。
1) 底层数据结构
ArrayList 和 LinkedList 之间的第一个区别在于 ArrayList 由 Array 支持,而 LinkedList 由 LinkedList 支持。这将导致性能上的进一步差异。
2) LinkedList 实现 Deque
ArrayList 和 LinkedList 的另一个区别是除了 List 接口之外,LinkedList 还实现了 Deque 接口,该接口提供了 add()
和 poll()
的先进先出操作以及其他几个 Deque 函数。 3)在ArrayList中添加元素 在ArrayList中添加元素如果不触发Array的re-size是O(1)操作,在这种情况下它变为O(log(n)),另一方面,在其中追加一个元素LinkedList 是 O(1) 操作,因为它不需要任何导航。
4) 从一个位置移除一个元素
为了从特定索引中删除元素,例如通过调用 remove(index)
,ArrayList 执行复制操作,使其接近 O(n),而 LinkedList 需要遍历该点,这也使其成为 O(n/2),因为它可以根据接近度从任一方向遍历。
5) 遍历 ArrayList 或 LinkedList
迭代是 LinkedList 和 ArrayList 的 O(n) 操作,其中 n 是元素的编号。
6) 从某个位置检索元素
get(index)
操作在 ArrayList 中为 O(1),而在 LinkedList 中为 O(n/2),因为它需要遍历该条目。不过,在大 O 表示法中,O(n/2) 只是 O(n),因为我们忽略了那里的常数。
7) 内存
LinkedList 使用一个包装对象 Entry,它是一个静态嵌套类,用于存储数据和两个节点 next 和 previous,而 ArrayList 只是将数据存储在 Array 中。
因此,ArrayList 的内存需求似乎比 LinkedList 少,除了 Array 在将内容从一个 Array 复制到另一个 Array 时执行重新调整大小操作的情况。
如果 Array 足够大,此时可能会占用大量内存并触发垃圾收集,这会减慢响应时间。
从 ArrayList 与 LinkedList 之间的所有上述差异来看,看起来 ArrayList 在几乎所有情况下都是比 LinkedList 更好的选择,除非您执行频繁的 add()
操作而不是 remove()
或 get()
。
修改链表比修改 ArrayList 更容易,特别是当您从开始或结束添加或删除元素时,因为链表内部保留了这些位置的引用,并且它们可以在 O(1) 时间内访问。
换句话说,你不需要遍历链表到达你想要添加元素的位置,那样的话,加法就变成了O(n)的操作。例如,在链表中间插入或删除一个元素。
在我看来,对于 Java 中的大多数实际目的,使用 ArrayList 而不是 LinkedList。
我已经阅读了回复,但在一种情况下,我总是在 ArrayList 上使用 LinkedList,我想分享以听取意见:
每次我有一个方法返回从数据库获得的数据列表时,我总是使用 LinkedList。
我的理由是,因为不可能确切知道我得到了多少结果,所以不会浪费内存(就像 ArrayList 中的容量和实际元素数量之间的差异一样),并且不会浪费时间尝试复制容量。
就 ArrayList 而言,我同意至少您应该始终使用具有初始容量的构造函数,以尽可能减少数组的重复。
LinkedList
每个元素的开销要高得多(每个元素 3 个指针)。 ArrayList
每个元素有 1 个指针。因此,即使 ArrayList
只填充了一半,它的开销也永远不会超过 LinkedList
。
ArrayList
和 LinkedList
都实现了 List interface
,它们的方法和结果几乎相同。但是,它们之间几乎没有区别,这取决于要求,它们使一个比另一个更好。
ArrayList 与 LinkedList
1) 与 LinkedList
搜索操作相比,Search:
ArrayList
搜索操作非常快。 ArrayList
中的 get(int index)
给出了 O(1)
的性能,而 LinkedList
的性能是 O(n)
。
Reason:
ArrayList
为其元素维护基于索引的系统,因为它隐式使用数组数据结构,这使得在列表中搜索元素的速度更快。另一方面,LinkedList
实现了双向链表,它需要遍历所有元素以搜索元素。
2) Deletion:
LinkedList
删除操作提供 O(1)
性能,而 ArrayList
提供可变性能:O(n)
在最坏的情况下(同时删除第一个元素)和 O(1)
在最好的情况下(同时删除最后一个元素)。
结论:LinkedList 元素删除比 ArrayList 更快。
原因:LinkedList 的每个元素都维护着两个指针(地址),它们指向列表中的两个相邻元素。因此,删除只需要更改将要删除的节点的两个相邻节点(元素)中的指针位置。而在 ArrayList 中,所有元素都需要移动以填充已删除元素创建的空间。
3) Inserts Performance:
LinkedList
add 方法提供 O(1)
性能,而 ArrayList
在最坏的情况下提供 O(n)
。原因与删除的解释相同。
4) Memory Overhead:
ArrayList
维护索引和元素数据,而 LinkedList
维护元素数据和相邻节点的两个指针
因此,LinkedList 中的内存消耗相对较高。
这些类之间几乎没有相似之处,如下所示:
ArrayList 和 LinkedList 都是 List 接口的实现。
它们都维护元素插入顺序,这意味着在显示 ArrayList 和 LinkedList 元素时,结果集将具有与元素插入列表相同的顺序。
这两个类都是非同步的,可以使用 Collections.synchronizedList 方法显式同步。
这些类返回的迭代器和 listIterator 是快速失败的(如果在创建迭代器后的任何时间对 list 进行结构修改,除了通过迭代器自己的 remove 或 add 方法之外的任何方式,迭代器将抛出 ConcurrentModificationException)。
什么时候用 LinkedList,什么时候用 ArrayList?
如上所述,与 ArrayList(O(n)) 相比,LinkedList 中的插入和删除操作提供了良好的性能 (O(1))。因此,如果应用中需要频繁的增删改查,那么LinkedList是最好的选择。
搜索(get 方法)操作在 Arraylist (O(1)) 中很快,但在 LinkedList (O(n)) 中不快,因此如果添加和删除操作较少且搜索操作要求较多,ArrayList 将是您的最佳选择。
ArrayList 中的 get(i) 操作比 LinkedList 更快,因为: ArrayList:List 接口的 Resizable-array 实现 LinkedList:List 和 Deque 接口的双向链表实现
索引到列表中的操作将从开头或结尾遍历列表,以更接近指定索引的为准。
我在这里看到的一项测试只进行一次测试。但我注意到的是,您需要多次运行这些测试,最终它们的时间会收敛。基本上,JVM 需要预热。对于我的特定用例,我需要将项目添加/删除到一个增长到大约 500 个项目的列表中。在我的测试中,LinkedList
的输出速度更快,LinkedList
大约 50,000 NS,而 ArrayList
大约 90,000 NS...给予或接受。请参阅下面的代码。
public static void main(String[] args) {
List<Long> times = new ArrayList<>();
for (int i = 0; i < 100; i++) {
times.add(doIt());
}
System.out.println("avg = " + (times.stream().mapToLong(x -> x).average()));
}
static long doIt() {
long start = System.nanoTime();
List<Object> list = new LinkedList<>();
//uncomment line below to test with ArrayList
//list = new ArrayList<>();
for (int i = 0; i < 500; i++) {
list.add(i);
}
Iterator it = list.iterator();
while (it.hasNext()) {
it.next();
it.remove();
}
long end = System.nanoTime();
long diff = end - start;
//uncomment to see the JVM warmup and get faster for the first few iterations
//System.out.println(diff)
return diff;
}
对于 ArrayList 和 LinkedList,remove()
和 insert()
的运行时效率均为 O(n)。然而,线性处理时间背后的原因来自两个截然不同的原因:
在 ArrayList 中,您可以在 O(1) 中找到元素,但实际上删除或插入某些东西会使它成为 O(n),因为需要更改以下所有元素。
在 LinkedList 中,实际上需要 O(n) 才能到达所需的元素,因为我们必须从头开始,直到到达所需的索引。实际上删除或插入是不变的,因为我们只需要更改 remove()
的 1 个引用和 insert()
的 2 个引用。
两者中哪一个更快插入和删除取决于它发生的位置。如果我们更接近开始,LinkedList 会更快,因为我们必须通过相对较少的元素。如果我们更接近终点,ArrayList 会更快,因为我们在恒定时间内到达那里,只需要更改它后面的少数剩余元素。当恰好在中间完成时,LinkedList 会更快,因为遍历 n 个元素比移动 n 个值要快。
奖励:虽然没有办法为 ArrayList 制作这两种方法 O(1),但实际上在 LinkedLists 中有一种方法可以做到这一点。假设我们要遍历整个 List 删除和插入元素。通常,您将使用 LinkedList 从一开始就为每个元素开始,我们也可以使用迭代器“保存”我们正在处理的当前元素。在 Iterator 的帮助下,我们在 LinkedList 中工作时获得了 remove()
和 insert()
的 O(1) 效率。使它成为唯一的性能优势,我知道 LinkedList 总是比 ArrayList 更好。
ArrayList 扩展了 AbstractList 并实现了 List 接口。 ArrayList是动态数组。
可以说它基本上是为了克服数组的缺点而创建的
LinkedList类扩展了AbstractSequentialList,实现了List、Deque、Queue接口。
性能
arraylist.get()
是 O(1) 而 linkedlist.get()
是 O(n)
arraylist.add()
是 O(1) 而 linkedlist.add()
是 0(1)
arraylist.contains()
是 O(n) 并且 linkedlist.contains()
是 O(n)
arraylist.next()
是 O(1) 而 linkedlist.next()
是 O(1)
arraylist.remove()
是 O(n) 而 linkedlist.remove()
是O(1)
在 arraylistiterator.remove()
中是 O(n)
而在链表中 iterator.remove()
是 O(1)