为什么迭代dict这么慢?

我有一个脚本,可以删除很多 dict 并最终对其进行迭代。

我设法将其简化为一个简单的基准:

> py -m timeit -s "a = {i:i for i in range(10000000)};[a.pop(i) for i in range(10000000-1)]" "next(iter(a))"
10 loops, best of 5: 30.8 msec per loop

为什么在删除所有以前的值后迭代单个键变得很慢?

回答

从 3.6 开始,Python 字典使用内部哈希表和条目数组。

当从字典中删除一个键时,它的条目实际上在数组中被替换为一个虚拟值,将条目标记为已删除。

在迭代时,它会一个一个地跳过所有这些虚拟值,直到找到下一个真正的项目。

这就是为什么如果你跳过第一个值,只删除其余的值,你会看到迭代与迭代单个项目字典一样快:

> py -m timeit -s "a = {i:i for i in range(10000000)};[a.pop(i) for i in range(1,10000000-1)]" "next(iter(a))"
1000000 loops, best of 5: 219 nsec per loop

有关内部字典结构的更多信息,您可能会看到这个精彩的答案。


以上是为什么迭代dict这么慢?的全部内容。
THE END
分享
二维码
< <上一篇
下一篇>>