为什么consteval/constexpr和模板元函数之间的编译时间有如此巨大的差异？

html5 • 2022年9月21日 am4:40 • 问答

我很好奇就编译时评估而言，我可以将 gcc 推多远，所以我让它计算了Ackermann函数，特别是输入值为 4 和 1（高于此值的任何值都是不切实际的）：

consteval unsigned int A(unsigned int x, unsigned int y)
{
    if(x == 0)
        return y+1;
    else if(y == 0)
        return A(x-1, 1);
    else
        return A(x-1, A(x, y-1));
}

unsigned int result = A(4, 1);

（我认为递归深度限制在~16K，但为了安全起见，我用它编译了这个-std=c++20 -fconstexpr-depth=100000 -fconstexpr-ops-limit=12800000000）

毫不奇怪，这占用了大量的堆栈空间（实际上，如果以 8mb 的默认进程堆栈大小运行，它会导致编译器崩溃）并且需要几分钟的时间来计算。但是，它最终确实到达了那里，因此显然编译器可以处理它。

在那之后，我决定尝试使用模板、元函数和偏特化模式匹配来实现 Ackermann 函数。令人惊讶的是，以下实现只需几秒钟即可评估：

template<unsigned int x, unsigned int y>
struct A {
    static constexpr unsigned int value = A<x-1, A<x, y-1>::value>::value;
};

template<unsigned int y>
struct A<0, y> {
    static constexpr unsigned int value = y+1;
};

template<unsigned int x>
struct A<x, 0> {
  static constexpr unsigned int value = A<x-1, 1>::value;
};

unsigned int result = A<4,1>::value;

（编译-ftemplate-depth=17000）

为什么评估时间会有如此巨大的差异？这些本质上不是等价的吗？我想我可以理解consteval需要更多内存和评估时间的解决方案，因为在语义上它由一堆函数调用组成，但这并不能解释为什么在运行时计算的这个完全相同的（非consteval）函数只比元函数版本（未优化编译）。

为什么consteval这么慢？我几乎很想得出结论，它正在由 GIMPLE 解释器或类似的东西进行评估。还有，元函数版本怎么能这么快？它实际上并不比优化的机器代码慢多少。

回答

在的模板版本中A，当特定的特A<2,3>化（例如）被实例化时，编译器会记住这种类型，并且永远不需要再次实例化它。这是因为类型是唯一的，对这个元函数的每次“调用”只是计算一个类型。

该consteval函数的版本不优化，要做到这一点，所以A(2,3)可能会多次评估，根据不同的控制流，导致你观察到的性能差异。没有什么可以阻止编译器“缓存”函数调用的结果，但这些优化可能还没有实现。

以上是为什么consteval/constexpr和模板元函数之间的编译时间有如此巨大的差异？的全部内容。

THE END

二维码

insort_left和insort_right在bisect中有什么区别？

< <上一篇

使用'a'-'A'而不是“32”或空格字符背后的逻辑是什么？

下一篇>>

搜索内容

为什么consteval/constexpr和模板元函数之间的编译时间有如此巨大的差异？

回答

目录

目录

推荐文章

最新文章