“ompsingle”和“omptask”如何提供并行性?
我感到困惑omp single和omp task指令。我已经阅读了几个使用它们的例子。以下示例显示如何使用任务构造来处理链表的元素。
1 #pragma omp parallel
2 {
3 #pragma omp single
4 {
5 for(node* p = head; p; p = p->next)
6 {
7 #pragma omp task
8 process(p);
9 }
10 }
11 }
我无法理解此示例中的并行性。使用omp single,只有一个线程会执行与单个构造相关的结构化块,对吗?在这个例子中,第 4-10 行是与单个构造相关的结构化块,它只能执行一次,那么为什么我们可以omp task在这个结构化块内部使用呢?它如何以并行方式工作?
回答
除了其他答案之外,让我更深入地了解执行过程中会发生什么。
1 #pragma omp parallel
2 {
3 #pragma omp single
4 {
5 for(node* p = head; p; p = p->next)
6 {
7 #pragma omp task
8 process(p);
9 }
10 } // barrier of single construct
11 }
在代码中,我标记了在single构造末尾引入的屏障。
发生的事情是这样的:
首先,当遇到parallel构造时,主线程产生并行区域并创建一堆工作线程。然后你有n 个线程运行并执行并行区域。
其次,该single构造选择n 个线程中的任何一个并执行该single构造的花括号内的代码。所有其他的n-1 个线程将进入第 10 行的屏障。在那里,它们将等待最后一个线程赶上并完成屏障同步。当这些线程在那里等待时,它们不仅在浪费时间,而且还在等待工作的到来。
第三,由single构造(“生产者”)选择的线程执行for循环,并为每次迭代创建一个新任务。然后将该任务放入任务池中,以便另一个线程(屏障中的一个线程)可以拾取并执行它。一旦生产者完成任务创建,它就会加入屏障,如果任务池中还有任务等待执行,它将帮助其他线程执行任务。
第四,一旦所有任务都以这种方式生成和执行,所有线程都完成了,屏障同步也完成了。
我在这里和那里做了一些简化,因为 OpenMP 实现如何执行任务有更多方面,但从概念的角度来看,以上是您可以想到的事情,直到您准备好深入研究OpenMP API 中任务调度的各个方面。