[OpenMP] Initialize data sharing stack for SPMD case

author Gheorghe-Teodor Bercea <gheorghe-teod.bercea@ibm.com>

Fri, 13 Jul 2018 16:18:24 +0000 (16:18 +0000)

committer Gheorghe-Teodor Bercea <gheorghe-teod.bercea@ibm.com>

Fri, 13 Jul 2018 16:18:24 +0000 (16:18 +0000)
author Gheorghe-Teodor Bercea <gheorghe-teod.bercea@ibm.com>
Fri, 13 Jul 2018 16:18:24 +0000 (16:18 +0000)
committer Gheorghe-Teodor Bercea <gheorghe-teod.bercea@ibm.com>
Fri, 13 Jul 2018 16:18:24 +0000 (16:18 +0000)
diff --git a/lib/CodeGen/CGOpenMPRuntimeNVPTX.cpp b/lib/CodeGen/CGOpenMPRuntimeNVPTX.cpp

index 0ef093fd057f16c9f5dfef226f33c2a93dea1b89..ba87e0590817cdd246de7c0ac6741baaa49bfcaa 100644 (file)
--- a/lib/CodeGen/CGOpenMPRuntimeNVPTX.cpp
+++ b/lib/CodeGen/CGOpenMPRuntimeNVPTX.cpp
@@ -81,6 +81,8 @@ enum OpenMPRTLFunctionNVPTX {
    OMPRTL_NVPTX__kmpc_end_reduce_nowait,
    /// Call to void __kmpc_data_sharing_init_stack();
    OMPRTL_NVPTX__kmpc_data_sharing_init_stack,
+  /// Call to void __kmpc_data_sharing_init_stack_spmd();
+  OMPRTL_NVPTX__kmpc_data_sharing_init_stack_spmd,
    /// Call to void* __kmpc_data_sharing_push_stack(size_t size,
    /// int16_t UseSharedMemory);
    OMPRTL_NVPTX__kmpc_data_sharing_push_stack,
@@ -1025,6 +1027,12 @@ void CGOpenMPRuntimeNVPTX::emitSPMDEntryHeader(
                           /*RequiresDataSharing=*/Bld.getInt16(1)};
    CGF.EmitRuntimeCall(
        createNVPTXRuntimeFunction(OMPRTL_NVPTX__kmpc_spmd_kernel_init), Args);
+
+  // For data sharing, we need to initialize the stack.
+  CGF.EmitRuntimeCall(
+      createNVPTXRuntimeFunction(
+          OMPRTL_NVPTX__kmpc_data_sharing_init_stack_spmd));
+
    CGF.EmitBranch(ExecuteBB);
  
    CGF.EmitBlock(ExecuteBB);
@@ -1107,11 +1115,6 @@ void CGOpenMPRuntimeNVPTX::emitWorkerLoop(CodeGenFunction &CGF,
    // Wait for parallel work
    syncCTAThreads(CGF);
  
-  // For data sharing, we need to initialize the stack for workers.
-  CGF.EmitRuntimeCall(
-      createNVPTXRuntimeFunction(
-          OMPRTL_NVPTX__kmpc_data_sharing_init_stack));
-
    Address WorkFn =
        CGF.CreateDefaultAlignTempAlloca(CGF.Int8PtrTy, /*Name=*/"work_fn");
    Address ExecStatus =
@@ -1417,6 +1420,13 @@ CGOpenMPRuntimeNVPTX::createNVPTXRuntimeFunction(unsigned Function) {
      RTLFn = CGM.CreateRuntimeFunction(FnTy, "__kmpc_data_sharing_init_stack");
      break;
    }
+  case OMPRTL_NVPTX__kmpc_data_sharing_init_stack_spmd: {
+    /// Build void __kmpc_data_sharing_init_stack_spmd();
+    auto *FnTy =
+        llvm::FunctionType::get(CGM.VoidTy, llvm::None, /*isVarArg*/ false);
+    RTLFn = CGM.CreateRuntimeFunction(FnTy, "__kmpc_data_sharing_init_stack_spmd");
+    break;
+  }
    case OMPRTL_NVPTX__kmpc_data_sharing_push_stack: {
      // Build void *__kmpc_data_sharing_push_stack(size_t size,
      // int16_t UseSharedMemory);
diff --git a/test/OpenMP/nvptx_data_sharing.cpp b/test/OpenMP/nvptx_data_sharing.cpp

index eb0acde299807e34793acf4b6d01182fa4da398b..0acb1199152791c90924d826a71deefdc4f162bf 100644 (file)
--- a/test/OpenMP/nvptx_data_sharing.cpp
+++ b/test/OpenMP/nvptx_data_sharing.cpp
@@ -30,7 +30,7 @@ void test_ds(){
  /// ========= In the worker function ========= ///
  // CK1: {{.*}}define internal void @__omp_offloading{{.*}}test_ds{{.*}}_worker()
  // CK1: call void @llvm.nvvm.barrier0()
-// CK1: call void @__kmpc_data_sharing_init_stack
+// CK1-NOT: call void @__kmpc_data_sharing_init_stack
  
  /// ========= In the kernel function ========= ///
  
diff --git a/test/OpenMP/nvptx_target_parallel_codegen.cpp b/test/OpenMP/nvptx_target_parallel_codegen.cpp

index d193174ce7d91078cca5eb0e26c10bd8c0cd8136..15611f64758803a5880856b22896c816fad516ff 100644 (file)
--- a/test/OpenMP/nvptx_target_parallel_codegen.cpp
+++ b/test/OpenMP/nvptx_target_parallel_codegen.cpp
@@ -60,6 +60,7 @@ int bar(int n){
    // CHECK: [[AA:%.+]] = load i16*, i16** [[AA_ADDR]], align
    // CHECK: [[THREAD_LIMIT:%.+]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()
    // CHECK: call void @__kmpc_spmd_kernel_init(i32 [[THREAD_LIMIT]],
+  // CHECK: call void @__kmpc_data_sharing_init_stack_spmd
    // CHECK: br label {{%?}}[[EXEC:.+]]
    //
    // CHECK: [[EXEC]]
@@ -102,6 +103,7 @@ int bar(int n){
    // CHECK: [[B:%.+]] = load [10 x i32]*, [10 x i32]** [[B_ADDR]], align
    // CHECK: [[THREAD_LIMIT:%.+]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()
    // CHECK: call void @__kmpc_spmd_kernel_init(i32 [[THREAD_LIMIT]],
+  // CHECK: call void @__kmpc_data_sharing_init_stack_spmd
    // CHECK: br label {{%?}}[[EXEC:.+]]
    //
    // CHECK: [[EXEC]]
diff --git a/test/OpenMP/nvptx_target_parallel_proc_bind_codegen.cpp b/test/OpenMP/nvptx_target_parallel_proc_bind_codegen.cpp

index eb166b7dcdaff28e9973438fef79dad3086fc0de..1cdcb70417b8296afb212146779822bf8aeeaf16 100644 (file)
--- a/test/OpenMP/nvptx_target_parallel_proc_bind_codegen.cpp
+++ b/test/OpenMP/nvptx_target_parallel_proc_bind_codegen.cpp
@@ -48,6 +48,7 @@ int bar(int n){
  
    // CHECK-LABEL: define {{.*}}void {{@__omp_offloading_.+template.+l22}}(
    // CHECK: call void @__kmpc_spmd_kernel_init(
+  // CHECK: call void @__kmpc_data_sharing_init_stack_spmd
    // CHECK: br label {{%?}}[[EXEC:.+]]
    //
    // CHECK: [[EXEC]]
@@ -69,6 +70,7 @@ int bar(int n){
  
    // CHECK-LABEL: define {{.*}}void {{@__omp_offloading_.+template.+l26}}(
    // CHECK: call void @__kmpc_spmd_kernel_init(
+  // CHECK: call void @__kmpc_data_sharing_init_stack_spmd
    // CHECK: br label {{%?}}[[EXEC:.+]]
    //
    // CHECK: [[EXEC]]
@@ -89,6 +91,7 @@ int bar(int n){
  
    // CHECK-LABEL: define {{.*}}void {{@__omp_offloading_.+template.+l31}}(
    // CHECK: call void @__kmpc_spmd_kernel_init(
+  // CHECK: call void @__kmpc_data_sharing_init_stack_spmd
    // CHECK: br label {{%?}}[[EXEC:.+]]
    //
    // CHECK: [[EXEC]]
diff --git a/test/OpenMP/nvptx_target_parallel_reduction_codegen.cpp b/test/OpenMP/nvptx_target_parallel_reduction_codegen.cpp

index f13e113db09b49d3b78060a58fde7074cc711b97..02676272b0fed5bbd3fc647f4d29743e6898a1e8 100644 (file)
--- a/test/OpenMP/nvptx_target_parallel_reduction_codegen.cpp
+++ b/test/OpenMP/nvptx_target_parallel_reduction_codegen.cpp
@@ -55,6 +55,7 @@ int bar(int n){
    // CHECK: define {{.*}}void {{@__omp_offloading_.+template.+l27}}(
    //
    // CHECK: call void @__kmpc_spmd_kernel_init(
+  // CHECK: call void @__kmpc_data_sharing_init_stack_spmd
    // CHECK: br label {{%?}}[[EXECUTE:.+]]
    //
    // CHECK: [[EXECUTE]]
@@ -242,6 +243,7 @@ int bar(int n){
    // CHECK: define {{.*}}void {{@__omp_offloading_.+template.+l32}}(
    //
    // CHECK: call void @__kmpc_spmd_kernel_init(
+  // CHECK: call void @__kmpc_data_sharing_init_stack_spmd
    // CHECK: br label {{%?}}[[EXECUTE:.+]]
    //
    // CHECK: [[EXECUTE]]
@@ -519,6 +521,7 @@ int bar(int n){
    // CHECK: define {{.*}}void {{@__omp_offloading_.+template.+l38}}(
    //
    // CHECK: call void @__kmpc_spmd_kernel_init(
+  // CHECK: call void @__kmpc_data_sharing_init_stack_spmd
    // CHECK: br label {{%?}}[[EXECUTE:.+]]
    //
    // CHECK: [[EXECUTE]]
diff --git a/test/OpenMP/nvptx_target_teams_codegen.cpp b/test/OpenMP/nvptx_target_teams_codegen.cpp

index aa054fffc4b1019247f551675e38d7205d0d85ae..c7667d83b9aa92a083102e5181cc37b3c248cd5f 100644 (file)
--- a/test/OpenMP/nvptx_target_teams_codegen.cpp
+++ b/test/OpenMP/nvptx_target_teams_codegen.cpp
@@ -228,6 +228,7 @@ int bar(int n){
  
  // CHECK: define weak void @__omp_offloading_{{.*}}ftemplate{{.*}}_l37(
  // CHECK: call void @__kmpc_spmd_kernel_init(
+// CHECK: call void @__kmpc_data_sharing_init_stack_spmd
  // CHECK: call i8* @__kmpc_data_sharing_push_stack(
  // CHECK-NOT: call void @__kmpc_serialized_parallel(
  // CHECK: call void [[L0:@.+]](i32* %{{.+}}, i32* %{{.+}}, i16* %{{.*}})
diff --git a/test/OpenMP/nvptx_target_teams_distribute_parallel_for_codegen.cpp b/test/OpenMP/nvptx_target_teams_distribute_parallel_for_codegen.cpp

index 195f428e0fbb6bed723a44b670aece5f0f7bd9c6..f74919fc828d5d31cca2aacc9e18628038da244d 100644 (file)
--- a/test/OpenMP/nvptx_target_teams_distribute_parallel_for_codegen.cpp
+++ b/test/OpenMP/nvptx_target_teams_distribute_parallel_for_codegen.cpp
@@ -70,6 +70,7 @@ int bar(int n){
  // CHECK-LABEL: define {{.*}}void {{@__omp_offloading_.+}}(
  // CHECK-DAG: [[THREAD_LIMIT:%.+]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()
  // CHECK: call void @__kmpc_spmd_kernel_init(i32 [[THREAD_LIMIT]],
+// CHECK: call void @__kmpc_data_sharing_init_stack_spmd
  // CHECK: call void @__kmpc_for_static_init_4({{.+}}, {{.+}}, {{.+}} 91,
  // CHECK: {{call|invoke}} void [[OUTL1:@.+]](
  // CHECK: call void @__kmpc_for_static_fini(
@@ -84,6 +85,7 @@ int bar(int n){
  // CHECK-LABEL: define {{.*}}void {{@__omp_offloading_.+}}(
  // CHECK-DAG: [[THREAD_LIMIT:%.+]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()
  // CHECK: call void @__kmpc_spmd_kernel_init(i32 [[THREAD_LIMIT]],
+// CHECK: call void @__kmpc_data_sharing_init_stack_spmd
  // CHECK: call void @__kmpc_for_static_init_4({{.+}}, {{.+}}, {{.+}} 92,
  // CHECK: {{call|invoke}} void [[OUTL2:@.+]](
  // CHECK: call void @__kmpc_for_static_fini(
@@ -98,6 +100,7 @@ int bar(int n){
  // CHECK-LABEL: define {{.*}}void {{@__omp_offloading_.+}}(
  // CHECK-DAG: [[THREAD_LIMIT:%.+]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()
  // CHECK: call void @__kmpc_spmd_kernel_init(i32 [[THREAD_LIMIT]],
+// CHECK: call void @__kmpc_data_sharing_init_stack_spmd
  // CHECK: call void @__kmpc_for_static_init_4({{.+}}, {{.+}}, {{.+}} 92,
  // CHECK: {{call|invoke}} void [[OUTL3:@.+]](
  // CHECK: call void @__kmpc_for_static_fini(
@@ -113,6 +116,7 @@ int bar(int n){
  // CHECK: store {{.+}} [[F_IN]], {{.+}}* {{.+}},
  // CHECK-DAG: [[THREAD_LIMIT:%.+]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()
  // CHECK: call void @__kmpc_spmd_kernel_init(i32 [[THREAD_LIMIT]],
+// CHECK: call void @__kmpc_data_sharing_init_stack_spmd
  // CHECK: store {{.+}} 99, {{.+}}* [[COMB_UB:%.+]], align
  // CHECK: call void @__kmpc_for_static_init_4({{.+}}, {{.+}}, {{.+}} 92, {{.+}}, {{.+}}, {{.+}}* [[COMB_UB]],
  // CHECK: {{call|invoke}} void [[OUTL4:@.+]](
diff --git a/test/OpenMP/nvptx_target_teams_distribute_parallel_for_simd_codegen.cpp b/test/OpenMP/nvptx_target_teams_distribute_parallel_for_simd_codegen.cpp

index 051ccfe9c403aec1268fca478dd9e582696cb38e..0b945a69b054c785b6cc8ba4b0cf58b7fcc3ee86 100644 (file)
--- a/test/OpenMP/nvptx_target_teams_distribute_parallel_for_simd_codegen.cpp
+++ b/test/OpenMP/nvptx_target_teams_distribute_parallel_for_simd_codegen.cpp
@@ -22,7 +22,7 @@ tx ftemplate(int n) {
    tx a[N];
    short aa[N];
    tx b[10];
-  tx c[M][M];  
+  tx c[M][M];
    tx f = n;
    tx l;
    int k;
@@ -47,7 +47,7 @@ tx ftemplate(int n) {
    for(int i = 0; i < M; i++) {
      for(int j = 0; j < M; j++) {
        k = M;
-      c[i][j] = i+j*f+k;      
+      c[i][j] = i+j*f+k;
      }
    }
  
@@ -65,6 +65,7 @@ int bar(int n){
  // CHECK-LABEL: define {{.*}}void {{@__omp_offloading_.+}}(
  // CHECK-DAG: [[THREAD_LIMIT:%.+]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()
  // CHECK: call void @__kmpc_spmd_kernel_init(i32 [[THREAD_LIMIT]],
+// CHECK: call void @__kmpc_data_sharing_init_stack_spmd
  // CHECK: call void @__kmpc_for_static_init_4({{.+}}, {{.+}}, {{.+}} 91,
  // CHECK: {{call|invoke}} void [[OUTL1:@.+]](
  // CHECK: call void @__kmpc_for_static_fini(
@@ -79,6 +80,7 @@ int bar(int n){
  // CHECK-LABEL: define {{.*}}void {{@__omp_offloading_.+}}(
  // CHECK-DAG: [[THREAD_LIMIT:%.+]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()
  // CHECK: call void @__kmpc_spmd_kernel_init(i32 [[THREAD_LIMIT]],
+// CHECK: call void @__kmpc_data_sharing_init_stack_spmd
  // CHECK: call void @__kmpc_for_static_init_4({{.+}}, {{.+}}, {{.+}} 92,
  // CHECK: {{call|invoke}} void [[OUTL2:@.+]](
  // CHECK: call void @__kmpc_for_static_fini(
@@ -93,6 +95,7 @@ int bar(int n){
  // CHECK-LABEL: define {{.*}}void {{@__omp_offloading_.+}}(
  // CHECK-DAG: [[THREAD_LIMIT:%.+]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()
  // CHECK: call void @__kmpc_spmd_kernel_init(i32 [[THREAD_LIMIT]],
+// CHECK: call void @__kmpc_data_sharing_init_stack_spmd
  // CHECK: call void @__kmpc_for_static_init_4({{.+}}, {{.+}}, {{.+}} 92,
  // CHECK: {{call|invoke}} void [[OUTL3:@.+]](
  // CHECK: call void @__kmpc_for_static_fini(
@@ -108,6 +111,7 @@ int bar(int n){
  // CHECK: store {{.+}} [[F_IN]], {{.+}}* {{.+}},
  // CHECK-DAG: [[THREAD_LIMIT:%.+]] = call i32 @llvm.nvvm.read.ptx.sreg.ntid.x()
  // CHECK: call void @__kmpc_spmd_kernel_init(i32 [[THREAD_LIMIT]],
+// CHECK: call void @__kmpc_data_sharing_init_stack_spmd
  // CHECK: store {{.+}} 99, {{.+}}* [[COMB_UB:%.+]], align
  // CHECK: call void @__kmpc_for_static_init_4({{.+}}, {{.+}}, {{.+}} 92, {{.+}}, {{.+}}, {{.+}}* [[COMB_UB]],
  // CHECK: {{call|invoke}} void [[OUTL4:@.+]](
author	Gheorghe-Teodor Bercea <gheorghe-teod.bercea@ibm.com>
	Fri, 13 Jul 2018 16:18:24 +0000 (16:18 +0000)
committer	Gheorghe-Teodor Bercea <gheorghe-teod.bercea@ibm.com>
	Fri, 13 Jul 2018 16:18:24 +0000 (16:18 +0000)
lib/CodeGen/CGOpenMPRuntimeNVPTX.cpp		patch \| blob \| history
test/OpenMP/nvptx_data_sharing.cpp		patch \| blob \| history
test/OpenMP/nvptx_target_parallel_codegen.cpp		patch \| blob \| history
test/OpenMP/nvptx_target_parallel_proc_bind_codegen.cpp		patch \| blob \| history
test/OpenMP/nvptx_target_parallel_reduction_codegen.cpp		patch \| blob \| history
test/OpenMP/nvptx_target_teams_codegen.cpp		patch \| blob \| history
test/OpenMP/nvptx_target_teams_distribute_parallel_for_codegen.cpp		patch \| blob \| history
test/OpenMP/nvptx_target_teams_distribute_parallel_for_simd_codegen.cpp		patch \| blob \| history