[OPENMP] Generate !llvm.mem.loop_parallel_access metadata for loops with dynamic...

author Alexey Bataev <a.bataev@hotmail.com>

Thu, 7 May 2015 04:25:17 +0000 (04:25 +0000)

committer Alexey Bataev <a.bataev@hotmail.com>

Thu, 7 May 2015 04:25:17 +0000 (04:25 +0000)
author Alexey Bataev <a.bataev@hotmail.com>
Thu, 7 May 2015 04:25:17 +0000 (04:25 +0000)
committer Alexey Bataev <a.bataev@hotmail.com>
Thu, 7 May 2015 04:25:17 +0000 (04:25 +0000)
diff --git a/lib/CodeGen/CGStmtOpenMP.cpp b/lib/CodeGen/CGStmtOpenMP.cpp

index 1f06e2446301a871300f491f7ff795f1d8f60b2f..21b1bcb9d3a9ec9b18421effd30ab10f043da28c 100644 (file)
--- a/lib/CodeGen/CGStmtOpenMP.cpp
+++ b/lib/CodeGen/CGStmtOpenMP.cpp
@@ -886,6 +886,11 @@ void CodeGenFunction::EmitOMPForOuterLoop(OpenMPScheduleClauseKind ScheduleKind,
    bool DynamicWithOrderedClause =
        Dynamic && S.getSingleClause(OMPC_ordered) != nullptr;
    SourceLocation Loc = S.getLocStart();
+  // Generate !llvm.loop.parallel metadata for loads and stores for loops with
+  // dynamic/guided scheduling and without ordered clause.
+  LoopStack.setParallel((ScheduleKind == OMPC_SCHEDULE_dynamic ||
+                         ScheduleKind == OMPC_SCHEDULE_guided) &&
+                        !DynamicWithOrderedClause);
    EmitOMPInnerLoop(
        S, LoopScope.requiresCleanups(), S.getCond(/*SeparateIter=*/false),
        S.getInc(),
diff --git a/test/OpenMP/for_codegen.cpp b/test/OpenMP/for_codegen.cpp

index 31161e26e1ec2246c44e436742ce6a5351c2919d..6939108933c73547bfae9dc1c5cba8202a720b04 100644 (file)
--- a/test/OpenMP/for_codegen.cpp
+++ b/test/OpenMP/for_codegen.cpp
@@ -41,6 +41,7 @@ void without_schedule_clause(float *a, float *b, float *c, float *d) {
  // ... loop body ...
  // End of body: store into a[i]:
  // CHECK: store float [[RESULT:%.+]], float* {{%.+}}
+// CHECK-NOT: !llvm.mem.parallel_loop_access
      a[i] = b[i] * c[i] * d[i];
  // CHECK: [[IV1_2:%.+]] = load i32, i32* [[OMP_IV]]{{.*}}
  // CHECK-NEXT: [[ADD1_2:%.+]] = add nsw i32 [[IV1_2]], 1
@@ -81,6 +82,7 @@ void static_not_chunked(float *a, float *b, float *c, float *d) {
  // ... loop body ...
  // End of body: store into a[i]:
  // CHECK: store float [[RESULT:%.+]], float* {{%.+}}
+// CHECK-NOT: !llvm.mem.parallel_loop_access
      a[i] = b[i] * c[i] * d[i];
  // CHECK: [[IV1_2:%.+]] = load i32, i32* [[OMP_IV]]{{.*}}
  // CHECK-NEXT: [[ADD1_2:%.+]] = add nsw i32 [[IV1_2]], 1
@@ -129,6 +131,7 @@ void static_chunked(float *a, float *b, float *c, float *d) {
  // ... loop body ...
  // End of body: store into a[i]:
  // CHECK: store float [[RESULT:%.+]], float* {{%.+}}
+// CHECK-NOT: !llvm.mem.parallel_loop_access
      a[i] = b[i] * c[i] * d[i];
  // CHECK: [[IV1_2:%.+]] = load i32, i32* [[OMP_IV]]{{.*}}
  // CHECK-NEXT: [[ADD1_2:%.+]] = add i32 [[IV1_2]], 1
@@ -180,7 +183,7 @@ void dynamic1(float *a, float *b, float *c, float *d) {
  // CHECK-NEXT: store i64 [[CALC_I_2]], i64* [[LC_I:.+]]
  // ... loop body ...
  // End of body: store into a[i]:
-// CHECK: store float [[RESULT:%.+]], float* {{%.+}}
+// CHECK: store float [[RESULT:%.+]], float* {{%.+}}!llvm.mem.parallel_loop_access
      a[i] = b[i] * c[i] * d[i];
  // CHECK: [[IV1_2:%.+]] = load i64, i64* [[OMP_IV]]{{.*}}
  // CHECK-NEXT: [[ADD1_2:%.+]] = add i64 [[IV1_2]], 1
@@ -221,7 +224,7 @@ void guided7(float *a, float *b, float *c, float *d) {
  // CHECK-NEXT: store i64 [[CALC_I_2]], i64* [[LC_I:.+]]
  // ... loop body ...
  // End of body: store into a[i]:
-// CHECK: store float [[RESULT:%.+]], float* {{%.+}}
+// CHECK: store float [[RESULT:%.+]], float* {{%.+}}!llvm.mem.parallel_loop_access
      a[i] = b[i] * c[i] * d[i];
  // CHECK: [[IV1_2:%.+]] = load i64, i64* [[OMP_IV]]{{.*}}
  // CHECK-NEXT: [[ADD1_2:%.+]] = add i64 [[IV1_2]], 1
@@ -266,6 +269,7 @@ void test_auto(float *a, float *b, float *c, float *d) {
  // ... loop body ...
  // End of body: store into a[i]:
  // CHECK: store float [[RESULT:%.+]], float* {{%.+}}
+// CHECK-NOT: !llvm.mem.parallel_loop_access
      a[i] = b[i] * c[i] * d[i];
  // CHECK: [[IV1_2:%.+]] = load i64, i64* [[OMP_IV]]{{.*}}
  // CHECK-NEXT: [[ADD1_2:%.+]] = add nsw i64 [[IV1_2]], 1
@@ -307,6 +311,7 @@ void runtime(float *a, float *b, float *c, float *d) {
  // ... loop body ...
  // End of body: store into a[i]:
  // CHECK: store float [[RESULT:%.+]], float* {{%.+}}
+// CHECK-NOT: !llvm.mem.parallel_loop_access
      a[i] = b[i] * c[i] * d[i];
  // CHECK: [[IV1_2:%.+]] = load i32, i32* [[OMP_IV]]{{.*}}
  // CHECK-NEXT: [[ADD1_2:%.+]] = add nsw i32 [[IV1_2]], 1
diff --git a/test/OpenMP/ordered_codegen.cpp b/test/OpenMP/ordered_codegen.cpp

index 28ff3baacca92600c24a1f118354ff85933b4ea4..169328b9062710888dbc11edd13f5ae9cdec8e52 100644 (file)
--- a/test/OpenMP/ordered_codegen.cpp
+++ b/test/OpenMP/ordered_codegen.cpp
@@ -39,6 +39,7 @@ void static_not_chunked(float *a, float *b, float *c, float *d) {
  // ... loop body ...
  // End of body: store into a[i]:
  // CHECK: store float [[RESULT:%.+]], float* {{%.+}}
+// CHECK-NOT: !llvm.mem.parallel_loop_access
  // CHECK-NEXT: call void @__kmpc_end_ordered([[IDENT_T_TY]]* [[DEFAULT_LOC]], i32 [[GTID]])
  // ... end of ordered region ...
      #pragma omp ordered
@@ -86,6 +87,7 @@ void dynamic1(float *a, float *b, float *c, float *d) {
  // ... loop body ...
  // End of body: store into a[i]:
  // CHECK: store float [[RESULT:%.+]], float* {{%.+}}
+// CHECK-NOT: !llvm.mem.parallel_loop_access
  // CHECK-NEXT: call void @__kmpc_end_ordered([[IDENT_T_TY]]* [[DEFAULT_LOC]], i32 [[GTID]])
  // ... end of ordered region ...
      #pragma omp ordered
@@ -139,6 +141,7 @@ void test_auto(float *a, float *b, float *c, float *d) {
  // ... loop body ...
  // End of body: store into a[i]:
  // CHECK: store float [[RESULT:%.+]], float* {{%.+}}
+// CHECK-NOT: !llvm.mem.parallel_loop_access
  // CHECK-NEXT: call void @__kmpc_end_ordered([[IDENT_T_TY]]* [[DEFAULT_LOC]], i32 [[GTID]])
  // ... end of ordered region ...
      #pragma omp ordered
@@ -189,6 +192,7 @@ void runtime(float *a, float *b, float *c, float *d) {
  // ... loop body ...
  // End of body: store into a[i]:
  // CHECK: store float [[RESULT:%.+]], float* {{%.+}}
+// CHECK-NOT: !llvm.mem.parallel_loop_access
  // CHECK-NEXT: call void @__kmpc_end_ordered([[IDENT_T_TY]]* [[DEFAULT_LOC]], i32 [[GTID]])
  // ... end of ordered region ...
      #pragma omp ordered
author	Alexey Bataev <a.bataev@hotmail.com>
	Thu, 7 May 2015 04:25:17 +0000 (04:25 +0000)
committer	Alexey Bataev <a.bataev@hotmail.com>
	Thu, 7 May 2015 04:25:17 +0000 (04:25 +0000)
lib/CodeGen/CGStmtOpenMP.cpp		patch \| blob \| history
test/OpenMP/for_codegen.cpp		patch \| blob \| history
test/OpenMP/ordered_codegen.cpp		patch \| blob \| history