[CodeGen] NVPTX: Switch from atomic.load.add.f32 to atomicrmw fadd

author Benjamin Kramer <benny.kra@googlemail.com>

Thu, 11 Jul 2019 17:44:11 +0000 (17:44 +0000)

committer Benjamin Kramer <benny.kra@googlemail.com>

Thu, 11 Jul 2019 17:44:11 +0000 (17:44 +0000)
author Benjamin Kramer <benny.kra@googlemail.com>
Thu, 11 Jul 2019 17:44:11 +0000 (17:44 +0000)
committer Benjamin Kramer <benny.kra@googlemail.com>
Thu, 11 Jul 2019 17:44:11 +0000 (17:44 +0000)
diff --git a/lib/CodeGen/CGBuiltin.cpp b/lib/CodeGen/CGBuiltin.cpp

index 52e2d5bfb91282539d9f71c72d18440b6ef7e466..086785fdbac20525ab749a17d05c18e93cd337e6 100644 (file)
--- a/lib/CodeGen/CGBuiltin.cpp
+++ b/lib/CodeGen/CGBuiltin.cpp
@@ -13472,24 +13472,12 @@ CodeGenFunction::EmitNVPTXBuiltinExpr(unsigned BuiltinID, const CallExpr *E) {
      // success flag.
      return MakeAtomicCmpXchgValue(*this, E, /*ReturnBool=*/false);
  
-  case NVPTX::BI__nvvm_atom_add_gen_f: {
-    Value *Ptr = EmitScalarExpr(E->getArg(0));
-    Value *Val = EmitScalarExpr(E->getArg(1));
-    // atomicrmw only deals with integer arguments so we need to use
-    // LLVM's nvvm_atomic_load_add_f32 intrinsic for that.
-    Function *FnALAF32 =
-        CGM.getIntrinsic(Intrinsic::nvvm_atomic_load_add_f32, Ptr->getType());
-    return Builder.CreateCall(FnALAF32, {Ptr, Val});
-  }
-
+  case NVPTX::BI__nvvm_atom_add_gen_f:
    case NVPTX::BI__nvvm_atom_add_gen_d: {
      Value *Ptr = EmitScalarExpr(E->getArg(0));
      Value *Val = EmitScalarExpr(E->getArg(1));
-    // atomicrmw only deals with integer arguments, so we need to use
-    // LLVM's nvvm_atomic_load_add_f64 intrinsic.
-    Function *FnALAF64 =
-        CGM.getIntrinsic(Intrinsic::nvvm_atomic_load_add_f64, Ptr->getType());
-    return Builder.CreateCall(FnALAF64, {Ptr, Val});
+    return Builder.CreateAtomicRMW(llvm::AtomicRMWInst::FAdd, Ptr, Val,
+                                   AtomicOrdering::SequentiallyConsistent);
    }
  
    case NVPTX::BI__nvvm_atom_inc_gen_ui: {
diff --git a/test/CodeGen/builtins-nvptx-ptx50.cu b/test/CodeGen/builtins-nvptx-ptx50.cu

index 72e1aecb48704e98abaf0d9e7865bf5e53b2bb8e..4436ff523cf640459835e6e360e050d1de966c62 100644 (file)
--- a/test/CodeGen/builtins-nvptx-ptx50.cu
+++ b/test/CodeGen/builtins-nvptx-ptx50.cu
@@ -17,7 +17,7 @@
  
  // CHECK-LABEL: test_fn
  __device__ void test_fn(double d, double* double_ptr) {
-  // CHECK: call double @llvm.nvvm.atomic.load.add.f64.p0f64
+  // CHECK: atomicrmw fadd double
    // expected-error@+1 {{'__nvvm_atom_add_gen_d' needs target feature sm_60}}
    __nvvm_atom_add_gen_d(double_ptr, d);
  }
diff --git a/test/CodeGen/builtins-nvptx.c b/test/CodeGen/builtins-nvptx.c

index 16f41bac343220fc45e8c8d82f4b58eb483f1ac6..31c3ecdb14973f60c2769487d9d7f2ac899c7739 100644 (file)
--- a/test/CodeGen/builtins-nvptx.c
+++ b/test/CodeGen/builtins-nvptx.c
@@ -279,7 +279,7 @@ __device__ void nvvm_atom(float *fp, float f, double *dfp, double df, int *ip,
    // CHECK-NEXT: extractvalue { i64, i1 } {{%[0-9]+}}, 0
    __nvvm_atom_cas_gen_ll(&sll, 0, ll);
  
-  // CHECK: call float @llvm.nvvm.atomic.load.add.f32.p0f32
+  // CHECK: atomicrmw fadd float
    __nvvm_atom_add_gen_f(fp, f);
  
    // CHECK: call i32 @llvm.nvvm.atomic.load.inc.32.p0i32
author	Benjamin Kramer <benny.kra@googlemail.com>
	Thu, 11 Jul 2019 17:44:11 +0000 (17:44 +0000)
committer	Benjamin Kramer <benny.kra@googlemail.com>
	Thu, 11 Jul 2019 17:44:11 +0000 (17:44 +0000)
lib/CodeGen/CGBuiltin.cpp		patch \| blob \| history
test/CodeGen/builtins-nvptx-ptx50.cu		patch \| blob \| history
test/CodeGen/builtins-nvptx.c		patch \| blob \| history