AMDGPU: Fix atomic_inc/atomic_dec + ds_swizzle not being divergent

author Matt Arsenault <Matthew.Arsenault@amd.com>

Mon, 30 Jan 2017 17:09:47 +0000 (17:09 +0000)

committer Matt Arsenault <Matthew.Arsenault@amd.com>

Mon, 30 Jan 2017 17:09:47 +0000 (17:09 +0000)
author Matt Arsenault <Matthew.Arsenault@amd.com>
Mon, 30 Jan 2017 17:09:47 +0000 (17:09 +0000)
committer Matt Arsenault <Matthew.Arsenault@amd.com>
Mon, 30 Jan 2017 17:09:47 +0000 (17:09 +0000)
diff --git a/lib/Target/AMDGPU/AMDGPUTargetTransformInfo.cpp b/lib/Target/AMDGPU/AMDGPUTargetTransformInfo.cpp

index e90487065992552220a0bb61b854864f2adf471c..9fb68a38415f8c9234ec801e1caa712e4e7c8842 100644 (file)
--- a/lib/Target/AMDGPU/AMDGPUTargetTransformInfo.cpp
+++ b/lib/Target/AMDGPU/AMDGPUTargetTransformInfo.cpp
@@ -249,6 +249,8 @@ static bool isIntrinsicSourceOfDivergence(const TargetIntrinsicInfo *TII,
    case Intrinsic::r600_read_tidig_x:
    case Intrinsic::r600_read_tidig_y:
    case Intrinsic::r600_read_tidig_z:
+  case Intrinsic::amdgcn_atomic_inc:
+  case Intrinsic::amdgcn_atomic_dec:
    case Intrinsic::amdgcn_image_atomic_swap:
    case Intrinsic::amdgcn_image_atomic_add:
    case Intrinsic::amdgcn_image_atomic_sub:
@@ -274,6 +276,7 @@ static bool isIntrinsicSourceOfDivergence(const TargetIntrinsicInfo *TII,
    case Intrinsic::amdgcn_buffer_atomic_xor:
    case Intrinsic::amdgcn_buffer_atomic_cmpswap:
    case Intrinsic::amdgcn_ps_live:
+  case Intrinsic::amdgcn_ds_swizzle:
      return true;
    }
  
diff --git a/test/Analysis/DivergenceAnalysis/AMDGPU/atomics.ll b/test/Analysis/DivergenceAnalysis/AMDGPU/atomics.ll

index e3323dc5e21c2cc835357376f8c020643892ad01..9847ad7434d5d9c4032966b74573a24666896bd2 100644 (file)
--- a/test/Analysis/DivergenceAnalysis/AMDGPU/atomics.ll
+++ b/test/Analysis/DivergenceAnalysis/AMDGPU/atomics.ll
@@ -12,4 +12,34 @@ define {i32, i1} @test2(i32* %ptr, i32 %cmp, i32 %new) {
    ret {i32, i1} %orig
  }
  
+; CHECK: DIVERGENT: %ret = call i32 @llvm.amdgcn.atomic.inc.i32.p1i32(i32 addrspace(1)* %ptr, i32 %val)
+define i32 @test_atomic_inc_i32(i32 addrspace(1)* %ptr, i32 %val) #0 {
+  %ret = call i32 @llvm.amdgcn.atomic.inc.i32.p1i32(i32 addrspace(1)* %ptr, i32 %val)
+  ret i32 %ret
+}
+
+; CHECK: DIVERGENT: %ret = call i64 @llvm.amdgcn.atomic.inc.i64.p1i64(i64 addrspace(1)* %ptr, i64 %val)
+define i64 @test_atomic_inc_i64(i64 addrspace(1)* %ptr, i64 %val) #0 {
+  %ret = call i64 @llvm.amdgcn.atomic.inc.i64.p1i64(i64 addrspace(1)* %ptr, i64 %val)
+  ret i64 %ret
+}
+
+; CHECK: DIVERGENT: %ret = call i32 @llvm.amdgcn.atomic.dec.i32.p1i32(i32 addrspace(1)* %ptr, i32 %val)
+define i32 @test_atomic_dec_i32(i32 addrspace(1)* %ptr, i32 %val) #0 {
+  %ret = call i32 @llvm.amdgcn.atomic.dec.i32.p1i32(i32 addrspace(1)* %ptr, i32 %val)
+  ret i32 %ret
+}
+
+; CHECK: DIVERGENT: %ret = call i64 @llvm.amdgcn.atomic.dec.i64.p1i64(i64 addrspace(1)* %ptr, i64 %val)
+define i64 @test_atomic_dec_i64(i64 addrspace(1)* %ptr, i64 %val) #0 {
+  %ret = call i64 @llvm.amdgcn.atomic.dec.i64.p1i64(i64 addrspace(1)* %ptr, i64 %val)
+  ret i64 %ret
+}
+
+declare i32 @llvm.amdgcn.atomic.inc.i32.p1i32(i32 addrspace(1)* nocapture, i32) #1
+declare i64 @llvm.amdgcn.atomic.inc.i64.p1i64(i64 addrspace(1)* nocapture, i64) #1
+declare i32 @llvm.amdgcn.atomic.dec.i32.p1i32(i32 addrspace(1)* nocapture, i32) #1
+declare i64 @llvm.amdgcn.atomic.dec.i64.p1i64(i64 addrspace(1)* nocapture, i64) #1
+
  attributes #0 = { nounwind }
+attributes #1 = { nounwind argmemonly }
diff --git a/test/Analysis/DivergenceAnalysis/AMDGPU/intrinsics.ll b/test/Analysis/DivergenceAnalysis/AMDGPU/intrinsics.ll

new file mode 100644 (file)

index 0000000..319a697
--- /dev/null
+++ b/test/Analysis/DivergenceAnalysis/AMDGPU/intrinsics.ll
@@ -0,0 +1,13 @@
+; RUN: opt -mtriple=amdgcn-- -analyze -divergence %s | FileCheck %s
+
+; CHECK: DIVERGENT: %swizzle = call i32 @llvm.amdgcn.ds.swizzle(i32 %src, i32 100) #0
+define void @ds_swizzle(i32 addrspace(1)* %out, i32 %src) #0 {
+  %swizzle = call i32 @llvm.amdgcn.ds.swizzle(i32 %src, i32 100) #0
+  store i32 %swizzle, i32 addrspace(1)* %out, align 4
+  ret void
+}
+
+declare i32 @llvm.amdgcn.ds.swizzle(i32, i32) #1
+
+attributes #0 = { nounwind convergent }
+attributes #1 = { nounwind readnone convergent }
author	Matt Arsenault <Matthew.Arsenault@amd.com>
	Mon, 30 Jan 2017 17:09:47 +0000 (17:09 +0000)
committer	Matt Arsenault <Matthew.Arsenault@amd.com>
	Mon, 30 Jan 2017 17:09:47 +0000 (17:09 +0000)
lib/Target/AMDGPU/AMDGPUTargetTransformInfo.cpp		patch \| blob \| history
test/Analysis/DivergenceAnalysis/AMDGPU/atomics.ll		patch \| blob \| history
test/Analysis/DivergenceAnalysis/AMDGPU/intrinsics.ll	[new file with mode: 0644]	patch \| blob