Merging r266105:

author Tom Stellard <thomas.stellard@amd.com>

Fri, 3 Jun 2016 20:43:03 +0000 (20:43 +0000)

committer Tom Stellard <thomas.stellard@amd.com>

Fri, 3 Jun 2016 20:43:03 +0000 (20:43 +0000)
author Tom Stellard <thomas.stellard@amd.com>
Fri, 3 Jun 2016 20:43:03 +0000 (20:43 +0000)
committer Tom Stellard <thomas.stellard@amd.com>
Fri, 3 Jun 2016 20:43:03 +0000 (20:43 +0000)
diff --git a/lib/Target/AMDGPU/SIInsertWaits.cpp b/lib/Target/AMDGPU/SIInsertWaits.cpp

index 7963716258f585047f423a568cb06ac25376235e..02bf12f7714d9f7901d01bf3abcccee6939677d3 100644 (file)
--- a/lib/Target/AMDGPU/SIInsertWaits.cpp
+++ b/lib/Target/AMDGPU/SIInsertWaits.cpp
@@ -474,7 +474,7 @@ bool SIInsertWaits::runOnMachineFunction(MachineFunction &MF) {
    TII = static_cast<const SIInstrInfo *>(MF.getSubtarget().getInstrInfo());
    TRI =
        static_cast<const SIRegisterInfo *>(MF.getSubtarget().getRegisterInfo());
-
+  const AMDGPUSubtarget &ST = MF.getSubtarget<AMDGPUSubtarget>();
    MRI = &MF.getRegInfo();
  
    WaitedOn = ZeroCounts;
@@ -493,6 +493,12 @@ bool SIInsertWaits::runOnMachineFunction(MachineFunction &MF) {
      for (MachineBasicBlock::iterator I = MBB.begin(), E = MBB.end();
           I != E; ++I) {
  
+      // Insert required wait states for SMRD reading an SGPR written by a VALU
+      // instruction.
+      if (ST.getGeneration() <= AMDGPUSubtarget::SOUTHERN_ISLANDS &&
+          I->getOpcode() == AMDGPU::V_READFIRSTLANE_B32)
+        TII->insertWaitStates(std::next(I), 4);
+
        // Wait for everything before a barrier.
        if (I->getOpcode() == AMDGPU::S_BARRIER)
          Changes |= insertWait(MBB, I, LastIssued);
diff --git a/test/CodeGen/AMDGPU/missing-store.ll b/test/CodeGen/AMDGPU/missing-store.ll

index c919b3b5819d218ae19e46a6149e2da2d48e9d15..658666304f6849b3c615ef1e74f967a081f8ee0e 100644 (file)
--- a/test/CodeGen/AMDGPU/missing-store.ll
+++ b/test/CodeGen/AMDGPU/missing-store.ll
@@ -10,6 +10,7 @@
  ; SI: buffer_store_dword
  ; SI: v_readfirstlane_b32 s[[PTR_LO:[0-9]+]], v{{[0-9]+}}
  ; SI: v_readfirstlane_b32 s[[PTR_HI:[0-9]+]], v{{[0-9]+}}
+; SI-NEXT: s_nop
  ; SI: s_load_dword s{{[0-9]+}}, s{{\[}}[[PTR_LO]]:[[PTR_HI]]{{\]}}
  ; SI: buffer_store_dword
  ; SI: s_endpgm
diff --git a/test/CodeGen/AMDGPU/salu-to-valu.ll b/test/CodeGen/AMDGPU/salu-to-valu.ll

index 2489c6575422d63ca291a143d7835d64840dddcf..16e09a6e2b3153328c94e01fbd00fa5d45ad8afd 100644 (file)
--- a/test/CodeGen/AMDGPU/salu-to-valu.ll
+++ b/test/CodeGen/AMDGPU/salu-to-valu.ll
@@ -56,6 +56,7 @@ done:                                             ; preds = %loop
  ; SI-DAG: s_movk_i32 [[OFFSET:s[0-9]+]], 0x2ee0
  ; GCN-DAG: v_readfirstlane_b32 s[[PTR_LO:[0-9]+]], v{{[0-9]+}}
  ; GCN: v_readfirstlane_b32 s[[PTR_HI:[0-9]+]], v{{[0-9]+}}
+; SI-NEXT: s_nop
  ; SI: s_load_dword [[OUT:s[0-9]+]], s{{\[}}[[PTR_LO]]:[[PTR_HI]]{{\]}}, [[OFFSET]]
  ; CI: s_load_dword [[OUT:s[0-9]+]], s{{\[}}[[PTR_LO]]:[[PTR_HI]]{{\]}}, 0xbb8
  ; GCN: v_mov_b32_e32 [[V_OUT:v[0-9]+]], [[OUT]]
author	Tom Stellard <thomas.stellard@amd.com>
	Fri, 3 Jun 2016 20:43:03 +0000 (20:43 +0000)
committer	Tom Stellard <thomas.stellard@amd.com>
	Fri, 3 Jun 2016 20:43:03 +0000 (20:43 +0000)
lib/Target/AMDGPU/SIInsertWaits.cpp		patch \| blob \| history
test/CodeGen/AMDGPU/missing-store.ll		patch \| blob \| history
test/CodeGen/AMDGPU/salu-to-valu.ll		patch \| blob \| history