[X86] Update SSE1 MOVLPSrm and MOVHPSrm isel patterns to ensure loads are non-volatil...

author Craig Topper <craig.topper@intel.com>

Fri, 5 Jul 2019 17:31:29 +0000 (17:31 +0000)

committer Craig Topper <craig.topper@intel.com>

Fri, 5 Jul 2019 17:31:29 +0000 (17:31 +0000)
author Craig Topper <craig.topper@intel.com>
Fri, 5 Jul 2019 17:31:29 +0000 (17:31 +0000)
committer Craig Topper <craig.topper@intel.com>
Fri, 5 Jul 2019 17:31:29 +0000 (17:31 +0000)
diff --git a/lib/Target/X86/X86InstrSSE.td b/lib/Target/X86/X86InstrSSE.td

index e4791eb3c323921faddc35e18cb1303128ca496f..dc2db1e8e614c1e2edb027314c15b56f63fc0388 100644 (file)
--- a/lib/Target/X86/X86InstrSSE.td
+++ b/lib/Target/X86/X86InstrSSE.td
@@ -660,7 +660,8 @@ let Predicates = [UseSSE1] in {
    // This pattern helps select MOVLPS on SSE1 only targets. With SSE2 we'll
    // end up with a movsd or blend instead of shufp.
    // No need for aligned load, we're only loading 64-bits.
-  def : Pat<(X86Shufp (loadv4f32 addr:$src2), VR128:$src1, (i8 -28)),
+  def : Pat<(X86Shufp (v4f32 (nonvolatile_load addr:$src2)), VR128:$src1,
+                      (i8 -28)),
              (MOVLPSrm VR128:$src1, addr:$src2)>;
  }
  
@@ -722,7 +723,7 @@ let Predicates = [UseSSE1] in {
    // This pattern helps select MOVHPS on SSE1 only targets. With SSE2 we'll
    // end up with a movsd or blend instead of shufp.
    // No need for aligned load, we're only loading 64-bits.
-  def : Pat<(X86Movlhps VR128:$src1, (loadv4f32 addr:$src2)),
+  def : Pat<(X86Movlhps VR128:$src1, (v4f32 (nonvolatile_load addr:$src2))),
              (MOVHPSrm VR128:$src1, addr:$src2)>;
  }
author	Craig Topper <craig.topper@intel.com>
	Fri, 5 Jul 2019 17:31:29 +0000 (17:31 +0000)
committer	Craig Topper <craig.topper@intel.com>
	Fri, 5 Jul 2019 17:31:29 +0000 (17:31 +0000)