[X86] Generate v2f64 X86ISD::UNPCKL/UNPCKH instead of X86ISD::MOVLHPS/MOVHLPS for...

author Craig Topper <craig.topper@intel.com>

Wed, 18 Jul 2018 05:10:51 +0000 (05:10 +0000)

committer Craig Topper <craig.topper@intel.com>

Wed, 18 Jul 2018 05:10:51 +0000 (05:10 +0000)
author Craig Topper <craig.topper@intel.com>
Wed, 18 Jul 2018 05:10:51 +0000 (05:10 +0000)
committer Craig Topper <craig.topper@intel.com>
Wed, 18 Jul 2018 05:10:51 +0000 (05:10 +0000)
diff --git a/lib/Target/X86/X86ISelLowering.cpp b/lib/Target/X86/X86ISelLowering.cpp

index 37338ab57967b2290642a7ad2c12c9b382e56492..7a32ce59d3140e0d928ceba9be918cd072945e67 100644 (file)
--- a/lib/Target/X86/X86ISelLowering.cpp
+++ b/lib/Target/X86/X86ISelLowering.cpp
@@ -29387,14 +29387,14 @@ static bool matchBinaryVectorShuffle(MVT MaskVT, ArrayRef<int> Mask,
      if (isTargetShuffleEquivalent(Mask, {0, 0}) && AllowFloatDomain) {
        V2 = V1;
        V1 = (SM_SentinelUndef == Mask[0] ? DAG.getUNDEF(MVT::v4f32) : V1);
-      Shuffle = X86ISD::MOVLHPS;
-      SrcVT = DstVT = MVT::v4f32;
+      Shuffle = Subtarget.hasSSE2() ? X86ISD::UNPCKL : X86ISD::MOVLHPS;
+      SrcVT = DstVT = Subtarget.hasSSE2() ? MVT::v2f64 : MVT::v4f32;
        return true;
      }
      if (isTargetShuffleEquivalent(Mask, {1, 1}) && AllowFloatDomain) {
        V2 = V1;
-      Shuffle = X86ISD::MOVHLPS;
-      SrcVT = DstVT = MVT::v4f32;
+      Shuffle = Subtarget.hasSSE2() ? X86ISD::UNPCKH : X86ISD::MOVHLPS;
+      SrcVT = DstVT = Subtarget.hasSSE2() ? MVT::v2f64 : MVT::v4f32;
        return true;
      }
      if (isTargetShuffleEquivalent(Mask, {0, 3}) && Subtarget.hasSSE2() &&
diff --git a/lib/Target/X86/X86InstrSSE.td b/lib/Target/X86/X86InstrSSE.td

index c8ad7d9eabb4e6de9000c248921e50d6af20d905..af40b009d97279f3cb3454e85ce12dc13656acd9 100644 (file)
--- a/lib/Target/X86/X86InstrSSE.td
+++ b/lib/Target/X86/X86InstrSSE.td
@@ -862,6 +862,19 @@ let Constraints = "$src1 = $dst" in {
                        Sched<[SchedWriteFShuffle.XMM]>, NotMemoryFoldable;
  }
  
+// TODO: This is largely to trick fastisel into ignoring the pattern.
+def UnpckhUnary : PatFrag<(ops node:$src1, node:$src2),
+                          (X86Unpckh node:$src1, node:$src2), [{
+  return N->getOperand(0) == N->getOperand(1);
+}]>;
+
+let Predicates = [UseSSE2] in {
+  // TODO: This is a hack pattern to allow lowering to emit unpckh instead of
+  // movhlps for sse2 without changing a bunch of tests.
+  def : Pat<(v2f64 (UnpckhUnary VR128:$src, VR128:$src)),
+            (MOVHLPSrr VR128:$src, VR128:$src)>;
+}
+
  //===----------------------------------------------------------------------===//
  // SSE 1 & 2 - Conversion Instructions
  //===----------------------------------------------------------------------===//
diff --git a/test/CodeGen/X86/extractelement-load.ll b/test/CodeGen/X86/extractelement-load.ll

index f6249c69cff4001395615abc6075889b33e57827..94235d24af80fa8b6d47c434c42639e6c8662ba5 100644 (file)
--- a/test/CodeGen/X86/extractelement-load.ll
+++ b/test/CodeGen/X86/extractelement-load.ll
@@ -85,7 +85,7 @@ define i64 @t4(<2 x double>* %a) {
  ; X32-SSE2-LABEL: t4:
  ; X32-SSE2:       # %bb.0:
  ; X32-SSE2-NEXT:    movl {{[0-9]+}}(%esp), %eax
-; X32-SSE2-NEXT:    movhps {{.*#+}} xmm0 = xmm0[0,1],mem[0,1]
+; X32-SSE2-NEXT:    punpcklqdq {{.*#+}} xmm0 = xmm0[0],mem[0]
  ; X32-SSE2-NEXT:    pshufd {{.*#+}} xmm1 = xmm0[2,3,0,1]
  ; X32-SSE2-NEXT:    movd %xmm1, %eax
  ; X32-SSE2-NEXT:    shufps {{.*#+}} xmm0 = xmm0[3,1,2,3]
author	Craig Topper <craig.topper@intel.com>
	Wed, 18 Jul 2018 05:10:51 +0000 (05:10 +0000)
committer	Craig Topper <craig.topper@intel.com>
	Wed, 18 Jul 2018 05:10:51 +0000 (05:10 +0000)
lib/Target/X86/X86ISelLowering.cpp		patch \| blob \| history
lib/Target/X86/X86InstrSSE.td		patch \| blob \| history
test/CodeGen/X86/extractelement-load.ll		patch \| blob \| history