[X86] Improve codegen of v8i64->v8i16 and v16i32->v16i8 truncate with avx512vl, avx51...

author Craig Topper <craig.topper@intel.com>

Thu, 8 Aug 2019 21:36:47 +0000 (21:36 +0000)

committer Craig Topper <craig.topper@intel.com>

Thu, 8 Aug 2019 21:36:47 +0000 (21:36 +0000)
author Craig Topper <craig.topper@intel.com>
Thu, 8 Aug 2019 21:36:47 +0000 (21:36 +0000)
committer Craig Topper <craig.topper@intel.com>
Thu, 8 Aug 2019 21:36:47 +0000 (21:36 +0000)
diff --git a/lib/Target/X86/X86ISelLowering.cpp b/lib/Target/X86/X86ISelLowering.cpp

index ccc932d9562c5a3480c4e925aa6e098081c583b3..2721da1a74704a8bf55caeca1a01d46156db5c96 100644 (file)
--- a/lib/Target/X86/X86ISelLowering.cpp
+++ b/lib/Target/X86/X86ISelLowering.cpp
@@ -1742,6 +1742,9 @@ X86TargetLowering::X86TargetLowering(const X86TargetMachine &TM,
          setOperationAction(ISD::FSHR, VT, Custom);
        }
      }
+
+    setOperationAction(ISD::TRUNCATE, MVT::v16i32, Custom);
+    setOperationAction(ISD::TRUNCATE, MVT::v8i64, Custom);
    }
  
    // We want to custom lower some of our intrinsics.
@@ -19017,8 +19020,26 @@ SDValue X86TargetLowering::LowerTRUNCATE(SDValue Op, SelectionDAG &DAG) const {
           "Invalid TRUNCATE operation");
  
    // If called by the legalizer just return.
-  if (!DAG.getTargetLoweringInfo().isTypeLegal(InVT))
+  if (!DAG.getTargetLoweringInfo().isTypeLegal(InVT)) {
+    if ((InVT == MVT::v8i64 || InVT == MVT::v16i32) && VT.is128BitVector()) {
+      assert(Subtarget.hasVLX() && "Unexpected subtarget!");
+      // The default behavior is to truncate one step, concatenate, and then
+      // truncate the remainder. We'd rather produce two 64-bit results and
+      // concatenate those.
+      SDValue Lo, Hi;
+      std::tie(Lo, Hi) = DAG.SplitVector(In, DL);
+
+      EVT LoVT, HiVT;
+      std::tie(LoVT, HiVT) = DAG.GetSplitDestVTs(VT);
+
+      Lo = DAG.getNode(ISD::TRUNCATE, DL, LoVT, Lo);
+      Hi = DAG.getNode(ISD::TRUNCATE, DL, HiVT, Hi);
+      return DAG.getNode(ISD::CONCAT_VECTORS, DL, VT, Lo, Hi);
+    }
+
+    // Otherwise let default legalization handle it.
      return SDValue();
+  }
  
    if (VT.getVectorElementType() == MVT::i1)
      return LowerTruncateVecI1(Op, DAG, Subtarget);
diff --git a/test/CodeGen/X86/min-legal-vector-width.ll b/test/CodeGen/X86/min-legal-vector-width.ll

index 40d557afe2b49f6479a38d92d7c6781c55870824..3f5a14474ae878a6690296db4b4aec0fea08f51a 100644 (file)
--- a/test/CodeGen/X86/min-legal-vector-width.ll
+++ b/test/CodeGen/X86/min-legal-vector-width.ll
@@ -725,10 +725,9 @@ define <16 x i8> @trunc_v16i32_v16i8(<16 x i32>* %x) nounwind "min-legal-vector-
  ; CHECK:       # %bb.0:
  ; CHECK-NEXT:    vmovdqa (%rdi), %ymm0
  ; CHECK-NEXT:    vmovdqa 32(%rdi), %ymm1
-; CHECK-NEXT:    vpmovdw %ymm0, %xmm0
-; CHECK-NEXT:    vpmovdw %ymm1, %xmm1
-; CHECK-NEXT:    vinserti128 $1, %xmm1, %ymm0, %ymm0
-; CHECK-NEXT:    vpmovwb %ymm0, %xmm0
+; CHECK-NEXT:    vpmovdb %ymm1, %xmm1
+; CHECK-NEXT:    vpmovdb %ymm0, %xmm0
+; CHECK-NEXT:    vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
  ; CHECK-NEXT:    vzeroupper
  ; CHECK-NEXT:    retq
    %a = load <16 x i32>, <16 x i32>* %x
@@ -741,10 +740,9 @@ define <8 x i16> @trunc_v8i64_v8i16(<8 x i64>* %x) nounwind "min-legal-vector-wi
  ; CHECK:       # %bb.0:
  ; CHECK-NEXT:    vmovdqa (%rdi), %ymm0
  ; CHECK-NEXT:    vmovdqa 32(%rdi), %ymm1
-; CHECK-NEXT:    vpmovqd %ymm0, %xmm0
-; CHECK-NEXT:    vpmovqd %ymm1, %xmm1
-; CHECK-NEXT:    vinserti128 $1, %xmm1, %ymm0, %ymm0
-; CHECK-NEXT:    vpmovdw %ymm0, %xmm0
+; CHECK-NEXT:    vpmovqw %ymm1, %xmm1
+; CHECK-NEXT:    vpmovqw %ymm0, %xmm0
+; CHECK-NEXT:    vpunpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
  ; CHECK-NEXT:    vzeroupper
  ; CHECK-NEXT:    retq
    %a = load <8 x i64>, <8 x i64>* %x
author	Craig Topper <craig.topper@intel.com>
	Thu, 8 Aug 2019 21:36:47 +0000 (21:36 +0000)
committer	Craig Topper <craig.topper@intel.com>
	Thu, 8 Aug 2019 21:36:47 +0000 (21:36 +0000)
lib/Target/X86/X86ISelLowering.cpp		patch \| blob \| history
test/CodeGen/X86/min-legal-vector-width.ll		patch \| blob \| history