[X86][AVX] Peek through bitcasts to find the source of broadcasts

author Simon Pilgrim <llvm-dev@redking.me.uk>

Mon, 27 Jun 2016 07:44:32 +0000 (07:44 +0000)

committer Simon Pilgrim <llvm-dev@redking.me.uk>

Mon, 27 Jun 2016 07:44:32 +0000 (07:44 +0000)
author Simon Pilgrim <llvm-dev@redking.me.uk>
Mon, 27 Jun 2016 07:44:32 +0000 (07:44 +0000)
committer Simon Pilgrim <llvm-dev@redking.me.uk>
Mon, 27 Jun 2016 07:44:32 +0000 (07:44 +0000)
diff --git a/lib/Target/X86/X86ISelLowering.cpp b/lib/Target/X86/X86ISelLowering.cpp

index ebd7fa619f7f931e48288b3e74f932eebd9419b4..8862a194831a462fda672d48567ac76a88656e44 100644 (file)
--- a/lib/Target/X86/X86ISelLowering.cpp
+++ b/lib/Target/X86/X86ISelLowering.cpp
@@ -8510,6 +8510,13 @@ static SDValue lowerVectorShuffleAsBroadcast(const SDLoc &DL, MVT VT,
    SDValue V = V1;
    for (;;) {
      switch (V.getOpcode()) {
+    case ISD::BITCAST: {
+      SDValue VSrc = V.getOperand(0);
+      if (NumElts != VSrc.getSimpleValueType().getVectorNumElements())
+        break;
+      V = VSrc;
+      continue;
+    }
      case ISD::CONCAT_VECTORS: {
        int OperandSize = Mask.size() / V.getNumOperands();
        V = V.getOperand(BroadcastIdx / OperandSize);
diff --git a/test/CodeGen/X86/avx-vbroadcast.ll b/test/CodeGen/X86/avx-vbroadcast.ll

index b7030035444b78211b4e8fa5122f527b0c2f6dce..b312be9aa6b2a92bed10c4e2d4e0e7e2c8a05c23 100644 (file)
--- a/test/CodeGen/X86/avx-vbroadcast.ll
+++ b/test/CodeGen/X86/avx-vbroadcast.ll
@@ -173,14 +173,12 @@ define <8 x i32> @load_splat_8i32_4i32_33333333(<4 x i32>* %ptr) nounwind uwtabl
  ; X32-LABEL: load_splat_8i32_4i32_33333333:
  ; X32:       ## BB#0: ## %entry
  ; X32-NEXT:    movl {{[0-9]+}}(%esp), %eax
-; X32-NEXT:    vpermilps {{.*#+}} xmm0 = mem[3,3,3,3]
-; X32-NEXT:    vinsertf128 $1, %xmm0, %ymm0, %ymm0
+; X32-NEXT:    vbroadcastss 12(%eax), %ymm0
  ; X32-NEXT:    retl
  ;
  ; X64-LABEL: load_splat_8i32_4i32_33333333:
  ; X64:       ## BB#0: ## %entry
-; X64-NEXT:    vpermilps {{.*#+}} xmm0 = mem[3,3,3,3]
-; X64-NEXT:    vinsertf128 $1, %xmm0, %ymm0, %ymm0
+; X64-NEXT:    vbroadcastss 12(%rdi), %ymm0
  ; X64-NEXT:    retq
  entry:
    %ld = load <4 x i32>, <4 x i32>* %ptr
@@ -277,16 +275,12 @@ define <4 x i64> @load_splat_4i64_2i64_1111(<2 x i64>* %ptr) nounwind uwtable re
  ; X32-LABEL: load_splat_4i64_2i64_1111:
  ; X32:       ## BB#0: ## %entry
  ; X32-NEXT:    movl {{[0-9]+}}(%esp), %eax
-; X32-NEXT:    vmovaps (%eax), %xmm0
-; X32-NEXT:    vmovhlps {{.*#+}} xmm0 = xmm0[1,1]
-; X32-NEXT:    vinsertf128 $1, %xmm0, %ymm0, %ymm0
+; X32-NEXT:    vbroadcastsd 8(%eax), %ymm0
  ; X32-NEXT:    retl
  ;
  ; X64-LABEL: load_splat_4i64_2i64_1111:
  ; X64:       ## BB#0: ## %entry
-; X64-NEXT:    vmovaps (%rdi), %xmm0
-; X64-NEXT:    vmovhlps {{.*#+}} xmm0 = xmm0[1,1]
-; X64-NEXT:    vinsertf128 $1, %xmm0, %ymm0, %ymm0
+; X64-NEXT:    vbroadcastsd 8(%rdi), %ymm0
  ; X64-NEXT:    retq
  entry:
    %ld = load <2 x i64>, <2 x i64>* %ptr
diff --git a/test/CodeGen/X86/vector-shuffle-256-v4.ll b/test/CodeGen/X86/vector-shuffle-256-v4.ll

index 8c50695b456dc6f125e361e56239de78fda72e17..610462346fb87c746d6304e442c32bd27c0b17e7 100644 (file)
--- a/test/CodeGen/X86/vector-shuffle-256-v4.ll
+++ b/test/CodeGen/X86/vector-shuffle-256-v4.ll
@@ -1320,8 +1320,7 @@ define <4 x double> @splat_v4f64(<2 x double> %r) {
  define <4 x i64> @splat_mem_v4i64_from_v2i64(<2 x i64>* %ptr) {
  ; AVX1-LABEL: splat_mem_v4i64_from_v2i64:
  ; AVX1:       # BB#0:
-; AVX1-NEXT:    vmovddup {{.*#+}} xmm0 = mem[0,0]
-; AVX1-NEXT:    vinsertf128 $1, %xmm0, %ymm0, %ymm0
+; AVX1-NEXT:    vbroadcastsd (%rdi), %ymm0
  ; AVX1-NEXT:    retq
  ;
  ; AVX2-LABEL: splat_mem_v4i64_from_v2i64:
author	Simon Pilgrim <llvm-dev@redking.me.uk>
	Mon, 27 Jun 2016 07:44:32 +0000 (07:44 +0000)
committer	Simon Pilgrim <llvm-dev@redking.me.uk>
	Mon, 27 Jun 2016 07:44:32 +0000 (07:44 +0000)
lib/Target/X86/X86ISelLowering.cpp		patch \| blob \| history
test/CodeGen/X86/avx-vbroadcast.ll		patch \| blob \| history
test/CodeGen/X86/vector-shuffle-256-v4.ll		patch \| blob \| history