[AVX512] Convert masked load builtins to generic masked load intrinsics instead of...

author Craig Topper <craig.topper@gmail.com>

Tue, 31 May 2016 06:58:07 +0000 (06:58 +0000)

committer Craig Topper <craig.topper@gmail.com>

Tue, 31 May 2016 06:58:07 +0000 (06:58 +0000)
author Craig Topper <craig.topper@gmail.com>
Tue, 31 May 2016 06:58:07 +0000 (06:58 +0000)
committer Craig Topper <craig.topper@gmail.com>
Tue, 31 May 2016 06:58:07 +0000 (06:58 +0000)
diff --git a/lib/CodeGen/CGBuiltin.cpp b/lib/CodeGen/CGBuiltin.cpp

index eff7fac401e177fb89c79cb48f6f3edef3b508a7..914c1c1cd242f217b7c522b78fc47990c72898cc 100644 (file)
--- a/lib/CodeGen/CGBuiltin.cpp
+++ b/lib/CodeGen/CGBuiltin.cpp
@@ -6309,6 +6309,37 @@ static Value *EmitX86MaskedStore(CodeGenFunction &CGF,
    return CGF.Builder.CreateMaskedStore(Ops[1], Ops[0], Align, Ops[2]);
  }
  
+static Value *EmitX86MaskedLoad(CodeGenFunction &CGF,
+                                SmallVectorImpl<Value *> &Ops, unsigned Align) {
+  // Cast the pointer to right type.
+  Ops[0] = CGF.Builder.CreateBitCast(Ops[0],
+                               llvm::PointerType::getUnqual(Ops[1]->getType()));
+
+  // If the mask is all ones just emit a regular store.
+  if (const auto *C = dyn_cast<Constant>(Ops[2]))
+    if (C->isAllOnesValue())
+      return CGF.Builder.CreateAlignedLoad(Ops[0], Align);
+
+  // Convert the mask from an integer type to a vector of i1.
+  unsigned NumElts = Ops[1]->getType()->getVectorNumElements();
+  llvm::VectorType *MaskTy = llvm::VectorType::get(CGF.Builder.getInt1Ty(),
+                         cast<IntegerType>(Ops[2]->getType())->getBitWidth());
+  Ops[2] = CGF.Builder.CreateBitCast(Ops[2], MaskTy);
+
+  // If we have less than 8 elements, then the starting mask was an i8 and
+  // we need to extract down to the right number of elements.
+  if (NumElts < 8) {
+    int Indices[4];
+    for (unsigned i = 0; i != NumElts; ++i)
+      Indices[i] = i;
+    Ops[2] = CGF.Builder.CreateShuffleVector(Ops[2], Ops[2],
+                                             makeArrayRef(Indices, NumElts),
+                                             "extract");
+  }
+
+  return CGF.Builder.CreateMaskedLoad(Ops[0], Align, Ops[2], Ops[1]);
+}
+
  Value *CodeGenFunction::EmitX86BuiltinExpr(unsigned BuiltinID,
                                             const CallExpr *E) {
    if (BuiltinID == X86::BI__builtin_ms_va_start ||
@@ -6568,6 +6599,42 @@ Value *CodeGenFunction::EmitX86BuiltinExpr(unsigned BuiltinID,
        getContext().getTypeAlignInChars(E->getArg(1)->getType()).getQuantity();
      return EmitX86MaskedStore(*this, Ops, Align);
    }
+  case X86::BI__builtin_ia32_loadups128_mask:
+  case X86::BI__builtin_ia32_loadups256_mask:
+  case X86::BI__builtin_ia32_loadups512_mask:
+  case X86::BI__builtin_ia32_loadupd128_mask:
+  case X86::BI__builtin_ia32_loadupd256_mask:
+  case X86::BI__builtin_ia32_loadupd512_mask:
+  case X86::BI__builtin_ia32_loaddquqi128_mask:
+  case X86::BI__builtin_ia32_loaddquqi256_mask:
+  case X86::BI__builtin_ia32_loaddquqi512_mask:
+  case X86::BI__builtin_ia32_loaddquhi128_mask:
+  case X86::BI__builtin_ia32_loaddquhi256_mask:
+  case X86::BI__builtin_ia32_loaddquhi512_mask:
+  case X86::BI__builtin_ia32_loaddqusi128_mask:
+  case X86::BI__builtin_ia32_loaddqusi256_mask:
+  case X86::BI__builtin_ia32_loaddqusi512_mask:
+  case X86::BI__builtin_ia32_loaddqudi128_mask:
+  case X86::BI__builtin_ia32_loaddqudi256_mask:
+  case X86::BI__builtin_ia32_loaddqudi512_mask:
+    return EmitX86MaskedLoad(*this, Ops, 1);
+
+  case X86::BI__builtin_ia32_loadaps128_mask:
+  case X86::BI__builtin_ia32_loadaps256_mask:
+  case X86::BI__builtin_ia32_loadaps512_mask:
+  case X86::BI__builtin_ia32_loadapd128_mask:
+  case X86::BI__builtin_ia32_loadapd256_mask:
+  case X86::BI__builtin_ia32_loadapd512_mask:
+  case X86::BI__builtin_ia32_movdqa32load128_mask:
+  case X86::BI__builtin_ia32_movdqa32load256_mask:
+  case X86::BI__builtin_ia32_movdqa32load512_mask:
+  case X86::BI__builtin_ia32_movdqa64load128_mask:
+  case X86::BI__builtin_ia32_movdqa64load256_mask:
+  case X86::BI__builtin_ia32_movdqa64load512_mask: {
+    unsigned Align =
+      getContext().getTypeAlignInChars(E->getArg(1)->getType()).getQuantity();
+    return EmitX86MaskedLoad(*this, Ops, Align);
+  }
    case X86::BI__builtin_ia32_storehps:
    case X86::BI__builtin_ia32_storelps: {
      llvm::Type *PtrTy = llvm::PointerType::getUnqual(Int64Ty);
diff --git a/test/CodeGen/avx512bw-builtins.c b/test/CodeGen/avx512bw-builtins.c

index 40584e7a8b90e488a38ce511bf2919782bdae2cd..254304b3e0219069a723d87f0dd620b1cf4c0288 100644 (file)
--- a/test/CodeGen/avx512bw-builtins.c
+++ b/test/CodeGen/avx512bw-builtins.c
@@ -1325,25 +1325,25 @@ __mmask32 test_mm512_kunpackw(__mmask32 __A, __mmask32 __B) {
  
  __m512i test_mm512_mask_loadu_epi16(__m512i __W, __mmask32 __U, void const *__P) {
    // CHECK-LABEL: @test_mm512_mask_loadu_epi16
-  // CHECK: @llvm.x86.avx512.mask.loadu.w.512
+  // CHECK: @llvm.masked.load.v32i16(<32 x i16>* %{{.*}}, i32 1, <32 x i1> %{{.*}}, <32 x i16> %{{.*}})
    return _mm512_mask_loadu_epi16(__W, __U, __P); 
  }
  
  __m512i test_mm512_maskz_loadu_epi16(__mmask32 __U, void const *__P) {
    // CHECK-LABEL: @test_mm512_maskz_loadu_epi16
-  // CHECK: @llvm.x86.avx512.mask.loadu.w.512
+  // CHECK: @llvm.masked.load.v32i16(<32 x i16>* %{{.*}}, i32 1, <32 x i1> %{{.*}}, <32 x i16> %{{.*}})
    return _mm512_maskz_loadu_epi16(__U, __P); 
  }
  
  __m512i test_mm512_mask_loadu_epi8(__m512i __W, __mmask64 __U, void const *__P) {
    // CHECK-LABEL: @test_mm512_mask_loadu_epi8
-  // CHECK: @llvm.x86.avx512.mask.loadu.b.512
+  // CHECK: @llvm.masked.load.v64i8(<64 x i8>* %{{.*}}, i32 1, <64 x i1> %{{.*}}, <64 x i8> %{{.*}})
    return _mm512_mask_loadu_epi8(__W, __U, __P); 
  }
  
  __m512i test_mm512_maskz_loadu_epi8(__mmask64 __U, void const *__P) {
    // CHECK-LABEL: @test_mm512_maskz_loadu_epi8
-  // CHECK: @llvm.x86.avx512.mask.loadu.b.512
+  // CHECK: @llvm.masked.load.v64i8(<64 x i8>* %{{.*}}, i32 1, <64 x i1> %{{.*}}, <64 x i8> %{{.*}})
    return _mm512_maskz_loadu_epi8(__U, __P); 
  }
  void test_mm512_mask_storeu_epi16(void *__P, __mmask32 __U, __m512i __A) {
diff --git a/test/CodeGen/avx512f-builtins.c b/test/CodeGen/avx512f-builtins.c

index ff783aaa376110d3816c85ac0e9073844f4b7945..16fcc37987a52f776fbfc37409b8f55137f68306 100644 (file)
--- a/test/CodeGen/avx512f-builtins.c
+++ b/test/CodeGen/avx512f-builtins.c
@@ -214,21 +214,21 @@ void test_mm512_mask_storeu_epi64(void *__P, __mmask8 __U, __m512i __A) {
  __m512i test_mm512_loadu_si512 (void *__P)
  {
    // CHECK-LABEL: @test_mm512_loadu_si512 
-  // CHECK: @llvm.x86.avx512.mask.loadu.d.512
+  // CHECK: load <16 x i32>, <16 x i32>* %{{.*}}, align 1{{$}}
    return _mm512_loadu_si512 ( __P);
  }
  
  __m512i test_mm512_mask_loadu_epi32 (__m512i __W, __mmask16 __U, void *__P)
  {
    // CHECK-LABEL: @test_mm512_mask_loadu_epi32 
-  // CHECK: @llvm.x86.avx512.mask.loadu.d.512
+  // CHECK: @llvm.masked.load.v16i32(<16 x i32>* %{{.*}}, i32 1, <16 x i1> %{{.*}}, <16 x i32> %{{.*}})
    return _mm512_mask_loadu_epi32 (__W,__U, __P);
  }
  
  __m512i test_mm512_mask_loadu_epi64 (__m512i __W, __mmask8 __U, void *__P)
  {
    // CHECK-LABEL: @test_mm512_mask_loadu_epi64 
-  // CHECK: @llvm.x86.avx512.mask.loadu.q.512(
+  // CHECK: @llvm.masked.load.v8i64(<8 x i64>* %{{.*}}, i32 1, <8 x i1> %{{.*}}, <8 x i64> %{{.*}})
    return _mm512_mask_loadu_epi64 (__W,__U, __P);
  }
  
@@ -242,7 +242,7 @@ __m512 test_mm512_loadu_ps(void *p)
  __m512 test_mm512_mask_loadu_ps (__m512 __W, __mmask16 __U, void *__P)
  {
    // CHECK-LABEL: @test_mm512_mask_loadu_ps 
-  // CHECK: @llvm.x86.avx512.mask.loadu.ps.512
+  // CHECK: @llvm.masked.load.v16f32(<16 x float>* %{{.*}}, i32 1, <16 x i1> %{{.*}}, <16 x float> %{{.*}})
    return _mm512_mask_loadu_ps (__W,__U, __P);
  }
  
@@ -256,7 +256,7 @@ __m512d test_mm512_loadu_pd(void *p)
  __m512d test_mm512_mask_loadu_pd (__m512d __W, __mmask8 __U, void *__P)
  {
    // CHECK-LABEL: @test_mm512_mask_loadu_pd 
-  // CHECK: @llvm.x86.avx512.mask.loadu.pd.512
+  // CHECK: @llvm.masked.load.v8f64(<8 x double>* %{{.*}}, i32 1, <8 x i1> %{{.*}}, <8 x double> %{{.*}})
    return _mm512_mask_loadu_pd (__W,__U, __P);
  }
  
@@ -290,42 +290,42 @@ __m512i test_mm512_load_epi64 (void *__P)
  __m512 test_mm512_load_ps(void *p)
  {
    // CHECK-LABEL: @test_mm512_load_ps
-  // CHECK: @llvm.x86.avx512.mask.load.ps.512
+  // CHECK: load <16 x float>, <16 x float>* %{{.*}}, align 64
    return _mm512_load_ps(p);
  }
  
  __m512 test_mm512_mask_load_ps (__m512 __W, __mmask16 __U, void *__P)
  {
    // CHECK-LABEL: @test_mm512_mask_load_ps 
-  // CHECK: @llvm.x86.avx512.mask.load.ps.512
+  // CHECK: @llvm.masked.load.v16f32(<16 x float>* %{{.*}}, i32 64, <16 x i1> %{{.*}}, <16 x float> %{{.*}})
    return _mm512_mask_load_ps (__W,__U, __P);
  }
  
  __m512 test_mm512_maskz_load_ps(__mmask16 __U, void *__P)
  {
    // CHECK-LABEL: @test_mm512_maskz_load_ps
-  // CHECK:  @llvm.x86.avx512.mask.load.ps.512
+  // CHECK: @llvm.masked.load.v16f32(<16 x float>* %{{.*}}, i32 64, <16 x i1> %{{.*}}, <16 x float> %{{.*}})
    return _mm512_maskz_load_ps(__U, __P);
  }
  
  __m512d test_mm512_load_pd(void *p)
  {
    // CHECK-LABEL: @test_mm512_load_pd
-  // CHECK: @llvm.x86.avx512.mask.load.pd.512
+  // CHECK: load <8 x double>, <8 x double>* %{{.*}}, align 64
    return _mm512_load_pd(p);
  }
  
  __m512d test_mm512_mask_load_pd (__m512d __W, __mmask8 __U, void *__P)
  {
    // CHECK-LABEL: @test_mm512_mask_load_pd 
-  // CHECK: @llvm.x86.avx512.mask.load.pd.512
+  // CHECK: @llvm.masked.load.v8f64(<8 x double>* %{{.*}}, i32 64, <8 x i1> %{{.*}}, <8 x double> %{{.*}})
    return _mm512_mask_load_pd (__W,__U, __P);
  }
  
  __m512d test_mm512_maskz_load_pd(__mmask8 __U, void *__P)
  {
    // CHECK-LABEL: @test_mm512_maskz_load_pd
-  // CHECK: @llvm.x86.avx512.mask.load.pd.512
+  // CHECK: @llvm.masked.load.v8f64(<8 x double>* %{{.*}}, i32 64, <8 x i1> %{{.*}}, <8 x double> %{{.*}})
    return _mm512_maskz_load_pd(__U, __P);
  }
  
@@ -2540,13 +2540,13 @@ __m512i test_mm512_maskz_srli_epi64(__mmask8 __U, __m512i __A) {
  
  __m512i test_mm512_mask_load_epi32(__m512i __W, __mmask16 __U, void const *__P) {
    // CHECK-LABEL: @test_mm512_mask_load_epi32
-  // CHECK: @llvm.x86.avx512.mask.load.d.512
+  // CHECK: @llvm.masked.load.v16i32(<16 x i32>* %{{.*}}, i32 64, <16 x i1> %{{.*}}, <16 x i32> %{{.*}})
    return _mm512_mask_load_epi32(__W, __U, __P); 
  }
  
  __m512i test_mm512_maskz_load_epi32(__mmask16 __U, void const *__P) {
    // CHECK-LABEL: @test_mm512_maskz_load_epi32
-  // CHECK: @llvm.x86.avx512.mask.load.d.512
+  // CHECK: @llvm.masked.load.v16i32(<16 x i32>* %{{.*}}, i32 64, <16 x i1> %{{.*}}, <16 x i32> %{{.*}})
    return _mm512_maskz_load_epi32(__U, __P); 
  }
  
@@ -2576,13 +2576,13 @@ __m512i test_mm512_maskz_mov_epi64(__mmask8 __U, __m512i __A) {
  
  __m512i test_mm512_mask_load_epi64(__m512i __W, __mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm512_mask_load_epi64
-  // CHECK: @llvm.x86.avx512.mask.load.q.512
+  // CHECK: @llvm.masked.load.v8i64(<8 x i64>* %{{.*}}, i32 64, <8 x i1> %{{.*}}, <8 x i64> %{{.*}})
    return _mm512_mask_load_epi64(__W, __U, __P); 
  }
  
  __m512i test_mm512_maskz_load_epi64(__mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm512_maskz_load_epi64
-  // CHECK: @llvm.x86.avx512.mask.load.q.512
+  // CHECK: @llvm.masked.load.v8i64(<8 x i64>* %{{.*}}, i32 64, <8 x i1> %{{.*}}, <8 x i64> %{{.*}})
    return _mm512_maskz_load_epi64(__U, __P); 
  }
  
diff --git a/test/CodeGen/avx512vl-builtins.c b/test/CodeGen/avx512vl-builtins.c

index f5596a735ba2595b6cf8819663dd60c40f8e0f1f..f9db573d45a20317fd492b0477766d240c3aba25 100644 (file)
--- a/test/CodeGen/avx512vl-builtins.c
+++ b/test/CodeGen/avx512vl-builtins.c
@@ -3995,49 +3995,49 @@ __m256i test_mm256_maskz_mov_epi64(__mmask8 __U, __m256i __A) {
  
  __m128i test_mm_mask_load_epi32(__m128i __W, __mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm_mask_load_epi32
-  // CHECK: @llvm.x86.avx512.mask.load.d.128
+  // CHECK: @llvm.masked.load.v4i32(<4 x i32>* %{{.*}}, i32 16, <4 x i1> %{{.*}}, <4 x i32> %{{.*}})
    return _mm_mask_load_epi32(__W, __U, __P); 
  }
  
  __m128i test_mm_maskz_load_epi32(__mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm_maskz_load_epi32
-  // CHECK: @llvm.x86.avx512.mask.load.d.128
+  // CHECK: @llvm.masked.load.v4i32(<4 x i32>* %{{.*}}, i32 16, <4 x i1> %{{.*}}, <4 x i32> %{{.*}})
    return _mm_maskz_load_epi32(__U, __P); 
  }
  
  __m256i test_mm256_mask_load_epi32(__m256i __W, __mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm256_mask_load_epi32
-  // CHECK: @llvm.x86.avx512.mask.load.d.256
+  // CHECK: @llvm.masked.load.v8i32(<8 x i32>* %{{.*}}, i32 32, <8 x i1> %{{.*}}, <8 x i32> %{{.*}})
    return _mm256_mask_load_epi32(__W, __U, __P); 
  }
  
  __m256i test_mm256_maskz_load_epi32(__mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm256_maskz_load_epi32
-  // CHECK: @llvm.x86.avx512.mask.load.d.256
+  // CHECK: @llvm.masked.load.v8i32(<8 x i32>* %{{.*}}, i32 32, <8 x i1> %{{.*}}, <8 x i32> %{{.*}})
    return _mm256_maskz_load_epi32(__U, __P); 
  }
  
  __m128i test_mm_mask_load_epi64(__m128i __W, __mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm_mask_load_epi64
-  // CHECK: @llvm.x86.avx512.mask.load.q.128
+  // CHECK: @llvm.masked.load.v2i64(<2 x i64>* %{{.*}}, i32 16, <2 x i1> %{{.*}}, <2 x i64> %{{.*}})
    return _mm_mask_load_epi64(__W, __U, __P); 
  }
  
  __m128i test_mm_maskz_load_epi64(__mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm_maskz_load_epi64
-  // CHECK: @llvm.x86.avx512.mask.load.q.128
+  // CHECK: @llvm.masked.load.v2i64(<2 x i64>* %{{.*}}, i32 16, <2 x i1> %{{.*}}, <2 x i64> %{{.*}})
    return _mm_maskz_load_epi64(__U, __P); 
  }
  
  __m256i test_mm256_mask_load_epi64(__m256i __W, __mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm256_mask_load_epi64
-  // CHECK: @llvm.x86.avx512.mask.load.q.256
+  // CHECK: @llvm.masked.load.v4i64(<4 x i64>* %{{.*}}, i32 32, <4 x i1> %{{.*}}, <4 x i64> %{{.*}})
    return _mm256_mask_load_epi64(__W, __U, __P); 
  }
  
  __m256i test_mm256_maskz_load_epi64(__mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm256_maskz_load_epi64
-  // CHECK: @llvm.x86.avx512.mask.load.q.256
+  // CHECK: @llvm.masked.load.v4i64(<4 x i64>* %{{.*}}, i32 32, <4 x i1> %{{.*}}, <4 x i64> %{{.*}})
    return _mm256_maskz_load_epi64(__U, __P); 
  }
  
@@ -4199,145 +4199,145 @@ __m256 test_mm256_maskz_fixupimm_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256
  
  __m128d test_mm_mask_load_pd(__m128d __W, __mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm_mask_load_pd
-  // CHECK: @llvm.x86.avx512.mask.load.pd.128
+  // CHECK: @llvm.masked.load.v2f64(<2 x double>* %{{.*}}, i32 16, <2 x i1> %{{.*}}, <2 x double> %{{.*}})
    return _mm_mask_load_pd(__W, __U, __P); 
  }
  
  __m128d test_mm_maskz_load_pd(__mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm_maskz_load_pd
-  // CHECK: @llvm.x86.avx512.mask.load.pd.128
+  // CHECK: @llvm.masked.load.v2f64(<2 x double>* %{{.*}}, i32 16, <2 x i1> %{{.*}}, <2 x double> %{{.*}})
    return _mm_maskz_load_pd(__U, __P); 
  }
  
  __m256d test_mm256_mask_load_pd(__m256d __W, __mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm256_mask_load_pd
-  // CHECK: @llvm.x86.avx512.mask.load.pd.256
+  // CHECK: @llvm.masked.load.v4f64(<4 x double>* %{{.*}}, i32 32, <4 x i1> %{{.*}}, <4 x double> %{{.*}})
    return _mm256_mask_load_pd(__W, __U, __P); 
  }
  
  __m256d test_mm256_maskz_load_pd(__mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm256_maskz_load_pd
-  // CHECK: @llvm.x86.avx512.mask.load.pd.256
+  // CHECK: @llvm.masked.load.v4f64(<4 x double>* %{{.*}}, i32 32, <4 x i1> %{{.*}}, <4 x double> %{{.*}})
    return _mm256_maskz_load_pd(__U, __P); 
  }
  
  __m128 test_mm_mask_load_ps(__m128 __W, __mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm_mask_load_ps
-  // CHECK: @llvm.x86.avx512.mask.load.ps.128
+  // CHECK: @llvm.masked.load.v4f32(<4 x float>* %{{.*}}, i32 16, <4 x i1> %{{.*}}, <4 x float> %{{.*}})
    return _mm_mask_load_ps(__W, __U, __P); 
  }
  
  __m128 test_mm_maskz_load_ps(__mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm_maskz_load_ps
-  // CHECK: @llvm.x86.avx512.mask.load.ps.128
+  // CHECK: @llvm.masked.load.v4f32(<4 x float>* %{{.*}}, i32 16, <4 x i1> %{{.*}}, <4 x float> %{{.*}})
    return _mm_maskz_load_ps(__U, __P); 
  }
  
  __m256 test_mm256_mask_load_ps(__m256 __W, __mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm256_mask_load_ps
-  // CHECK: @llvm.x86.avx512.mask.load.ps.256
+  // CHECK: @llvm.masked.load.v8f32(<8 x float>* %{{.*}}, i32 32, <8 x i1> %{{.*}}, <8 x float> %{{.*}})
    return _mm256_mask_load_ps(__W, __U, __P); 
  }
  
  __m256 test_mm256_maskz_load_ps(__mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm256_maskz_load_ps
-  // CHECK: @llvm.x86.avx512.mask.load.ps.256
+  // CHECK: @llvm.masked.load.v8f32(<8 x float>* %{{.*}}, i32 32, <8 x i1> %{{.*}}, <8 x float> %{{.*}})
    return _mm256_maskz_load_ps(__U, __P); 
  }
  
  __m128i test_mm_mask_loadu_epi64(__m128i __W, __mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm_mask_loadu_epi64
-  // CHECK: @llvm.x86.avx512.mask.loadu.q.128
+  // CHECK: @llvm.masked.load.v2i64(<2 x i64>* %{{.*}}, i32 1, <2 x i1> %{{.*}}, <2 x i64> %{{.*}})
    return _mm_mask_loadu_epi64(__W, __U, __P); 
  }
  
  __m128i test_mm_maskz_loadu_epi64(__mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm_maskz_loadu_epi64
-  // CHECK: @llvm.x86.avx512.mask.loadu.q.128
+  // CHECK: @llvm.masked.load.v2i64(<2 x i64>* %{{.*}}, i32 1, <2 x i1> %{{.*}}, <2 x i64> %{{.*}})
    return _mm_maskz_loadu_epi64(__U, __P); 
  }
  
  __m256i test_mm256_mask_loadu_epi64(__m256i __W, __mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm256_mask_loadu_epi64
-  // CHECK: @llvm.x86.avx512.mask.loadu.q.256
+  // CHECK: @llvm.masked.load.v4i64(<4 x i64>* %{{.*}}, i32 1, <4 x i1> %{{.*}}, <4 x i64> %{{.*}})
    return _mm256_mask_loadu_epi64(__W, __U, __P); 
  }
  
  __m256i test_mm256_maskz_loadu_epi64(__mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm256_maskz_loadu_epi64
-  // CHECK: @llvm.x86.avx512.mask.loadu.q.256
+  // CHECK: @llvm.masked.load.v4i64(<4 x i64>* %{{.*}}, i32 1, <4 x i1> %{{.*}}, <4 x i64> %{{.*}})
    return _mm256_maskz_loadu_epi64(__U, __P); 
  }
  
  __m128i test_mm_mask_loadu_epi32(__m128i __W, __mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm_mask_loadu_epi32
-  // CHECK: @llvm.x86.avx512.mask.loadu.d.128
+  // CHECK: @llvm.masked.load.v4i32(<4 x i32>* %{{.*}}, i32 1, <4 x i1> %{{.*}}, <4 x i32> %{{.*}})
    return _mm_mask_loadu_epi32(__W, __U, __P); 
  }
  
  __m128i test_mm_maskz_loadu_epi32(__mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm_maskz_loadu_epi32
-  // CHECK: @llvm.x86.avx512.mask.loadu.d.128
+  // CHECK: @llvm.masked.load.v4i32(<4 x i32>* %{{.*}}, i32 1, <4 x i1> %{{.*}}, <4 x i32> %{{.*}})
    return _mm_maskz_loadu_epi32(__U, __P); 
  }
  
  __m256i test_mm256_mask_loadu_epi32(__m256i __W, __mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm256_mask_loadu_epi32
-  // CHECK: @llvm.x86.avx512.mask.loadu.d.256
+  // CHECK: @llvm.masked.load.v8i32(<8 x i32>* %{{.*}}, i32 1, <8 x i1> %{{.*}}, <8 x i32> %{{.*}})
    return _mm256_mask_loadu_epi32(__W, __U, __P); 
  }
  
  __m256i test_mm256_maskz_loadu_epi32(__mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm256_maskz_loadu_epi32
-  // CHECK: @llvm.x86.avx512.mask.loadu.d.256
+  // CHECK: @llvm.masked.load.v8i32(<8 x i32>* %{{.*}}, i32 1, <8 x i1> %{{.*}}, <8 x i32> %{{.*}})
    return _mm256_maskz_loadu_epi32(__U, __P); 
  }
  
  __m128d test_mm_mask_loadu_pd(__m128d __W, __mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm_mask_loadu_pd
-  // CHECK: @llvm.x86.avx512.mask.loadu.pd.128
+  // CHECK: @llvm.masked.load.v2f64(<2 x double>* %{{.*}}, i32 1, <2 x i1> %{{.*}}, <2 x double> %{{.*}})
    return _mm_mask_loadu_pd(__W, __U, __P); 
  }
  
  __m128d test_mm_maskz_loadu_pd(__mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm_maskz_loadu_pd
-  // CHECK: @llvm.x86.avx512.mask.loadu.pd.128
+  // CHECK: @llvm.masked.load.v2f64(<2 x double>* %{{.*}}, i32 1, <2 x i1> %{{.*}}, <2 x double> %{{.*}})
    return _mm_maskz_loadu_pd(__U, __P); 
  }
  
  __m256d test_mm256_mask_loadu_pd(__m256d __W, __mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm256_mask_loadu_pd
-  // CHECK: @llvm.x86.avx512.mask.loadu.pd.256
+  // CHECK: @llvm.masked.load.v4f64(<4 x double>* %{{.*}}, i32 1, <4 x i1> %{{.*}}, <4 x double> %{{.*}})
    return _mm256_mask_loadu_pd(__W, __U, __P); 
  }
  
  __m256d test_mm256_maskz_loadu_pd(__mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm256_maskz_loadu_pd
-  // CHECK: @llvm.x86.avx512.mask.loadu.pd.256
+  // CHECK: @llvm.masked.load.v4f64(<4 x double>* %{{.*}}, i32 1, <4 x i1> %{{.*}}, <4 x double> %{{.*}})
    return _mm256_maskz_loadu_pd(__U, __P); 
  }
  
  __m128 test_mm_mask_loadu_ps(__m128 __W, __mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm_mask_loadu_ps
-  // CHECK: @llvm.x86.avx512.mask.loadu.ps.128
+  // CHECK: @llvm.masked.load.v4f32(<4 x float>* %{{.*}}, i32 1, <4 x i1> %{{.*}}, <4 x float> %{{.*}})
    return _mm_mask_loadu_ps(__W, __U, __P); 
  }
  
  __m128 test_mm_maskz_loadu_ps(__mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm_maskz_loadu_ps
-  // CHECK: @llvm.x86.avx512.mask.loadu.ps.128
+  // CHECK: @llvm.masked.load.v4f32(<4 x float>* %{{.*}}, i32 1, <4 x i1> %{{.*}}, <4 x float> %{{.*}})
    return _mm_maskz_loadu_ps(__U, __P); 
  }
  
  __m256 test_mm256_mask_loadu_ps(__m256 __W, __mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm256_mask_loadu_ps
-  // CHECK: @llvm.x86.avx512.mask.loadu.ps.256
+  // CHECK: @llvm.masked.load.v8f32(<8 x float>* %{{.*}}, i32 1, <8 x i1> %{{.*}}, <8 x float> %{{.*}})
    return _mm256_mask_loadu_ps(__W, __U, __P); 
  }
  
  __m256 test_mm256_maskz_loadu_ps(__mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm256_maskz_loadu_ps
-  // CHECK: @llvm.x86.avx512.mask.loadu.ps.256
+  // CHECK: @llvm.masked.load.v8f32(<8 x float>* %{{.*}}, i32 1, <8 x i1> %{{.*}}, <8 x float> %{{.*}})
    return _mm256_maskz_loadu_ps(__U, __P); 
  }
  
diff --git a/test/CodeGen/avx512vlbw-builtins.c b/test/CodeGen/avx512vlbw-builtins.c

index 84cdf861bcaf5506cc0b6689a2c92b17506df74e..d5e357670efba5001255879b47acfdd8daa45527 100644 (file)
--- a/test/CodeGen/avx512vlbw-builtins.c
+++ b/test/CodeGen/avx512vlbw-builtins.c
@@ -2007,49 +2007,49 @@ __m256i test_mm256_maskz_mov_epi8(__mmask32 __U, __m256i __A) {
  
  __m128i test_mm_mask_loadu_epi16(__m128i __W, __mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm_mask_loadu_epi16
-  // CHECK: @llvm.x86.avx512.mask.loadu.w.128
+  // CHECK: @llvm.masked.load.v8i16(<8 x i16>* %{{.*}}, i32 1, <8 x i1> %{{.*}}, <8 x i16> %{{.*}})
    return _mm_mask_loadu_epi16(__W, __U, __P); 
  }
  
  __m128i test_mm_maskz_loadu_epi16(__mmask8 __U, void const *__P) {
    // CHECK-LABEL: @test_mm_maskz_loadu_epi16
-  // CHECK: @llvm.x86.avx512.mask.loadu.w.128
+  // CHECK: @llvm.masked.load.v8i16(<8 x i16>* %{{.*}}, i32 1, <8 x i1> %{{.*}}, <8 x i16> %{{.*}})
    return _mm_maskz_loadu_epi16(__U, __P); 
  }
  
  __m256i test_mm256_mask_loadu_epi16(__m256i __W, __mmask16 __U, void const *__P) {
    // CHECK-LABEL: @test_mm256_mask_loadu_epi16
-  // CHECK: @llvm.x86.avx512.mask.loadu.w.256
+  // CHECK: @llvm.masked.load.v16i16(<16 x i16>* %{{.*}}, i32 1, <16 x i1> %{{.*}}, <16 x i16> %{{.*}})
    return _mm256_mask_loadu_epi16(__W, __U, __P); 
  }
  
  __m256i test_mm256_maskz_loadu_epi16(__mmask16 __U, void const *__P) {
    // CHECK-LABEL: @test_mm256_maskz_loadu_epi16
-  // CHECK: @llvm.x86.avx512.mask.loadu.w.256
+  // CHECK: @llvm.masked.load.v16i16(<16 x i16>* %{{.*}}, i32 1, <16 x i1> %{{.*}}, <16 x i16> %{{.*}})
    return _mm256_maskz_loadu_epi16(__U, __P); 
  }
  
  __m128i test_mm_mask_loadu_epi8(__m128i __W, __mmask16 __U, void const *__P) {
    // CHECK-LABEL: @test_mm_mask_loadu_epi8
-  // CHECK: @llvm.x86.avx512.mask.loadu.b.128
+  // CHECK: @llvm.masked.load.v16i8(<16 x i8>* %{{.*}}, i32 1, <16 x i1> %{{.*}}, <16 x i8> %{{.*}})
    return _mm_mask_loadu_epi8(__W, __U, __P); 
  }
  
  __m128i test_mm_maskz_loadu_epi8(__mmask16 __U, void const *__P) {
    // CHECK-LABEL: @test_mm_maskz_loadu_epi8
-  // CHECK: @llvm.x86.avx512.mask.loadu.b.128
+  // CHECK: @llvm.masked.load.v16i8(<16 x i8>* %{{.*}}, i32 1, <16 x i1> %{{.*}}, <16 x i8> %{{.*}})
    return _mm_maskz_loadu_epi8(__U, __P); 
  }
  
  __m256i test_mm256_mask_loadu_epi8(__m256i __W, __mmask32 __U, void const *__P) {
    // CHECK-LABEL: @test_mm256_mask_loadu_epi8
-  // CHECK: @llvm.x86.avx512.mask.loadu.b.256
+  // CHECK: @llvm.masked.load.v32i8(<32 x i8>* %{{.*}}, i32 1, <32 x i1> %{{.*}}, <32 x i8> %{{.*}})
    return _mm256_mask_loadu_epi8(__W, __U, __P); 
  }
  
  __m256i test_mm256_maskz_loadu_epi8(__mmask32 __U, void const *__P) {
    // CHECK-LABEL: @test_mm256_maskz_loadu_epi8
-  // CHECK: @llvm.x86.avx512.mask.loadu.b.256
+  // CHECK: @llvm.masked.load.v32i8(<32 x i8>* %{{.*}}, i32 1, <32 x i1> %{{.*}}, <32 x i8> %{{.*}})
    return _mm256_maskz_loadu_epi8(__U, __P); 
  }
author	Craig Topper <craig.topper@gmail.com>
	Tue, 31 May 2016 06:58:07 +0000 (06:58 +0000)
committer	Craig Topper <craig.topper@gmail.com>
	Tue, 31 May 2016 06:58:07 +0000 (06:58 +0000)
lib/CodeGen/CGBuiltin.cpp		patch \| blob \| history
test/CodeGen/avx512bw-builtins.c		patch \| blob \| history
test/CodeGen/avx512f-builtins.c		patch \| blob \| history
test/CodeGen/avx512vl-builtins.c		patch \| blob \| history
test/CodeGen/avx512vlbw-builtins.c		patch \| blob \| history