From d304062b8cf0086ef8a3a9b2dad8e41e037f66a5 Mon Sep 17 00:00:00 2001 From: Jina Nahias Date: Tue, 19 Sep 2017 11:00:27 +0000 Subject: [PATCH] Lowering Mask Set1 intrinsics to LLVM IR This patch, together with a matching llvm patch (https://reviews.llvm.org/D37669), implements the lowering of X86 mask set1 intrinsics to IR. Differential Revision: https://reviews.llvm.org/D37668 git-svn-id: https://llvm.org/svn/llvm-project/cfe/trunk@313624 91177308-0d34-0410-b5e6-96231b3b80d8 --- include/clang/Basic/BuiltinsX86.def | 9 -- include/clang/Basic/BuiltinsX86_64.def | 3 - lib/Headers/avx512bwintrin.h | 25 ++-- lib/Headers/avx512fintrin.h | 47 +++--- lib/Headers/avx512vlbwintrin.h | 50 +++---- lib/Headers/avx512vlintrin.h | 69 +++++---- test/CodeGen/avx512bw-builtins.c | 198 ++++++++++++++++++++++++- test/CodeGen/avx512f-builtins.c | 165 ++++++++++++++------- test/CodeGen/avx512vl-builtins.c | 86 ++++++++++- test/CodeGen/avx512vlbw-builtins.c | 175 +++++++++++++++++++++- 10 files changed, 655 insertions(+), 172 deletions(-) diff --git a/include/clang/Basic/BuiltinsX86.def b/include/clang/Basic/BuiltinsX86.def index e73cc9b9b7..c0fc5eb748 100644 --- a/include/clang/Basic/BuiltinsX86.def +++ b/include/clang/Basic/BuiltinsX86.def @@ -973,7 +973,6 @@ TARGET_BUILTIN(__builtin_ia32_pmuldq512, "V8LLiV16iV16i", "", "avx512f") TARGET_BUILTIN(__builtin_ia32_pmuludq512, "V8LLiV16iV16i", "", "avx512f") TARGET_BUILTIN(__builtin_ia32_ptestmd512, "UsV16iV16iUs", "", "avx512f") TARGET_BUILTIN(__builtin_ia32_ptestmq512, "UcV8LLiV8LLiUc", "", "avx512f") -TARGET_BUILTIN(__builtin_ia32_pbroadcastd512_gpr_mask, "V16iiV16iUs", "", "avx512f") TARGET_BUILTIN(__builtin_ia32_loaddqusi512_mask, "V16iiC*V16iUs", "", "avx512f") TARGET_BUILTIN(__builtin_ia32_loaddqudi512_mask, "V8LLiLLiC*V8LLiUc", "", "avx512f") TARGET_BUILTIN(__builtin_ia32_loadups512_mask, "V16ffC*V16fUs", "", "avx512f") @@ -1374,11 +1373,6 @@ TARGET_BUILTIN(__builtin_ia32_movdqa64load128_mask, "V2LLiV2LLiC*V2LLiUc","","av TARGET_BUILTIN(__builtin_ia32_movdqa64load256_mask, "V4LLiV4LLiC*V4LLiUc","","avx512vl") TARGET_BUILTIN(__builtin_ia32_movdqa64store128_mask, "vV2LLi*V2LLiUc","","avx512f") TARGET_BUILTIN(__builtin_ia32_movdqa64store256_mask, "vV4LLi*V4LLiUc","","avx512f") -TARGET_BUILTIN(__builtin_ia32_pbroadcastb512_gpr_mask, "V64ccV64cULLi","","avx512bw") -TARGET_BUILTIN(__builtin_ia32_pbroadcastb128_gpr_mask, "V16ccV16cUs","","avx512bw,avx512vl") -TARGET_BUILTIN(__builtin_ia32_pbroadcastb256_gpr_mask, "V32ccV32cUi","","avx512bw,avx512vl") -TARGET_BUILTIN(__builtin_ia32_pbroadcastd128_gpr_mask, "V4iiV4iUc","","avx512vl") -TARGET_BUILTIN(__builtin_ia32_pbroadcastd256_gpr_mask, "V8iiV8iUc","","avx512vl") TARGET_BUILTIN(__builtin_ia32_vpmadd52huq512_mask, "V8LLiV8LLiV8LLiV8LLiUc","","avx512ifma") TARGET_BUILTIN(__builtin_ia32_vpmadd52huq512_maskz, "V8LLiV8LLiV8LLiV8LLiUc","","avx512ifma") TARGET_BUILTIN(__builtin_ia32_vpmadd52luq512_mask, "V8LLiV8LLiV8LLiV8LLiUc","","avx512ifma") @@ -1589,9 +1583,6 @@ TARGET_BUILTIN(__builtin_ia32_broadcastmb128, "V2LLiUc","","avx512cd,avx512vl") TARGET_BUILTIN(__builtin_ia32_broadcastmb256, "V4LLiUc","","avx512cd,avx512vl") TARGET_BUILTIN(__builtin_ia32_broadcastmw128, "V4iUs","","avx512cd,avx512vl") TARGET_BUILTIN(__builtin_ia32_broadcastmw256, "V8iUs","","avx512cd,avx512vl") -TARGET_BUILTIN(__builtin_ia32_pbroadcastw512_gpr_mask, "V32shV32sUi","","avx512bw") -TARGET_BUILTIN(__builtin_ia32_pbroadcastw256_gpr_mask, "V16shV16sUs","","avx512bw,avx512vl") -TARGET_BUILTIN(__builtin_ia32_pbroadcastw128_gpr_mask, "V8ssV8sUc","","avx512bw,avx512vl") TARGET_BUILTIN(__builtin_ia32_pmovsdb512_mask, "V16cV16iV16cUs","","avx512f") TARGET_BUILTIN(__builtin_ia32_pmovsdb512mem_mask, "vV16c*V16iUs","","avx512f") TARGET_BUILTIN(__builtin_ia32_pmovswb512mem_mask, "vV32c*V32sUi","","avx512bw") diff --git a/include/clang/Basic/BuiltinsX86_64.def b/include/clang/Basic/BuiltinsX86_64.def index 4cde153d83..6e120672ff 100644 --- a/include/clang/Basic/BuiltinsX86_64.def +++ b/include/clang/Basic/BuiltinsX86_64.def @@ -71,9 +71,6 @@ TARGET_BUILTIN(__builtin_ia32_pext_di, "ULLiULLiULLi", "", "bmi2") TARGET_BUILTIN(__builtin_ia32_bextri_u64, "ULLiULLiIULLi", "", "tbm") TARGET_BUILTIN(__builtin_ia32_lwpins64, "UcULLiUiUi", "", "lwp") TARGET_BUILTIN(__builtin_ia32_lwpval64, "vULLiUiUi", "", "lwp") -TARGET_BUILTIN(__builtin_ia32_pbroadcastq512_gpr_mask, "V8LLiLLiV8LLiUc", "", "avx512f") -TARGET_BUILTIN(__builtin_ia32_pbroadcastq128_gpr_mask, "V2LLiULLiV2LLiUc","","avx512vl") -TARGET_BUILTIN(__builtin_ia32_pbroadcastq256_gpr_mask, "V4LLiULLiV4LLiUc","","avx512vl") TARGET_BUILTIN(__builtin_ia32_vcvtsd2si64, "LLiV2dIi","","avx512f") TARGET_BUILTIN(__builtin_ia32_vcvtsd2usi64, "ULLiV2dIi","","avx512f") TARGET_BUILTIN(__builtin_ia32_vcvtss2si64, "LLiV4fIi","","avx512f") diff --git a/lib/Headers/avx512bwintrin.h b/lib/Headers/avx512bwintrin.h index fa4fb20432..53da5869d3 100644 --- a/lib/Headers/avx512bwintrin.h +++ b/lib/Headers/avx512bwintrin.h @@ -2026,18 +2026,17 @@ _mm512_maskz_mov_epi8 (__mmask64 __U, __m512i __A) static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_set1_epi8 (__m512i __O, __mmask64 __M, char __A) { - return (__m512i) __builtin_ia32_pbroadcastb512_gpr_mask (__A, - (__v64qi) __O, - __M); + return (__m512i) __builtin_ia32_selectb_512(__M, + (__v64qi)_mm512_set1_epi8(__A), + (__v64qi) __O); } static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_set1_epi8 (__mmask64 __M, char __A) { - return (__m512i) __builtin_ia32_pbroadcastb512_gpr_mask (__A, - (__v64qi) - _mm512_setzero_qi(), - __M); + return (__m512i) __builtin_ia32_selectb_512(__M, + (__v64qi) _mm512_set1_epi8(__A), + (__v64qi) _mm512_setzero_si512()); } static __inline__ __mmask64 __DEFAULT_FN_ATTRS @@ -2217,17 +2216,17 @@ _mm512_maskz_broadcastb_epi8 (__mmask64 __M, __m128i __A) static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_set1_epi16 (__m512i __O, __mmask32 __M, short __A) { - return (__m512i) __builtin_ia32_pbroadcastw512_gpr_mask (__A, - (__v32hi) __O, - __M); + return (__m512i) __builtin_ia32_selectw_512(__M, + (__v32hi) _mm512_set1_epi16(__A), + (__v32hi) __O); } static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_set1_epi16 (__mmask32 __M, short __A) { - return (__m512i) __builtin_ia32_pbroadcastw512_gpr_mask (__A, - (__v32hi) _mm512_setzero_hi(), - __M); + return (__m512i) __builtin_ia32_selectw_512(__M, + (__v32hi) _mm512_set1_epi16(__A), + (__v32hi) _mm512_setzero_si512()); } static __inline__ __m512i __DEFAULT_FN_ATTRS diff --git a/lib/Headers/avx512fintrin.h b/lib/Headers/avx512fintrin.h index 8ec3aa4c82..247ac879ea 100644 --- a/lib/Headers/avx512fintrin.h +++ b/lib/Headers/avx512fintrin.h @@ -258,25 +258,6 @@ _mm512_maskz_broadcastq_epi64 (__mmask8 __M, __m128i __A) (__v8di) _mm512_setzero_si512()); } -static __inline __m512i __DEFAULT_FN_ATTRS -_mm512_maskz_set1_epi32(__mmask16 __M, int __A) -{ - return (__m512i) __builtin_ia32_pbroadcastd512_gpr_mask (__A, - (__v16si) - _mm512_setzero_si512 (), - __M); -} - -#ifdef __x86_64__ -static __inline __m512i __DEFAULT_FN_ATTRS -_mm512_maskz_set1_epi64(__mmask8 __M, long long __A) -{ - return (__m512i) __builtin_ia32_pbroadcastq512_gpr_mask (__A, - (__v8di) - _mm512_setzero_si512 (), - __M); -} -#endif static __inline __m512 __DEFAULT_FN_ATTRS _mm512_setzero_ps(void) @@ -335,12 +316,30 @@ _mm512_set1_epi32(int __s) __s, __s, __s, __s, __s, __s, __s, __s }; } +static __inline __m512i __DEFAULT_FN_ATTRS +_mm512_maskz_set1_epi32(__mmask16 __M, int __A) +{ + return (__m512i)__builtin_ia32_selectd_512(__M, + (__v16si)_mm512_set1_epi32(__A), + (__v16si)_mm512_setzero_si512()); +} + static __inline __m512i __DEFAULT_FN_ATTRS _mm512_set1_epi64(long long __d) { return (__m512i)(__v8di){ __d, __d, __d, __d, __d, __d, __d, __d }; } +#ifdef __x86_64__ +static __inline __m512i __DEFAULT_FN_ATTRS +_mm512_maskz_set1_epi64(__mmask8 __M, long long __A) +{ + return (__m512i)__builtin_ia32_selectq_512(__M, + (__v8di)_mm512_set1_epi64(__A), + (__v8di)_mm512_setzero_si512()); +} +#endif + static __inline__ __m512 __DEFAULT_FN_ATTRS _mm512_broadcastss_ps(__m128 __A) { @@ -9737,16 +9736,18 @@ _mm_cvtu64_ss (__m128 __A, unsigned long long __B) static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_set1_epi32 (__m512i __O, __mmask16 __M, int __A) { - return (__m512i) __builtin_ia32_pbroadcastd512_gpr_mask (__A, (__v16si) __O, - __M); + return (__m512i) __builtin_ia32_selectd_512(__M, + (__v16si) _mm512_set1_epi32(__A), + (__v16si) __O); } #ifdef __x86_64__ static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_set1_epi64 (__m512i __O, __mmask8 __M, long long __A) { - return (__m512i) __builtin_ia32_pbroadcastq512_gpr_mask (__A, (__v8di) __O, - __M); + return (__m512i) __builtin_ia32_selectq_512(__M, + (__v8di) _mm512_set1_epi64(__A), + (__v8di) __O); } #endif diff --git a/lib/Headers/avx512vlbwintrin.h b/lib/Headers/avx512vlbwintrin.h index 3b58d04339..4ab785bdbb 100644 --- a/lib/Headers/avx512vlbwintrin.h +++ b/lib/Headers/avx512vlbwintrin.h @@ -2660,35 +2660,33 @@ _mm256_maskz_mov_epi8 (__mmask32 __U, __m256i __A) static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_set1_epi8 (__m128i __O, __mmask16 __M, char __A) { - return (__m128i) __builtin_ia32_pbroadcastb128_gpr_mask (__A, - (__v16qi) __O, - __M); + return (__m128i) __builtin_ia32_selectb_128(__M, + (__v16qi) _mm_set1_epi8(__A), + (__v16qi) __O); } static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_set1_epi8 (__mmask16 __M, char __A) { - return (__m128i) __builtin_ia32_pbroadcastb128_gpr_mask (__A, - (__v16qi) - _mm_setzero_si128 (), - __M); + return (__m128i) __builtin_ia32_selectb_128(__M, + (__v16qi) _mm_set1_epi8(__A), + (__v16qi) _mm_setzero_si128()); } static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_set1_epi8 (__m256i __O, __mmask32 __M, char __A) { - return (__m256i) __builtin_ia32_pbroadcastb256_gpr_mask (__A, - (__v32qi) __O, - __M); + return (__m256i) __builtin_ia32_selectb_256(__M, + (__v32qi) _mm256_set1_epi8(__A), + (__v32qi) __O); } static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_set1_epi8 (__mmask32 __M, char __A) { - return (__m256i) __builtin_ia32_pbroadcastb256_gpr_mask (__A, - (__v32qi) - _mm256_setzero_si256 (), - __M); + return (__m256i) __builtin_ia32_selectb_256(__M, + (__v32qi) _mm256_set1_epi8(__A), + (__v32qi) _mm256_setzero_si256()); } static __inline__ __m128i __DEFAULT_FN_ATTRS @@ -3025,33 +3023,33 @@ _mm256_maskz_broadcastw_epi16 (__mmask16 __M, __m128i __A) static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_set1_epi16 (__m256i __O, __mmask16 __M, short __A) { - return (__m256i) __builtin_ia32_pbroadcastw256_gpr_mask (__A, - (__v16hi) __O, - __M); + return (__m256i) __builtin_ia32_selectw_256 (__M, + (__v16hi) _mm256_set1_epi16(__A), + (__v16hi) __O); } static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_set1_epi16 (__mmask16 __M, short __A) { - return (__m256i) __builtin_ia32_pbroadcastw256_gpr_mask (__A, - (__v16hi) _mm256_setzero_si256 (), - __M); + return (__m256i) __builtin_ia32_selectw_256(__M, + (__v16hi)_mm256_set1_epi16(__A), + (__v16hi) _mm256_setzero_si256()); } static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_set1_epi16 (__m128i __O, __mmask8 __M, short __A) { - return (__m128i) __builtin_ia32_pbroadcastw128_gpr_mask (__A, - (__v8hi) __O, - __M); + return (__m128i) __builtin_ia32_selectw_128(__M, + (__v8hi) _mm_set1_epi16(__A), + (__v8hi) __O); } static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_set1_epi16 (__mmask8 __M, short __A) { - return (__m128i) __builtin_ia32_pbroadcastw128_gpr_mask (__A, - (__v8hi) _mm_setzero_si128 (), - __M); + return (__m128i) __builtin_ia32_selectw_128(__M, + (__v8hi) _mm_set1_epi16(__A), + (__v8hi) _mm_setzero_si128()); } static __inline__ __m128i __DEFAULT_FN_ATTRS diff --git a/lib/Headers/avx512vlintrin.h b/lib/Headers/avx512vlintrin.h index 99bb050de4..da79b201b7 100644 --- a/lib/Headers/avx512vlintrin.h +++ b/lib/Headers/avx512vlintrin.h @@ -5723,59 +5723,72 @@ _mm256_maskz_movedup_pd (__mmask8 __U, __m256d __A) (__v4df)_mm256_setzero_pd()); } +static __inline__ __m128i __DEFAULT_FN_ATTRS +_mm_mask_set1_epi32(__m128i __O, __mmask8 __M, int __A) +{ + return (__m128i)__builtin_ia32_selectd_128(__M, + (__v4si) _mm_set1_epi32(__A), + (__v4si)__O); +} -#define _mm_mask_set1_epi32(O, M, A) __extension__ ({ \ - (__m128i)__builtin_ia32_pbroadcastd128_gpr_mask((int)(A), \ - (__v4si)(__m128i)(O), \ - (__mmask8)(M)); }) +static __inline__ __m128i __DEFAULT_FN_ATTRS +_mm_maskz_set1_epi32( __mmask8 __M, int __A) +{ + return (__m128i)__builtin_ia32_selectd_128(__M, + (__v4si) _mm_set1_epi32(__A), + (__v4si)_mm_setzero_si128()); +} -#define _mm_maskz_set1_epi32(M, A) __extension__ ({ \ - (__m128i)__builtin_ia32_pbroadcastd128_gpr_mask((int)(A), \ - (__v4si)_mm_setzero_si128(), \ - (__mmask8)(M)); }) +static __inline__ __m256i __DEFAULT_FN_ATTRS +_mm256_mask_set1_epi32(__m256i __O, __mmask8 __M, int __A) +{ + return (__m256i)__builtin_ia32_selectd_256(__M, + (__v8si) _mm256_set1_epi32(__A), + (__v8si)__O); +} -#define _mm256_mask_set1_epi32(O, M, A) __extension__ ({ \ - (__m256i)__builtin_ia32_pbroadcastd256_gpr_mask((int)(A), \ - (__v8si)(__m256i)(O), \ - (__mmask8)(M)); }) +static __inline__ __m256i __DEFAULT_FN_ATTRS +_mm256_maskz_set1_epi32( __mmask8 __M, int __A) +{ + return (__m256i)__builtin_ia32_selectd_256(__M, + (__v8si) _mm256_set1_epi32(__A), + (__v8si)_mm256_setzero_si256()); +} -#define _mm256_maskz_set1_epi32(M, A) __extension__ ({ \ - (__m256i)__builtin_ia32_pbroadcastd256_gpr_mask((int)(A), \ - (__v8si)_mm256_setzero_si256(), \ - (__mmask8)(M)); }) #ifdef __x86_64__ static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_mask_set1_epi64 (__m128i __O, __mmask8 __M, long long __A) { - return (__m128i) __builtin_ia32_pbroadcastq128_gpr_mask (__A, (__v2di) __O, - __M); + return (__m128i) __builtin_ia32_selectq_128(__M, + (__v2di) _mm_set1_epi8(__A), + (__v2di) __O); } static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_maskz_set1_epi64 (__mmask8 __M, long long __A) { - return (__m128i) __builtin_ia32_pbroadcastq128_gpr_mask (__A, - (__v2di) - _mm_setzero_si128 (), - __M); + return (__m128i) __builtin_ia32_selectq_128(__M, + (__v2di) _mm_set1_epi8(__A), + (__v2di) _mm_setzero_si128()); } static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_mask_set1_epi64 (__m256i __O, __mmask8 __M, long long __A) { - return (__m256i) __builtin_ia32_pbroadcastq256_gpr_mask (__A, (__v4di) __O, - __M); + return (__m256i) __builtin_ia32_selectq_256(__M, + (__v4di) _mm256_set1_epi64x(__A), + (__v4di) __O) ; } static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_maskz_set1_epi64 (__mmask8 __M, long long __A) { - return (__m256i) __builtin_ia32_pbroadcastq256_gpr_mask (__A, - (__v4di) - _mm256_setzero_si256 (), - __M); + return (__m256i) __builtin_ia32_selectq_256(__M, + (__v4di) _mm256_set1_epi64x(__A), + (__v4di) _mm256_setzero_si256()); } + #endif #define _mm_fixupimm_pd(A, B, C, imm) __extension__ ({ \ diff --git a/test/CodeGen/avx512bw-builtins.c b/test/CodeGen/avx512bw-builtins.c index 0ad15e6725..eb7b2a5cb5 100644 --- a/test/CodeGen/avx512bw-builtins.c +++ b/test/CodeGen/avx512bw-builtins.c @@ -1490,13 +1490,139 @@ __m512i test_mm512_maskz_mov_epi8(__mmask64 __U, __m512i __A) { __m512i test_mm512_mask_set1_epi8(__m512i __O, __mmask64 __M, char __A) { // CHECK-LABEL: @test_mm512_mask_set1_epi8 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.b.gpr.512 + // CHECK: insertelement <64 x i8> undef, i8 %{{.*}}, i32 0 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 1 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 2 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 3 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 4 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 5 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 6 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 7 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 8 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 9 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 10 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 11 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 12 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 13 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 14 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 15 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 16 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 17 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 18 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 19 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 20 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 21 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 22 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 23 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 24 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 25 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 26 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 27 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 28 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 29 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 30 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 31 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 34 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 35 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 36 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 37 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 38 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 39 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 40 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 41 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 42 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 43 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 44 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 45 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 46 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 47 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 48 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 49 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 50 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 51 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 52 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 53 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 54 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 55 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 56 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 57 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 58 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 59 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 60 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 61 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 62 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 63 + // CHECK: select <64 x i1> %{{.*}}, <64 x i8> %{{.*}}, <64 x i8> %{{.*}} return _mm512_mask_set1_epi8(__O, __M, __A); } __m512i test_mm512_maskz_set1_epi8(__mmask64 __M, char __A) { // CHECK-LABEL: @test_mm512_maskz_set1_epi8 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.b.gpr.512 + // CHECK: insertelement <64 x i8> undef, i8 %{{.*}}, i32 0 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 1 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 2 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 3 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 4 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 5 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 6 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 7 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 8 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 9 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 10 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 11 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 12 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 13 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 14 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 15 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 16 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 17 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 18 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 19 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 20 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 21 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 22 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 23 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 24 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 25 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 26 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 27 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 28 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 29 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 30 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 31 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 32 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 33 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 34 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 35 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 36 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 37 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 38 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 39 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 40 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 41 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 42 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 43 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 44 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 45 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 46 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 47 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 48 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 49 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 50 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 51 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 52 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 53 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 54 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 55 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 56 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 57 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 58 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 59 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 60 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 61 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 62 + // CHECK: insertelement <64 x i8> %{{.*}}, i8 %{{.*}}, i32 63 + // CHECK: select <64 x i1> %{{.*}}, <64 x i8> %{{.*}}, <64 x i8> %{{.*}} return _mm512_maskz_set1_epi8(__M, __A); } @@ -1655,13 +1781,77 @@ __m512i test_mm512_maskz_broadcastw_epi16(__mmask32 __M, __m128i __A) { __m512i test_mm512_mask_set1_epi16(__m512i __O, __mmask32 __M, short __A) { // CHECK-LABEL: @test_mm512_mask_set1_epi16 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.w.gpr.512 + // CHECK: insertelement <32 x i16> undef, i16 %{{.*}}, i32 0 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 1 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 2 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 3 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 4 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 5 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 6 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 7 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 8 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 9 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 10 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 11 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 12 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 13 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 14 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 15 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 16 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 17 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 18 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 19 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 20 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 21 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 22 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 23 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 24 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 25 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 26 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 27 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 28 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 29 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 30 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 31 + // CHECK: select <32 x i1> %{{.*}}, <32 x i16> %{{.*}}, <32 x i16> %{{.*}} return _mm512_mask_set1_epi16(__O, __M, __A); } __m512i test_mm512_maskz_set1_epi16(__mmask32 __M, short __A) { // CHECK-LABEL: @test_mm512_maskz_set1_epi16 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.w.gpr.512 + // CHECK: insertelement <32 x i16> undef, i16 %{{.*}}, i32 0 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 1 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 2 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 3 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 4 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 5 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 6 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 7 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 8 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 9 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 10 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 11 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 12 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 13 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 14 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 15 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 16 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 17 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 18 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 19 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 20 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 21 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 22 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 23 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 24 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 25 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 26 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 27 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 28 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 29 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 30 + // CHECK: insertelement <32 x i16> %{{.*}}, i16 %{{.*}}, i32 31 + // CHECK: select <32 x i1> %{{.*}}, <32 x i16> %{{.*}}, <32 x i16> %{{.*}} return _mm512_maskz_set1_epi16(__M, __A); } __m512i test_mm512_permutexvar_epi16(__m512i __A, __m512i __B) { diff --git a/test/CodeGen/avx512f-builtins.c b/test/CodeGen/avx512f-builtins.c index 381d73ab22..4d106eaaa7 100644 --- a/test/CodeGen/avx512f-builtins.c +++ b/test/CodeGen/avx512f-builtins.c @@ -7728,11 +7728,51 @@ __m512i test_mm512_maskz_min_epu64 (__mmask8 __M, __m512i __A, __m512i __B) __m512i test_mm512_mask_set1_epi32 (__m512i __O, __mmask16 __M, int __A) { - //CHECK-LABEL: @test_mm512_mask_set1_epi32 - //CHECK: @llvm.x86.avx512.mask.pbroadcast.d.gpr.512 + // CHECK-LABEL: @test_mm512_mask_set1_epi32 + // CHECK: insertelement <16 x i32> undef, i32 %{{.*}}, i32 0 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 1 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 2 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 3 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 4 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 5 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 6 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 7 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 8 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 9 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 10 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 11 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 12 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 13 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 14 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 15 + // CHECK: select <16 x i1> %{{.*}}, <16 x i32> %{{.*}}, <16 x i32> %{{.*}} return _mm512_mask_set1_epi32 ( __O, __M, __A); } +__m512i test_mm512_maskz_set1_epi32(__mmask16 __M, int __A) +{ + // CHECK-LABEL: @test_mm512_maskz_set1_epi32 + // CHECK: insertelement <16 x i32> undef, i32 %{{.*}}, i32 0 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 1 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 2 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 3 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 4 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 5 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 6 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 7 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 8 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 9 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 10 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 11 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 12 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 13 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 14 + // CHECK: insertelement <16 x i32> %{{.*}}, i32 %{{.*}}, i32 15 + // CHECK: select <16 x i1> %{{.*}}, <16 x i32> %{{.*}}, <16 x i32> %{{.*}} + return _mm512_maskz_set1_epi32(__M, __A); +} + + __m512i test_mm512_set_epi8(char e63, char e62, char e61, char e60, char e59, char e58, char e57, char e56, char e55, char e54, char e53, char e52, char e51, char e50, char e49, char e48, char e47, char e46, char e45, @@ -7867,21 +7907,21 @@ __m512i test_mm512_set_epi32 (int __A, int __B, int __C, int __D, { //CHECK-LABEL: @test_mm512_set_epi32 //CHECK: insertelement{{.*}}i32 0 - //CHECK: insertelement{{.*}}i32 1 - //CHECK: insertelement{{.*}}i32 2 - //CHECK: insertelement{{.*}}i32 3 - //CHECK: insertelement{{.*}}i32 4 - //CHECK: insertelement{{.*}}i32 5 - //CHECK: insertelement{{.*}}i32 6 - //CHECK: insertelement{{.*}}i32 7 - //CHECK: insertelement{{.*}}i32 8 - //CHECK: insertelement{{.*}}i32 9 - //CHECK: insertelement{{.*}}i32 10 - //CHECK: insertelement{{.*}}i32 11 - //CHECK: insertelement{{.*}}i32 12 - //CHECK: insertelement{{.*}}i32 13 - //CHECK: insertelement{{.*}}i32 14 - //CHECK: insertelement{{.*}}i32 15 + //CHECK: insertelement{{.*}}i32 1 + //CHECK: insertelement{{.*}}i32 2 + //CHECK: insertelement{{.*}}i32 3 + //CHECK: insertelement{{.*}}i32 4 + //CHECK: insertelement{{.*}}i32 5 + //CHECK: insertelement{{.*}}i32 6 + //CHECK: insertelement{{.*}}i32 7 + //CHECK: insertelement{{.*}}i32 8 + //CHECK: insertelement{{.*}}i32 9 + //CHECK: insertelement{{.*}}i32 10 + //CHECK: insertelement{{.*}}i32 11 + //CHECK: insertelement{{.*}}i32 12 + //CHECK: insertelement{{.*}}i32 13 + //CHECK: insertelement{{.*}}i32 14 + //CHECK: insertelement{{.*}}i32 15 return _mm512_set_epi32( __A, __B, __C, __D,__E, __F, __G, __H, __I, __J, __K, __L,__M, __N, __O, __P); } @@ -7891,39 +7931,39 @@ __m512i test_mm512_setr_epi32 (int __A, int __B, int __C, int __D, int __I, int __J, int __K, int __L, int __M, int __N, int __O, int __P) { - //CHECK-LABEL: @test_mm512_setr_epi32 - //CHECK: load{{.*}}%__P.addr, align 4 - //CHECK: load{{.*}}%__O.addr, align 4 - //CHECK: load{{.*}}%__N.addr, align 4 - //CHECK: load{{.*}}%__M.addr, align 4 - //CHECK: load{{.*}}%__L.addr, align 4 - //CHECK: load{{.*}}%__K.addr, align 4 - //CHECK: load{{.*}}%__J.addr, align 4 - //CHECK: load{{.*}}%__I.addr, align 4 - //CHECK: load{{.*}}%__H.addr, align 4 - //CHECK: load{{.*}}%__G.addr, align 4 - //CHECK: load{{.*}}%__F.addr, align 4 - //CHECK: load{{.*}}%__E.addr, align 4 - //CHECK: load{{.*}}%__D.addr, align 4 - //CHECK: load{{.*}}%__C.addr, align 4 - //CHECK: load{{.*}}%__B.addr, align 4 - //CHECK: load{{.*}}%__A.addr, align 4 - //CHECK: insertelement{{.*}}i32 0 - //CHECK: insertelement{{.*}}i32 1 - //CHECK: insertelement{{.*}}i32 2 - //CHECK: insertelement{{.*}}i32 3 - //CHECK: insertelement{{.*}}i32 4 - //CHECK: insertelement{{.*}}i32 5 - //CHECK: insertelement{{.*}}i32 6 - //CHECK: insertelement{{.*}}i32 7 - //CHECK: insertelement{{.*}}i32 8 - //CHECK: insertelement{{.*}}i32 9 - //CHECK: insertelement{{.*}}i32 10 - //CHECK: insertelement{{.*}}i32 11 - //CHECK: insertelement{{.*}}i32 12 - //CHECK: insertelement{{.*}}i32 13 - //CHECK: insertelement{{.*}}i32 14 - //CHECK: insertelement{{.*}}i32 15 + //CHECK-LABEL: @test_mm512_setr_epi32 + //CHECK: load{{.*}}%__P.addr, align 4 + //CHECK: load{{.*}}%__O.addr, align 4 + //CHECK: load{{.*}}%__N.addr, align 4 + //CHECK: load{{.*}}%__M.addr, align 4 + //CHECK: load{{.*}}%__L.addr, align 4 + //CHECK: load{{.*}}%__K.addr, align 4 + //CHECK: load{{.*}}%__J.addr, align 4 + //CHECK: load{{.*}}%__I.addr, align 4 + //CHECK: load{{.*}}%__H.addr, align 4 + //CHECK: load{{.*}}%__G.addr, align 4 + //CHECK: load{{.*}}%__F.addr, align 4 + //CHECK: load{{.*}}%__E.addr, align 4 + //CHECK: load{{.*}}%__D.addr, align 4 + //CHECK: load{{.*}}%__C.addr, align 4 + //CHECK: load{{.*}}%__B.addr, align 4 + //CHECK: load{{.*}}%__A.addr, align 4 + //CHECK: insertelement{{.*}}i32 0 + //CHECK: insertelement{{.*}}i32 1 + //CHECK: insertelement{{.*}}i32 2 + //CHECK: insertelement{{.*}}i32 3 + //CHECK: insertelement{{.*}}i32 4 + //CHECK: insertelement{{.*}}i32 5 + //CHECK: insertelement{{.*}}i32 6 + //CHECK: insertelement{{.*}}i32 7 + //CHECK: insertelement{{.*}}i32 8 + //CHECK: insertelement{{.*}}i32 9 + //CHECK: insertelement{{.*}}i32 10 + //CHECK: insertelement{{.*}}i32 11 + //CHECK: insertelement{{.*}}i32 12 + //CHECK: insertelement{{.*}}i32 13 + //CHECK: insertelement{{.*}}i32 14 + //CHECK: insertelement{{.*}}i32 15 return _mm512_setr_epi32( __A, __B, __C, __D,__E, __F, __G, __H, __I, __J, __K, __L,__M, __N, __O, __P); } @@ -7931,19 +7971,36 @@ __m512i test_mm512_setr_epi32 (int __A, int __B, int __C, int __D, #ifdef __x86_64__ __m512i test_mm512_mask_set1_epi64 (__m512i __O, __mmask8 __M, long long __A) { - //CHECK-LABEL: @test_mm512_mask_set1_epi64 - //CHECK: @llvm.x86.avx512.mask.pbroadcast.q.gpr.512 + // CHECK-LABEL: @test_mm512_mask_set1_epi64 + // CHECK: insertelement <8 x i64> undef, i64 %{{.*}}, i32 0 + // CHECK: insertelement <8 x i64> %{{.*}}, i64 %{{.*}}, i32 1 + // CHECK: insertelement <8 x i64> %{{.*}}, i64 %{{.*}}, i32 2 + // CHECK: insertelement <8 x i64> %{{.*}}, i64 %{{.*}}, i32 3 + // CHECK: insertelement <8 x i64> %{{.*}}, i64 %{{.*}}, i32 4 + // CHECK: insertelement <8 x i64> %{{.*}}, i64 %{{.*}}, i32 5 + // CHECK: insertelement <8 x i64> %{{.*}}, i64 %{{.*}}, i32 6 + // CHECK: insertelement <8 x i64> %{{.*}}, i64 %{{.*}}, i32 7 + // CHECK: select <8 x i1> %{{.*}}, <8 x i64> %{{.*}}, <8 x i64> %{{.*}} return _mm512_mask_set1_epi64 (__O, __M, __A); } __m512i test_mm512_maskz_set1_epi64 (__mmask8 __M, long long __A) { - //CHECK-LABEL: @test_mm512_maskz_set1_epi64 - //CHECK: @llvm.x86.avx512.mask.pbroadcast.q.gpr.512 + // CHECK-LABEL: @test_mm512_maskz_set1_epi64 + // CHECK: insertelement <8 x i64> undef, i64 %{{.*}}, i32 0 + // CHECK: insertelement <8 x i64> %{{.*}}, i64 %{{.*}}, i32 1 + // CHECK: insertelement <8 x i64> %{{.*}}, i64 %{{.*}}, i32 2 + // CHECK: insertelement <8 x i64> %{{.*}}, i64 %{{.*}}, i32 3 + // CHECK: insertelement <8 x i64> %{{.*}}, i64 %{{.*}}, i32 4 + // CHECK: insertelement <8 x i64> %{{.*}}, i64 %{{.*}}, i32 5 + // CHECK: insertelement <8 x i64> %{{.*}}, i64 %{{.*}}, i32 6 + // CHECK: insertelement <8 x i64> %{{.*}}, i64 %{{.*}}, i32 7 + // CHECK: select <8 x i1> %{{.*}}, <8 x i64> %{{.*}}, <8 x i64> %{{.*}} return _mm512_maskz_set1_epi64 (__M, __A); } #endif + __m512i test_mm512_set_epi64 (long long __A, long long __B, long long __C, long long __D, long long __E, long long __F, long long __G, long long __H) diff --git a/test/CodeGen/avx512vl-builtins.c b/test/CodeGen/avx512vl-builtins.c index f325460e07..7efaf8a5cf 100644 --- a/test/CodeGen/avx512vl-builtins.c +++ b/test/CodeGen/avx512vl-builtins.c @@ -4512,50 +4512,120 @@ __m256d test_mm256_maskz_movedup_pd(__mmask8 __U, __m256d __A) { __m128i test_mm_mask_set1_epi32(__m128i __O, __mmask8 __M) { // CHECK-LABEL: @test_mm_mask_set1_epi32 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.d.gpr.128 + // CHECK: insertelement <4 x i32> undef, i32 %{{.*}}, i32 0 + // CHECK: insertelement <4 x i32> %{{.*}}32 1 + // CHECK: insertelement <4 x i32> %{{.*}}32 2 + // CHECK: insertelement <4 x i32> %{{.*}}32 3 + // CHECK: shufflevector <8 x i1> %{{.*}}, <8 x i1> %{{.*}}, <4 x i32> + // CHECK: select <4 x i1> %{{.*}}, <4 x i32> %{{.*}}, <4 x i32> %{{.*}} return _mm_mask_set1_epi32(__O, __M, 5); } __m128i test_mm_maskz_set1_epi32(__mmask8 __M) { // CHECK-LABEL: @test_mm_maskz_set1_epi32 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.d.gpr.128 + // CHECK: insertelement <4 x i32> undef, i32 %{{.*}}, i32 0 + // CHECK: insertelement <4 x i32> %{{.*}}32 1 + // CHECK: insertelement <4 x i32> %{{.*}}32 2 + // CHECK: insertelement <4 x i32> %{{.*}}32 3 + // CHECK: shufflevector <8 x i1> %{{.*}}, <8 x i1> %{{.*}}, <4 x i32> + // CHECK: select <4 x i1> %{{.*}}, <4 x i32> %{{.*}}, <4 x i32> %{{.*}} return _mm_maskz_set1_epi32(__M, 5); } __m256i test_mm256_mask_set1_epi32(__m256i __O, __mmask8 __M) { // CHECK-LABEL: @test_mm256_mask_set1_epi32 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.d.gpr.256 + // CHECK: insertelement <8 x i32> undef, i32 %{{.*}}, i32 0 + // CHECK: insertelement <8 x i32> %{{.*}}, i32 %{{.*}}, i32 1 + // CHECK: insertelement <8 x i32> %{{.*}}, i32 %{{.*}}, i32 2 + // CHECK: insertelement <8 x i32> %{{.*}}, i32 %{{.*}}, i32 3 + // CHECK: insertelement <8 x i32> %{{.*}}, i32 %{{.*}}, i32 4 + // CHECK: insertelement <8 x i32> %{{.*}}, i32 %{{.*}}, i32 5 + // CHECK: insertelement <8 x i32> %{{.*}}, i32 %{{.*}}, i32 6 + // CHECK: insertelement <8 x i32> %{{.*}}, i32 %{{.*}}, i32 7 + // CHECK: select <8 x i1> %{{.*}}, <8 x i32> %{{.*}}, <8 x i32> %{{.*}} return _mm256_mask_set1_epi32(__O, __M, 5); } __m256i test_mm256_maskz_set1_epi32(__mmask8 __M) { // CHECK-LABEL: @test_mm256_maskz_set1_epi32 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.d.gpr.256 + // CHECK: insertelement <8 x i32> undef, i32 %{{.*}}, i32 0 + // CHECK: insertelement <8 x i32> %{{.*}}, i32 %{{.*}}, i32 1 + // CHECK: insertelement <8 x i32> %{{.*}}, i32 %{{.*}}, i32 2 + // CHECK: insertelement <8 x i32> %{{.*}}, i32 %{{.*}}, i32 3 + // CHECK: insertelement <8 x i32> %{{.*}}, i32 %{{.*}}, i32 4 + // CHECK: insertelement <8 x i32> %{{.*}}, i32 %{{.*}}, i32 5 + // CHECK: insertelement <8 x i32> %{{.*}}, i32 %{{.*}}, i32 6 + // CHECK: insertelement <8 x i32> %{{.*}}, i32 %{{.*}}, i32 7 + // CHECK: select <8 x i1> %{{.*}}, <8 x i32> %{{.*}}, <8 x i32> %{{.*}} return _mm256_maskz_set1_epi32(__M, 5); } #ifdef __x86_64__ __m128i test_mm_mask_set1_epi64(__m128i __O, __mmask8 __M, long long __A) { // CHECK-LABEL: @test_mm_mask_set1_epi64 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.q.gpr.128 + // CHECK: insertelement <16 x i8> undef, i8 %{{.*}}, i32 0 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 1 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 2 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 3 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 4 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 5 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 6 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 7 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 8 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 9 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 10 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 11 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 12 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 13 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 14 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 15 + // CHECK: shufflevector <8 x i1> %{{.*}}, <8 x i1> %{{.*}}, <2 x i32> + // CHECK: select <2 x i1> %{{.*}}, <2 x i64> %{{.*}}, <2 x i64> %{{.*}} return _mm_mask_set1_epi64(__O, __M, __A); } __m128i test_mm_maskz_set1_epi64(__mmask8 __M, long long __A) { // CHECK-LABEL: @test_mm_maskz_set1_epi64 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.q.gpr.128 + // CHECK: insertelement <16 x i8> undef, i8 %{{.*}}, i32 0 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 1 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 2 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 3 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 4 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 5 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 6 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 7 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 8 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 9 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 10 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 11 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 12 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 13 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 14 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 15 + // CHECK: shufflevector <8 x i1> %{{.*}}, <8 x i1> %{{.*}}, <2 x i32> + // CHECK: select <2 x i1> %{{.*}}, <2 x i64> %{{.*}}, <2 x i64> %{{.*}} return _mm_maskz_set1_epi64(__M, __A); } __m256i test_mm256_mask_set1_epi64(__m256i __O, __mmask8 __M, long long __A) { // CHECK-LABEL: @test_mm256_mask_set1_epi64 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.q.gpr.256 + // CHECK: insertelement <4 x i64> undef, i64 %{{.*}}, i32 0 + // CHECK: insertelement <4 x i64> %{{.*}}, i64 %{{.*}}, i32 1 + // CHECK: insertelement <4 x i64> %{{.*}}, i64 %{{.*}}, i32 2 + // CHECK: insertelement <4 x i64> %{{.*}}, i64 %{{.*}}, i32 3 + // CHECK: shufflevector <8 x i1> %{{.*}}, <8 x i1> %{{.*}}, <4 x i32> + // CHECK: select <4 x i1> %{{.*}}, <4 x i64> %{{.*}}, <4 x i64> %{{.*}} return _mm256_mask_set1_epi64(__O, __M, __A); } __m256i test_mm256_maskz_set1_epi64(__mmask8 __M, long long __A) { // CHECK-LABEL: @test_mm256_maskz_set1_epi64 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.q.gpr.256 + // CHECK: insertelement <4 x i64> undef, i64 %{{.*}}, i32 0 + // CHECK: insertelement <4 x i64> %{{.*}}, i64 %{{.*}}, i32 1 + // CHECK: insertelement <4 x i64> %{{.*}}, i64 %{{.*}}, i32 2 + // CHECK: insertelement <4 x i64> %{{.*}}, i64 %{{.*}}, i32 3 + // CHECK: shufflevector <8 x i1> %{{.*}}, <8 x i1> %{{.*}}, <4 x i32> + // CHECK: select <4 x i1> %{{.*}}, <4 x i64> %{{.*}}, <4 x i64> %{{.*}} return _mm256_maskz_set1_epi64(__M, __A); } #endif diff --git a/test/CodeGen/avx512vlbw-builtins.c b/test/CodeGen/avx512vlbw-builtins.c index 11c583a241..ff34d8feed 100644 --- a/test/CodeGen/avx512vlbw-builtins.c +++ b/test/CodeGen/avx512vlbw-builtins.c @@ -2670,28 +2670,195 @@ __m256i test_mm256_maskz_broadcastw_epi16(__mmask16 __M, __m128i __A) { // CHECK: select <16 x i1> %{{.*}}, <16 x i16> %{{.*}}, <16 x i16> %{{.*}} return _mm256_maskz_broadcastw_epi16(__M, __A); } +__m128i test_mm_mask_set1_epi8 (__m128i __O, __mmask16 __M, char __A){ + // CHECK-LABEL: @test_mm_mask_set1_epi8 + // CHECK: insertelement <16 x i8> undef, i8 %{{.*}}, i32 0 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 1 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 2 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 3 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 4 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 5 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 6 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 7 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 8 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 9 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 10 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 11 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 12 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 13 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 14 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 15 + // CHECK: select <16 x i1> %{{.*}}, <16 x i8> %{{.*}}, <16 x i8> %{{.*}} + return _mm_mask_set1_epi8(__O, __M, __A); +} +__m128i test_mm_maskz_set1_epi8 ( __mmask16 __M, char __A){ + // CHECK-LABEL: @test_mm_maskz_set1_epi8 + // CHECK: insertelement <16 x i8> undef, i8 %{{.*}}, i32 0 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 1 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 2 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 3 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 4 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 5 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 6 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 7 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 8 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 9 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 10 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 11 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 12 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 13 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 14 + // CHECK: insertelement <16 x i8> %{{.*}}, i8 %{{.*}}, i32 15 + // CHECK: select <16 x i1> %{{.*}}, <16 x i8> %{{.*}}, <16 x i8> %{{.*}} + return _mm_maskz_set1_epi8( __M, __A); +} + +__m256i test_mm256_mask_set1_epi8(__m256i __O, __mmask32 __M, char __A) { + // CHECK-LABEL: @test_mm256_mask_set1_epi8 + // CHECK: insertelement <32 x i8> undef, i8 %{{.*}}, i32 0 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 1 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 2 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 3 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 4 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 5 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 6 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 7 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 8 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 9 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 10 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 11 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 12 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 13 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 14 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 15 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 16 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 17 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 18 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 19 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 20 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 21 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 22 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 23 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 24 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 25 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 26 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 27 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 28 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 29 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 30 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 31 + // CHECK: select <32 x i1> %{{.*}}, <32 x i8> %{{.*}}, <32 x i8> %{{.*}} + return _mm256_mask_set1_epi8(__O, __M, __A); +} + +__m256i test_mm256_maskz_set1_epi8( __mmask32 __M, char __A) { + // CHECK-LABEL: @test_mm256_maskz_set1_epi8 + // CHECK: insertelement <32 x i8> undef, i8 %{{.*}}, i32 0 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 1 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 2 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 3 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 4 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 5 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 6 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 7 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 8 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 9 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 10 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 11 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 12 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 13 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 14 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 15 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 16 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 17 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 18 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 19 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 20 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 21 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 22 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 23 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 24 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 25 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 26 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 27 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 28 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 29 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 30 + // CHECK: insertelement <32 x i8> %{{.*}}, i8 %{{.*}}, i32 31 + // CHECK: select <32 x i1> %{{.*}}, <32 x i8> %{{.*}}, <32 x i8> %{{.*}} + return _mm256_maskz_set1_epi8( __M, __A); +} + __m256i test_mm256_mask_set1_epi16(__m256i __O, __mmask16 __M, short __A) { // CHECK-LABEL: @test_mm256_mask_set1_epi16 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.w.gpr.256 + // CHECK: insertelement <16 x i16> undef, i16 %{{.*}}, i32 0 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 1 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 2 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 3 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 4 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 5 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 6 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 7 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 8 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 9 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 10 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 11 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 12 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 13 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 14 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 15 + // CHECK: select <16 x i1> %{{.*}}, <16 x i16> %{{.*}}, <16 x i16> %{{.*}} return _mm256_mask_set1_epi16(__O, __M, __A); } __m256i test_mm256_maskz_set1_epi16(__mmask16 __M, short __A) { // CHECK-LABEL: @test_mm256_maskz_set1_epi16 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.w.gpr.256 + // CHECK: insertelement <16 x i16> undef, i16 %{{.*}}, i32 0 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 1 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 2 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 3 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 4 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 5 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 6 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 7 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 8 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 9 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 10 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 11 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 12 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 13 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 14 + // CHECK: insertelement <16 x i16> %{{.*}}, i16 %{{.*}}, i32 15 + // CHECK: select <16 x i1> %{{.*}}, <16 x i16> %{{.*}}, <16 x i16> %{{.*}} return _mm256_maskz_set1_epi16(__M, __A); } __m128i test_mm_mask_set1_epi16(__m128i __O, __mmask8 __M, short __A) { // CHECK-LABEL: @test_mm_mask_set1_epi16 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.w.gpr.128 + // CHECK: insertelement <8 x i16> undef, i16 %{{.*}}, i32 0 + // CHECK: insertelement <8 x i16> %{{.*}}, i16 %{{.*}}, i32 1 + // CHECK: insertelement <8 x i16> %{{.*}}, i16 %{{.*}}, i32 2 + // CHECK: insertelement <8 x i16> %{{.*}}, i16 %{{.*}}, i32 3 + // CHECK: insertelement <8 x i16> %{{.*}}, i16 %{{.*}}, i32 4 + // CHECK: insertelement <8 x i16> %{{.*}}, i16 %{{.*}}, i32 5 + // CHECK: insertelement <8 x i16> %{{.*}}, i16 %{{.*}}, i32 6 + // CHECK: insertelement <8 x i16> %{{.*}}, i16 %{{.*}}, i32 7 + // CHECK: select <8 x i1> %{{.*}}, <8 x i16> %{{.*}}, <8 x i16> %{{.*}} return _mm_mask_set1_epi16(__O, __M, __A); } __m128i test_mm_maskz_set1_epi16(__mmask8 __M, short __A) { // CHECK-LABEL: @test_mm_maskz_set1_epi16 - // CHECK: @llvm.x86.avx512.mask.pbroadcast.w.gpr.128 + // CHECK: insertelement <8 x i16> undef, i16 %{{.*}}, i32 0 + // CHECK: insertelement <8 x i16> %{{.*}}, i16 %{{.*}}, i32 1 + // CHECK: insertelement <8 x i16> %{{.*}}, i16 %{{.*}}, i32 2 + // CHECK: insertelement <8 x i16> %{{.*}}, i16 %{{.*}}, i32 3 + // CHECK: insertelement <8 x i16> %{{.*}}, i16 %{{.*}}, i32 4 + // CHECK: insertelement <8 x i16> %{{.*}}, i16 %{{.*}}, i32 5 + // CHECK: insertelement <8 x i16> %{{.*}}, i16 %{{.*}}, i32 6 + // CHECK: insertelement <8 x i16> %{{.*}}, i16 %{{.*}}, i32 7 + // CHECK: select <8 x i1> %{{.*}}, <8 x i16> %{{.*}}, <8 x i16> %{{.*}} return _mm_maskz_set1_epi16(__M, __A); } __m128i test_mm_permutexvar_epi16(__m128i __A, __m128i __B) { -- 2.40.0