From dc822a5aa937369640ded93a717ed744d903677c Mon Sep 17 00:00:00 2001 From: Asaf Badouh Date: Thu, 17 Sep 2015 13:09:33 +0000 Subject: [PATCH] revert r.247881 due to tests failures git-svn-id: https://llvm.org/svn/llvm-project/cfe/trunk@247883 91177308-0d34-0410-b5e6-96231b3b80d8 --- include/clang/Basic/BuiltinsX86.def | 19 +- lib/Headers/avx512dqintrin.h | 536 -------------------------- test/CodeGen/avx512dq-builtins.c | 577 ---------------------------- 3 files changed, 3 insertions(+), 1129 deletions(-) diff --git a/include/clang/Basic/BuiltinsX86.def b/include/clang/Basic/BuiltinsX86.def index 73e146e8aa..b006892186 100644 --- a/include/clang/Basic/BuiltinsX86.def +++ b/include/clang/Basic/BuiltinsX86.def @@ -1469,6 +1469,7 @@ TARGET_BUILTIN(__builtin_ia32_vpermt2varq128_mask, "V2LLiV2LLiV2LLiV2LLiUc", "", TARGET_BUILTIN(__builtin_ia32_vpermt2varq128_maskz, "V2LLiV2LLiV2LLiV2LLiUc", "", "avx512vl") TARGET_BUILTIN(__builtin_ia32_vpermt2varq256_mask, "V4LLiV4LLiV4LLiV4LLiUc", "", "avx512vl") TARGET_BUILTIN(__builtin_ia32_vpermt2varq256_maskz, "V4LLiV4LLiV4LLiV4LLiUc", "", "avx512vl") + TARGET_BUILTIN(__builtin_ia32_pmovswb512_mask, "V32cV32sV32cUi", "", "avx512bw") TARGET_BUILTIN(__builtin_ia32_pmovuswb512_mask, "V32cV32sV32cUi", "", "avx512bw") TARGET_BUILTIN(__builtin_ia32_pmovwb512_mask, "V32cV32sV32cUi", "", "avx512bw") @@ -1476,6 +1477,7 @@ TARGET_BUILTIN(__builtin_ia32_punpckhbw512_mask, "V64cV64cV64cV64cULLi", "", "av TARGET_BUILTIN(__builtin_ia32_punpckhwd512_mask, "V32sV32sV32sV32sUi", "", "avx512bw") TARGET_BUILTIN(__builtin_ia32_punpcklbw512_mask, "V64cV64cV64cV64cULLi", "", "avx512bw") TARGET_BUILTIN(__builtin_ia32_punpcklwd512_mask, "V32sV32sV32sV32sUi", "", "avx512bw") + TARGET_BUILTIN(__builtin_ia32_cvtpd2qq128_mask, "V2LLiV2dV2LLiUc", "", "avx512vl,avx512dq") TARGET_BUILTIN(__builtin_ia32_cvtpd2qq256_mask, "V4LLiV4dV4LLiUc", "", "avx512vl,avx512dq") TARGET_BUILTIN(__builtin_ia32_cvtpd2uqq128_mask, "V2LLiV2dV2LLiUc", "", "avx512vl,avx512dq") @@ -1508,6 +1510,7 @@ TARGET_BUILTIN(__builtin_ia32_reducepd128_mask, "V2dV2dIiV2dUc", "", "avx512vl,a TARGET_BUILTIN(__builtin_ia32_reducepd256_mask, "V4dV4dIiV4dUc", "", "avx512vl,avx512dq") TARGET_BUILTIN(__builtin_ia32_reduceps128_mask, "V4fV4fIiV4fUc", "", "avx512vl,avx512dq") TARGET_BUILTIN(__builtin_ia32_reduceps256_mask, "V8fV8fIiV8fUc", "", "avx512vl,avx512dq") + TARGET_BUILTIN(__builtin_ia32_pmaddubsw128_mask, "V8sV16cV16cV8sUc", "", "avx512vl,avx512bw") TARGET_BUILTIN(__builtin_ia32_pmaddubsw256_mask, "V16sV32cV32cV16sUs", "", "avx512vl,avx512bw") TARGET_BUILTIN(__builtin_ia32_pmaddwd128_mask, "V4iV8sV8sV4iUc", "", "avx512vl,avx512bw") @@ -1532,22 +1535,6 @@ TARGET_BUILTIN(__builtin_ia32_punpcklbw128_mask, "V16cV16cV16cV16cUs", "", "avx5 TARGET_BUILTIN(__builtin_ia32_punpcklbw256_mask, "V32cV32cV32cV32cUi", "", "avx512vl,avx512bw") TARGET_BUILTIN(__builtin_ia32_punpcklwd128_mask, "V8sV8sV8sV8sUc", "", "avx512vl,avx512bw") TARGET_BUILTIN(__builtin_ia32_punpcklwd256_mask, "V16sV16sV16sV16sUs", "", "avx512vl,avx512bw") -BUILTIN(__builtin_ia32_cvtpd2qq512_mask, "V8LLiV8dV8LLiUcIi", "") -BUILTIN(__builtin_ia32_cvtpd2uqq512_mask, "V8LLiV8dV8LLiUcIi", "") -BUILTIN(__builtin_ia32_cvtps2qq512_mask, "V8LLiV8fV8LLiUcIi", "") -BUILTIN(__builtin_ia32_cvtps2uqq512_mask, "V8LLiV8fV8LLiUcIi", "") -BUILTIN(__builtin_ia32_cvtqq2pd512_mask, "V8dV8LLiV8dUcIi", "") -BUILTIN(__builtin_ia32_cvtqq2ps512_mask, "V8fV8LLiV8fUcIi", "") -BUILTIN(__builtin_ia32_cvttpd2qq512_mask, "V8LLiV8dV8LLiUcIi", "") -BUILTIN(__builtin_ia32_cvttpd2uqq512_mask, "V8LLiV8dV8LLiUcIi", "") -BUILTIN(__builtin_ia32_cvttps2qq512_mask, "V8LLiV8fV8LLiUcIi", "") -BUILTIN(__builtin_ia32_cvttps2uqq512_mask, "V8LLiV8fV8LLiUcIi", "") -BUILTIN(__builtin_ia32_cvtuqq2pd512_mask, "V8dV8LLiV8dUcIi", "") -BUILTIN(__builtin_ia32_cvtuqq2ps512_mask, "V8fV8LLiV8fUcIi", "") -BUILTIN(__builtin_ia32_rangepd512_mask, "V8dV8dV8dIiV8dUcIi", "") -BUILTIN(__builtin_ia32_rangeps512_mask, "V16fV16fV16fIiV16fUsIi", "") -BUILTIN(__builtin_ia32_reducepd512_mask, "V8dV8dIiV8dUcIi", "") -BUILTIN(__builtin_ia32_reduceps512_mask, "V16fV16fIiV16fUsIi", "") #undef BUILTIN #undef TARGET_BUILTIN diff --git a/lib/Headers/avx512dqintrin.h b/lib/Headers/avx512dqintrin.h index afee4903ba..8a69f7ffbf 100644 --- a/lib/Headers/avx512dqintrin.h +++ b/lib/Headers/avx512dqintrin.h @@ -237,542 +237,6 @@ _mm512_maskz_andnot_ps (__mmask16 __U, __m512 __A, __m512 __B) { (__mmask16) __U); } -static __inline__ __m512i __DEFAULT_FN_ATTRS -_mm512_cvtpd_epi64 (__m512d __A) { - return (__m512i) __builtin_ia32_cvtpd2qq512_mask ((__v8df) __A, - (__v8di) _mm512_setzero_si512(), - (__mmask8) -1, - _MM_FROUND_CUR_DIRECTION); -} - -static __inline__ __m512i __DEFAULT_FN_ATTRS -_mm512_mask_cvtpd_epi64 (__m512i __W, __mmask8 __U, __m512d __A) { - return (__m512i) __builtin_ia32_cvtpd2qq512_mask ((__v8df) __A, - (__v8di) __W, - (__mmask8) __U, - _MM_FROUND_CUR_DIRECTION); -} - -static __inline__ __m512i __DEFAULT_FN_ATTRS -_mm512_maskz_cvtpd_epi64 (__mmask8 __U, __m512d __A) { - return (__m512i) __builtin_ia32_cvtpd2qq512_mask ((__v8df) __A, - (__v8di) _mm512_setzero_si512(), - (__mmask8) __U, - _MM_FROUND_CUR_DIRECTION); -} - -#define _mm512_cvt_roundpd_epi64(__A, __R) __extension__ ({ \ - (__m512i) __builtin_ia32_cvtpd2qq512_mask ((__v8df) __A, \ - (__v8di) _mm512_setzero_si512(), (__mmask8) -1, __R);}) - -#define _mm512_mask_cvt_roundpd_epi64(__W, __U, __A, __R) __extension__ ({ \ - (__m512i) __builtin_ia32_cvtpd2qq512_mask ((__v8df) __A, \ - (__v8di) __W, (__mmask8) __U, __R);}) - -#define _mm512_maskz_cvt_roundpd_epi64(__U, __A, __R) __extension__ ({ \ - (__m512i) __builtin_ia32_cvtpd2qq512_mask ((__v8df) __A, \ - (__v8di) _mm512_setzero_si512(), (__mmask8) __U, __R); }) - -static __inline__ __m512i __DEFAULT_FN_ATTRS -_mm512_cvtpd_epu64 (__m512d __A) { - return (__m512i) __builtin_ia32_cvtpd2uqq512_mask ((__v8df) __A, - (__v8di) _mm512_setzero_si512(), - (__mmask8) -1, - _MM_FROUND_CUR_DIRECTION); -} - -static __inline__ __m512i __DEFAULT_FN_ATTRS -_mm512_mask_cvtpd_epu64 (__m512i __W, __mmask8 __U, __m512d __A) { - return (__m512i) __builtin_ia32_cvtpd2uqq512_mask ((__v8df) __A, - (__v8di) __W, - (__mmask8) __U, - _MM_FROUND_CUR_DIRECTION); -} - -static __inline__ __m512i __DEFAULT_FN_ATTRS -_mm512_maskz_cvtpd_epu64 (__mmask8 __U, __m512d __A) { - return (__m512i) __builtin_ia32_cvtpd2uqq512_mask ((__v8df) __A, - (__v8di) _mm512_setzero_si512(), - (__mmask8) __U, - _MM_FROUND_CUR_DIRECTION); -} - -#define _mm512_cvt_roundpd_epu64(__A, __R) __extension__ ({ \ - (__m512i) __builtin_ia32_cvtpd2uqq512_mask ((__v8df) __A, \ - (__v8di) _mm512_setzero_si512(), (__mmask8) -1, __R);}) - -#define _mm512_mask_cvt_roundpd_epu64(__W, __U, __A, __R) __extension__ ({ \ - (__m512i) __builtin_ia32_cvtpd2uqq512_mask ((__v8df) __A, \ - (__v8di) __W, (__mmask8) __U, __R);}) - -#define _mm512_maskz_cvt_roundpd_epu64(__U, __A, __R) __extension__ ({ \ - (__m512i) __builtin_ia32_cvtpd2uqq512_mask ((__v8df) __A, \ - (__v8di) _mm512_setzero_si512(), (__mmask8) __U, __R);}) - -static __inline__ __m512i __DEFAULT_FN_ATTRS -_mm512_cvtps_epi64 (__m256 __A) { - return (__m512i) __builtin_ia32_cvtps2qq512_mask ((__v8sf) __A, - (__v8di) _mm512_setzero_si512(), - (__mmask8) -1, - _MM_FROUND_CUR_DIRECTION); -} - -static __inline__ __m512i __DEFAULT_FN_ATTRS -_mm512_mask_cvtps_epi64 (__m512i __W, __mmask8 __U, __m256 __A) { - return (__m512i) __builtin_ia32_cvtps2qq512_mask ((__v8sf) __A, - (__v8di) __W, - (__mmask8) __U, - _MM_FROUND_CUR_DIRECTION); -} - -static __inline__ __m512i __DEFAULT_FN_ATTRS -_mm512_maskz_cvtps_epi64 (__mmask8 __U, __m256 __A) { - return (__m512i) __builtin_ia32_cvtps2qq512_mask ((__v8sf) __A, - (__v8di) _mm512_setzero_si512(), - (__mmask8) __U, - _MM_FROUND_CUR_DIRECTION); -} - -#define _mm512_cvt_roundps_epi64(__A, __R) __extension__ ({ \ - (__m512i) __builtin_ia32_cvtps2qq512_mask ((__v8sf) __A, \ - (__v8di) _mm512_setzero_si512(), (__mmask8) -1, __R);}) - -#define _mm512_mask_cvt_roundps_epi64(__W, __U, __A, __R) __extension__ ({ \ - (__m512i) __builtin_ia32_cvtps2qq512_mask ((__v8sf) __A, \ - (__v8di) __W, (__mmask8) __U, __R);}) - -#define _mm512_maskz_cvt_roundps_epi64(__U, __A, __R) __extension__ ({ \ - (__m512i) __builtin_ia32_cvtps2qq512_mask ((__v8sf) __A, \ - (__v8di) _mm512_setzero_si512(), (__mmask8) __U, __R);}) - -static __inline__ __m512i __DEFAULT_FN_ATTRS -_mm512_cvtps_epu64 (__m256 __A) { - return (__m512i) __builtin_ia32_cvtps2uqq512_mask ((__v8sf) __A, - (__v8di) _mm512_setzero_si512(), - (__mmask8) -1, - _MM_FROUND_CUR_DIRECTION); -} - -static __inline__ __m512i __DEFAULT_FN_ATTRS -_mm512_mask_cvtps_epu64 (__m512i __W, __mmask8 __U, __m256 __A) { - return (__m512i) __builtin_ia32_cvtps2uqq512_mask ((__v8sf) __A, - (__v8di) __W, - (__mmask8) __U, - _MM_FROUND_CUR_DIRECTION); -} - -static __inline__ __m512i __DEFAULT_FN_ATTRS -_mm512_maskz_cvtps_epu64 (__mmask8 __U, __m256 __A) { - return (__m512i) __builtin_ia32_cvtps2uqq512_mask ((__v8sf) __A, - (__v8di) _mm512_setzero_si512(), - (__mmask8) __U, - _MM_FROUND_CUR_DIRECTION); -} - -#define _mm512_cvt_roundps_epu64(__A, __R) __extension__ ({ \ - (__m512i) __builtin_ia32_cvtps2uqq512_mask ((__v8sf) __A, \ - (__v8di) _mm512_setzero_si512(), (__mmask8) -1, __R);}) - -#define _mm512_mask_cvt_roundps_epu64(__W, __U, __A, __R) __extension__ ({ \ - (__m512i) __builtin_ia32_cvtps2uqq512_mask ((__v8sf) __A, \ - (__v8di) __W, (__mmask8) __U, __R);}) - -#define _mm512_maskz_cvt_roundps_epu64(__U, __A, __R) __extension__ ({ \ - (__m512i) __builtin_ia32_cvtps2uqq512_mask ((__v8sf) __A, \ - (__v8di) _mm512_setzero_si512(), (__mmask8) __U, __R);}) - - -static __inline__ __m512d __DEFAULT_FN_ATTRS -_mm512_cvtepi64_pd (__m512i __A) { - return (__m512d) __builtin_ia32_cvtqq2pd512_mask ((__v8di) __A, - (__v8df) _mm512_setzero_pd(), - (__mmask8) -1, - _MM_FROUND_CUR_DIRECTION); -} - -static __inline__ __m512d __DEFAULT_FN_ATTRS -_mm512_mask_cvtepi64_pd (__m512d __W, __mmask8 __U, __m512i __A) { - return (__m512d) __builtin_ia32_cvtqq2pd512_mask ((__v8di) __A, - (__v8df) __W, - (__mmask8) __U, - _MM_FROUND_CUR_DIRECTION); -} - -static __inline__ __m512d __DEFAULT_FN_ATTRS -_mm512_maskz_cvtepi64_pd (__mmask8 __U, __m512i __A) { - return (__m512d) __builtin_ia32_cvtqq2pd512_mask ((__v8di) __A, - (__v8df) _mm512_setzero_pd(), - (__mmask8) __U, - _MM_FROUND_CUR_DIRECTION); -} - -#define _mm512_cvt_roundepi64_pd(__A, __R) __extension__ ({ \ - (__m512d) __builtin_ia32_cvtqq2pd512_mask ((__v8di) __A, \ - (__v8df) _mm512_setzero_pd(), (__mmask8) -1, __R);}) - -#define _mm512_mask_cvt_roundepi64_pd(__W, __U, __A, __R) __extension__ ({ \ - (__m512d) __builtin_ia32_cvtqq2pd512_mask ((__v8di) __A, \ - (__v8df) __W, (__mmask8) __U, __R);}) - -#define _mm512_maskz_cvt_roundepi64_pd(__U, __A, __R) __extension__ ({ \ - (__m512d) __builtin_ia32_cvtqq2pd512_mask ((__v8di) __A, \ - (__v8df) _mm512_setzero_pd(), (__mmask8) __U, __R);}) - -static __inline__ __m256 __DEFAULT_FN_ATTRS -_mm512_cvtepi64_ps (__m512i __A) { - return (__m256) __builtin_ia32_cvtqq2ps512_mask ((__v8di) __A, - (__v8sf) _mm256_setzero_ps(), - (__mmask8) -1, - _MM_FROUND_CUR_DIRECTION); -} - -static __inline__ __m256 __DEFAULT_FN_ATTRS -_mm512_mask_cvtepi64_ps (__m256 __W, __mmask8 __U, __m512i __A) { - return (__m256) __builtin_ia32_cvtqq2ps512_mask ((__v8di) __A, - (__v8sf) __W, - (__mmask8) __U, - _MM_FROUND_CUR_DIRECTION); -} - -static __inline__ __m256 __DEFAULT_FN_ATTRS -_mm512_maskz_cvtepi64_ps (__mmask8 __U, __m512i __A) { - return (__m256) __builtin_ia32_cvtqq2ps512_mask ((__v8di) __A, - (__v8sf) _mm256_setzero_ps(), - (__mmask8) __U, - _MM_FROUND_CUR_DIRECTION); -} - -#define _mm512_cvt_roundepi64_ps(__A, __R) __extension__ ({ \ - (__m256) __builtin_ia32_cvtqq2ps512_mask ((__v8di) __A, \ - (__v8sf) _mm256_setzero_ps(), (__mmask8) -1, __R);}) - -#define _mm512_mask_cvt_roundepi64_ps(__W, __U, __A, __R) __extension__ ({ \ - (__m256) __builtin_ia32_cvtqq2ps512_mask ((__v8di) __A, \ - (__v8sf) __W, (__mmask8) __U, __R);}) - -#define _mm512_maskz_cvt_roundepi64_ps(__U, __A, __R) __extension__ ({ \ - (__m256) __builtin_ia32_cvtqq2ps512_mask ((__v8di) __A, \ - (__v8sf) _mm256_setzero_ps(), (__mmask8) __U, __R);}) - - -static __inline__ __m512i __DEFAULT_FN_ATTRS -_mm512_cvttpd_epi64 (__m512d __A) { - return (__m512i) __builtin_ia32_cvttpd2qq512_mask ((__v8df) __A, - (__v8di) _mm512_setzero_si512(), - (__mmask8) -1, - _MM_FROUND_CUR_DIRECTION); -} - -static __inline__ __m512i __DEFAULT_FN_ATTRS -_mm512_mask_cvttpd_epi64 (__m512i __W, __mmask8 __U, __m512d __A) { - return (__m512i) __builtin_ia32_cvttpd2qq512_mask ((__v8df) __A, - (__v8di) __W, - (__mmask8) __U, - _MM_FROUND_CUR_DIRECTION); -} - -static __inline__ __m512i __DEFAULT_FN_ATTRS -_mm512_maskz_cvttpd_epi64 (__mmask8 __U, __m512d __A) { - return (__m512i) __builtin_ia32_cvttpd2qq512_mask ((__v8df) __A, - (__v8di) _mm512_setzero_si512(), - (__mmask8) __U, - _MM_FROUND_CUR_DIRECTION); -} - -#define _mm512_cvtt_roundpd_epi64(__A, __R) __extension__ ({ \ - (__m512i) __builtin_ia32_cvttpd2qq512_mask ((__v8df) __A, \ - (__v8di) _mm512_setzero_si512(), (__mmask8) -1, __R);}) - -#define _mm512_mask_cvtt_roundpd_epi64(__W, __U, __A, __R) __extension__ ({ \ - (__m512i) __builtin_ia32_cvttpd2qq512_mask ((__v8df) __A, \ - (__v8di) __W, (__mmask8) __U, __R);}) - -#define _mm512_maskz_cvtt_roundpd_epi64(__U, __A, __R) __extension__ ({ \ - (__m512i) __builtin_ia32_cvttpd2qq512_mask ((__v8df) __A, \ - (__v8di) _mm512_setzero_si512(), (__mmask8) __U, __R);}) - -static __inline__ __m512i __DEFAULT_FN_ATTRS -_mm512_cvttpd_epu64 (__m512d __A) { - return (__m512i) __builtin_ia32_cvttpd2uqq512_mask ((__v8df) __A, - (__v8di) _mm512_setzero_si512(), - (__mmask8) -1, - _MM_FROUND_CUR_DIRECTION); -} - -static __inline__ __m512i __DEFAULT_FN_ATTRS -_mm512_mask_cvttpd_epu64 (__m512i __W, __mmask8 __U, __m512d __A) { - return (__m512i) __builtin_ia32_cvttpd2uqq512_mask ((__v8df) __A, - (__v8di) __W, - (__mmask8) __U, - _MM_FROUND_CUR_DIRECTION); -} - -static __inline__ __m512i __DEFAULT_FN_ATTRS -_mm512_maskz_cvttpd_epu64 (__mmask8 __U, __m512d __A) { - return (__m512i) __builtin_ia32_cvttpd2uqq512_mask ((__v8df) __A, - (__v8di) _mm512_setzero_si512(), - (__mmask8) __U, - _MM_FROUND_CUR_DIRECTION); -} - -#define _mm512_cvtt_roundpd_epu64(__A, __R) __extension__ ({ \ - (__m512i) __builtin_ia32_cvttpd2uqq512_mask ((__v8df) __A, \ - (__v8di) _mm512_setzero_si512(), (__mmask8) -1, __R);}) - -#define _mm512_mask_cvtt_roundpd_epu64(__W, __U, __A, __R) __extension__ ({ \ - (__m512i) __builtin_ia32_cvttpd2uqq512_mask ((__v8df) __A, \ - (__v8di) __W, (__mmask8) __U, __R);}) - -#define _mm512_maskz_cvtt_roundpd_epu64(__U, __A, __R) __extension__ ({ \ - (__m512i) __builtin_ia32_cvttpd2uqq512_mask ((__v8df) __A, \ - (__v8di) _mm512_setzero_si512(), (__mmask8) __U, __R);}) - -static __inline__ __m512i __DEFAULT_FN_ATTRS -_mm512_cvttps_epi64 (__m256 __A) { - return (__m512i) __builtin_ia32_cvttps2qq512_mask ((__v8sf) __A, - (__v8di) _mm512_setzero_si512(), - (__mmask8) -1, - _MM_FROUND_CUR_DIRECTION); -} - -static __inline__ __m512i __DEFAULT_FN_ATTRS -_mm512_mask_cvttps_epi64 (__m512i __W, __mmask8 __U, __m256 __A) { - return (__m512i) __builtin_ia32_cvttps2qq512_mask ((__v8sf) __A, - (__v8di) __W, - (__mmask8) __U, - _MM_FROUND_CUR_DIRECTION); -} - -static __inline__ __m512i __DEFAULT_FN_ATTRS -_mm512_maskz_cvttps_epi64 (__mmask8 __U, __m256 __A) { - return (__m512i) __builtin_ia32_cvttps2qq512_mask ((__v8sf) __A, - (__v8di) _mm512_setzero_si512(), - (__mmask8) __U, - _MM_FROUND_CUR_DIRECTION); -} - -#define _mm512_cvtt_roundps_epi64(__A, __R) __extension__ ({ \ - (__m512i) __builtin_ia32_cvttps2qq512_mask ((__v8sf) __A, \ - (__v8di) _mm512_setzero_si512(), (__mmask8) -1, __R);}) - -#define _mm512_mask_cvtt_roundps_epi64(__W, __U, __A, __R) __extension__ ({ \ - (__m512i) __builtin_ia32_cvttps2qq512_mask ((__v8sf) __A, \ - (__v8di) __W, (__mmask8) __U, __R);}) - -#define _mm512_maskz_cvtt_roundps_epi64(__U, __A, __R) __extension__ ({ \ - (__m512i) __builtin_ia32_cvttps2qq512_mask ((__v8sf) __A, \ - (__v8di) _mm512_setzero_si512(), (__mmask8) __U, __R);}) - -static __inline__ __m512i __DEFAULT_FN_ATTRS -_mm512_cvttps_epu64 (__m256 __A) { - return (__m512i) __builtin_ia32_cvttps2uqq512_mask ((__v8sf) __A, - (__v8di) _mm512_setzero_si512(), - (__mmask8) -1, - _MM_FROUND_CUR_DIRECTION); -} - -static __inline__ __m512i __DEFAULT_FN_ATTRS -_mm512_mask_cvttps_epu64 (__m512i __W, __mmask8 __U, __m256 __A) { - return (__m512i) __builtin_ia32_cvttps2uqq512_mask ((__v8sf) __A, - (__v8di) __W, - (__mmask8) __U, - _MM_FROUND_CUR_DIRECTION); -} - -static __inline__ __m512i __DEFAULT_FN_ATTRS -_mm512_maskz_cvttps_epu64 (__mmask8 __U, __m256 __A) { - return (__m512i) __builtin_ia32_cvttps2uqq512_mask ((__v8sf) __A, - (__v8di) _mm512_setzero_si512(), - (__mmask8) __U, - _MM_FROUND_CUR_DIRECTION); -} - -#define _mm512_cvtt_roundps_epu64(__A, __R) __extension__ ({ \ - (__m512i) __builtin_ia32_cvttps2uqq512_mask ((__v8sf) __A, \ - (__v8di) _mm512_setzero_si512(),(__mmask8) -1, __R);}) - -#define _mm512_mask_cvtt_roundps_epu64(__W, __U, __A, __R) __extension__ ({ \ - (__m512i) __builtin_ia32_cvttps2uqq512_mask ((__v8sf) __A, \ - (__v8di) __W, (__mmask8) __U, __R);}) - -#define _mm512_maskz_cvtt_roundps_epu64(__U, __A, __R) __extension__ ({ \ - (__m512i) __builtin_ia32_cvttps2uqq512_mask ((__v8sf) __A, \ - (__v8di) _mm512_setzero_si512(), (__mmask8) __U, __R);}) - -static __inline__ __m512d __DEFAULT_FN_ATTRS -_mm512_cvtepu64_pd (__m512i __A) { - return (__m512d) __builtin_ia32_cvtuqq2pd512_mask ((__v8di) __A, - (__v8df) _mm512_setzero_pd(), - (__mmask8) -1, - _MM_FROUND_CUR_DIRECTION); -} - -static __inline__ __m512d __DEFAULT_FN_ATTRS -_mm512_mask_cvtepu64_pd (__m512d __W, __mmask8 __U, __m512i __A) { - return (__m512d) __builtin_ia32_cvtuqq2pd512_mask ((__v8di) __A, - (__v8df) __W, - (__mmask8) __U, - _MM_FROUND_CUR_DIRECTION); -} - -static __inline__ __m512d __DEFAULT_FN_ATTRS -_mm512_maskz_cvtepu64_pd (__mmask8 __U, __m512i __A) { - return (__m512d) __builtin_ia32_cvtuqq2pd512_mask ((__v8di) __A, - (__v8df) _mm512_setzero_pd(), - (__mmask8) __U, - _MM_FROUND_CUR_DIRECTION); -} - -#define _mm512_cvt_roundepu64_pd(__A, __R) __extension__ ({ \ - (__m512d) __builtin_ia32_cvtuqq2pd512_mask ((__v8di) __A, \ - (__v8df) _mm512_setzero_pd(), (__mmask8) -1, __R);}) - -#define _mm512_mask_cvt_roundepu64_pd(__W, __U, __A, __R) __extension__ ({ \ - (__m512d) __builtin_ia32_cvtuqq2pd512_mask ((__v8di) __A, \ - (__v8df) __W, (__mmask8) __U, __R);}) - - -#define _mm512_maskz_cvt_roundepu64_pd(__U, __A, __R) __extension__ ({ \ - (__m512d) __builtin_ia32_cvtuqq2pd512_mask ((__v8di) __A, \ - (__v8df) _mm512_setzero_pd(), (__mmask8) __U, __R);}) - - -static __inline__ __m256 __DEFAULT_FN_ATTRS -_mm512_cvtepu64_ps (__m512i __A) { - return (__m256) __builtin_ia32_cvtuqq2ps512_mask ((__v8di) __A, - (__v8sf) _mm256_setzero_ps(), - (__mmask8) -1, - _MM_FROUND_CUR_DIRECTION); -} - -static __inline__ __m256 __DEFAULT_FN_ATTRS -_mm512_mask_cvtepu64_ps (__m256 __W, __mmask8 __U, __m512i __A) { - return (__m256) __builtin_ia32_cvtuqq2ps512_mask ((__v8di) __A, - (__v8sf) __W, - (__mmask8) __U, - _MM_FROUND_CUR_DIRECTION); -} - -static __inline__ __m256 __DEFAULT_FN_ATTRS -_mm512_maskz_cvtepu64_ps (__mmask8 __U, __m512i __A) { - return (__m256) __builtin_ia32_cvtuqq2ps512_mask ((__v8di) __A, - (__v8sf) _mm256_setzero_ps(), - (__mmask8) __U, - _MM_FROUND_CUR_DIRECTION); -} - -#define _mm512_cvt_roundepu64_ps(__A, __R) __extension__ ({ \ - (__m256) __builtin_ia32_cvtuqq2ps512_mask ((__v8di) __A, \ - (__v8sf) _mm256_setzero_ps(), (__mmask8) -1, __R);}) - -#define _mm512_mask_cvt_roundepu64_ps(__W, __U, __A, __R) __extension__ ({ \ - (__m256) __builtin_ia32_cvtuqq2ps512_mask ((__v8di) __A, \ - (__v8sf) __W, (__mmask8) __U, __R);}) - -#define _mm512_maskz_cvt_roundepu64_ps(__U, __A, __R) __extension__ ({ \ - (__m256) __builtin_ia32_cvtuqq2ps512_mask ((__v8di) __A, \ - (__v8sf) _mm256_setzero_ps(), (__mmask8) __U, __R);}) - -#define _mm512_range_pd(__A, __B, __C) __extension__ ({ \ - (__m512d) __builtin_ia32_rangepd512_mask ((__v8df) __A, (__v8df) __B, __C,\ - (__v8df) _mm512_setzero_pd(), (__mmask8) -1, \ - _MM_FROUND_CUR_DIRECTION);}) - -#define _mm512_mask_range_pd(__W, __U, __A, __B, __C) __extension__ ({ \ - (__m512d) __builtin_ia32_rangepd512_mask ((__v8df) __A, (__v8df) __B, __C,\ - (__v8df) __W, (__mmask8) __U, _MM_FROUND_CUR_DIRECTION);}) - -#define _mm512_maskz_range_pd(__U, __A, __B, __C) __extension__ ({ \ - (__m512d) __builtin_ia32_rangepd512_mask ((__v8df) __A, (__v8df) __B, __C, \ - (__v8df) _mm512_setzero_pd(), (__mmask8) __U, \ - _MM_FROUND_CUR_DIRECTION);}) - -#define _mm512_range_round_pd(__A, __B, __C, __R) __extension__ ({ \ - (__m512d) __builtin_ia32_rangepd512_mask ((__v8df) __A, (__v8df) __B, __C, \ - (__v8df) _mm512_setzero_pd(), (__mmask8) -1, __R);}) - -#define _mm512_mask_range_round_pd(__W, __U, __A, __B, __C, __R) __extension__ ({ \ - (__m512d) __builtin_ia32_rangepd512_mask ((__v8df) __A, (__v8df) __B, __C, \ - (__v8df) __W, (__mmask8) __U, __R);}) - -#define _mm512_maskz_range_round_pd(__U, __A, __B, __C, __R) __extension__ ({ \ - (__m512d) __builtin_ia32_rangepd512_mask ((__v8df) __A, (__v8df) __B, __C, \ - (__v8df) _mm512_setzero_pd(), (__mmask8) __U, __R);}) - -#define _mm512_range_ps(__A, __B, __C) __extension__ ({ \ - (__m512) __builtin_ia32_rangeps512_mask ((__v16sf) __A, (__v16sf) __B, __C, \ - (__v16sf) _mm512_setzero_ps(), (__mmask16) -1, \ - _MM_FROUND_CUR_DIRECTION);}) - -#define _mm512_mask_range_ps(__W, __U, __A, __B, __C) __extension__ ({ \ - (__m512) __builtin_ia32_rangeps512_mask ((__v16sf) __A, (__v16sf) __B, \ - __C, (__v16sf) __W, (__mmask16) __U, _MM_FROUND_CUR_DIRECTION);}) - -#define _mm512_maskz_range_ps(__U, __A, __B, __C) __extension__ ({ \ - (__m512) __builtin_ia32_rangeps512_mask ((__v16sf) __A,(__v16sf) __B, \ - __C, (__v16sf) _mm512_setzero_ps(), (__mmask16) __U, \ - _MM_FROUND_CUR_DIRECTION);}) - -#define _mm512_range_round_ps(__A, __B, __C, __R) __extension__ ({ \ - (__m512) __builtin_ia32_rangeps512_mask ((__v16sf) __A, (__v16sf) __B, \ - __C, (__v16sf) _mm512_setzero_ps(), (__mmask16) -1, __R);}) - -#define _mm512_mask_range_round_ps(__W, __U, __A, __B, __C, __R) __extension__ ({ \ - (__m512) __builtin_ia32_rangeps512_mask ((__v16sf) __A, (__v16sf) __B, \ - __C, (__v16sf) __W, (__mmask16) __U, __R);}) - -#define _mm512_maskz_range_round_ps(__U, __A, __B, __C, __R) __extension__ ({ \ - (__m512) __builtin_ia32_rangeps512_mask ((__v16sf) __A, (__v16sf) __B, \ - __C, (__v16sf) _mm512_setzero_ps(), (__mmask16) __U, __R);}) - -#define _mm512_reduce_pd(__A, __B) __extension__ ({ \ - (__m512d) __builtin_ia32_reducepd512_mask ((__v8df) __A, __B, \ - (__v8df) _mm512_setzero_pd(), (__mmask8) -1, _MM_FROUND_CUR_DIRECTION);}) - -#define _mm512_mask_reduce_pd(__W, __U, __A, __B) __extension__ ({ \ - (__m512d) __builtin_ia32_reducepd512_mask ((__v8df) __A, __B, \ - (__v8df) __W,(__mmask8) __U, _MM_FROUND_CUR_DIRECTION);}) - -#define _mm512_maskz_reduce_pd(__U, __A, __B) __extension__ ({ \ - (__m512d) __builtin_ia32_reducepd512_mask ((__v8df) __A, __B, \ - (__v8df) _mm512_setzero_pd(), (__mmask8) __U, _MM_FROUND_CUR_DIRECTION);}) - -#define _mm512_reduce_ps(__A, __B) __extension__ ({ \ - (__m512) __builtin_ia32_reduceps512_mask ((__v16sf) __A, __B, \ - (__v16sf) _mm512_setzero_ps(), (__mmask16) -1, _MM_FROUND_CUR_DIRECTION);}) - -#define _mm512_mask_reduce_ps(__W, __U, __A, __B) __extension__ ({ \ - (__m512) __builtin_ia32_reduceps512_mask ((__v16sf) __A, __B, \ - (__v16sf) __W, (__mmask16) __U, _MM_FROUND_CUR_DIRECTION);}) - -#define _mm512_maskz_reduce_ps(__U, __A, __B) __extension__ ({ \ - (__m512) __builtin_ia32_reduceps512_mask ((__v16sf) __A, __B, \ - (__v16sf) _mm512_setzero_ps(), (__mmask16) __U, _MM_FROUND_CUR_DIRECTION);}) - -#define _mm512_reduce_round_pd(__A, __B, __R) __extension__ ({\ - (__m512d) __builtin_ia32_reducepd512_mask ((__v8df) __A, __B, \ - (__v8df) _mm512_setzero_pd(), (__mmask8) -1, __R);}) - -#define _mm512_mask_reduce_round_pd(__W, __U, __A, __B, __R) __extension__ ({\ - (__m512d) __builtin_ia32_reducepd512_mask ((__v8df) __A, __B, \ - (__v8df) __W,(__mmask8) __U, __R);}) - -#define _mm512_maskz_reduce_round_pd(__U, __A, __B, __R) __extension__ ({\ - (__m512d) __builtin_ia32_reducepd512_mask ((__v8df) __A, __B, \ - (__v8df) _mm512_setzero_pd(), (__mmask8) __U, __R);}) - -#define _mm512_reduce_round_ps(__A, __B, __R) __extension__ ({\ - (__m512) __builtin_ia32_reduceps512_mask ((__v16sf) __A, __B, \ - (__v16sf) _mm512_setzero_ps(), (__mmask16) -1, __R);}) - -#define _mm512_mask_reduce_round_ps(__W, __U, __A, __B, __R) __extension__ ({\ - (__m512) __builtin_ia32_reduceps512_mask ((__v16sf) __A, __B, \ - (__v16sf) __W, (__mmask16) __U, __R);}) - -#define _mm512_maskz_reduce_round_ps(__U, __A, __B, __R) __extension__ ({\ - (__m512) __builtin_ia32_reduceps512_mask ((__v16sf) __A, __B, \ - (__v16sf) _mm512_setzero_ps(), (__mmask16) __U, __R);}) - #undef __DEFAULT_FN_ATTRS #endif diff --git a/test/CodeGen/avx512dq-builtins.c b/test/CodeGen/avx512dq-builtins.c index 6993163083..098083765b 100644 --- a/test/CodeGen/avx512dq-builtins.c +++ b/test/CodeGen/avx512dq-builtins.c @@ -163,580 +163,3 @@ __m512 test_mm512_maskz_andnot_ps (__mmask16 __U, __m512 __A, __m512 __B) { return (__m512) _mm512_maskz_andnot_ps(__U, __A, __B); } -__m512i test_mm512_cvtpd_epi64(__m512d __A) { - // CHECK-LABEL: @test_mm512_cvtpd_epi64 - // CHECK: @llvm.x86.avx512.mask.cvtpd.512 - return _mm512_cvtpd_epi64(__A); -} - -__m512i test_mm512_mask_cvtpd_epi64(__m512i __W, __mmask8 __U, __m512d __A) { - // CHECK-LABEL: @test_mm512_mask_cvtpd_epi64 - // CHECK: @llvm.x86.avx512.mask.cvtpd.512 - return _mm512_mask_cvtpd_epi64(__W, __U, __A); -} - -__m512i test_mm512_maskz_cvtpd_epi64(__mmask8 __U, __m512d __A) { - // CHECK-LABEL: @test_mm512_maskz_cvtpd_epi64 - // CHECK: @llvm.x86.avx512.mask.cvtpd.512 - return _mm512_maskz_cvtpd_epi64(__U, __A); -} - -__m512i test_mm512_cvt_roundpd_epi64(__m512d __A) { - // CHECK-LABEL: @test_mm512_cvt_roundpd_epi64 - // CHECK: @llvm.x86.avx512.mask.cvt.512 - return _mm512_cvt_roundpd_epi64(__A, _MM_FROUND_TO_NEAREST_INT); -} - -__m512i test_mm512_mask_cvt_roundpd_epi64(__m512i __W, __mmask8 __U, __m512d __A) { - // CHECK-LABEL: @test_mm512_mask_cvt_roundpd_epi64 - // CHECK: @llvm.x86.avx512.mask.cvt.512 - return _mm512_mask_cvt_roundpd_epi64(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); -} - -__m512i test_mm512_maskz_cvt_roundpd_epi64(__mmask8 __U, __m512d __A) { - // CHECK-LABEL: @test_mm512_maskz_cvt_roundpd_epi64 - // CHECK: @llvm.x86.avx512.mask.cvt.512 - return _mm512_maskz_cvt_roundpd_epi64(__U, __A, _MM_FROUND_TO_NEAREST_INT); -} - -__m512i test_mm512_cvtpd_epu64(__m512d __A) { - // CHECK-LABEL: @test_mm512_cvtpd_epu64 - // CHECK: @llvm.x86.avx512.mask.cvtpd.512 - return _mm512_cvtpd_epu64(__A); -} - -__m512i test_mm512_mask_cvtpd_epu64(__m512i __W, __mmask8 __U, __m512d __A) { - // CHECK-LABEL: @test_mm512_mask_cvtpd_epu64 - // CHECK: @llvm.x86.avx512.mask.cvtpd.512 - return _mm512_mask_cvtpd_epu64(__W, __U, __A); -} - -__m512i test_mm512_maskz_cvtpd_epu64(__mmask8 __U, __m512d __A) { - // CHECK-LABEL: @test_mm512_maskz_cvtpd_epu64 - // CHECK: @llvm.x86.avx512.mask.cvtpd.512 - return _mm512_maskz_cvtpd_epu64(__U, __A); -} - -__m512i test_mm512_cvt_roundpd_epu64(__m512d __A) { - // CHECK-LABEL: @test_mm512_cvt_roundpd_epu64 - // CHECK: @llvm.x86.avx512.mask.cvt.512 - return _mm512_cvt_roundpd_epu64(__A, _MM_FROUND_TO_NEAREST_INT); -} - -__m512i test_mm512_mask_cvt_roundpd_epu64(__m512i __W, __mmask8 __U, __m512d __A) { - // CHECK-LABEL: @test_mm512_mask_cvt_roundpd_epu64 - // CHECK: @llvm.x86.avx512.mask.cvt.512 - return _mm512_mask_cvt_roundpd_epu64(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); -} - -__m512i test_mm512_maskz_cvt_roundpd_epu64(__mmask8 __U, __m512d __A) { - // CHECK-LABEL: @test_mm512_maskz_cvt_roundpd_epu64 - // CHECK: @llvm.x86.avx512.mask.cvt.512 - return _mm512_maskz_cvt_roundpd_epu64(__U, __A, _MM_FROUND_TO_NEAREST_INT); -} - -__m512i test_mm512_cvtps_epi64(__m256 __A) { - // CHECK-LABEL: @test_mm512_cvtps_epi64 - // CHECK: @llvm.x86.avx512.mask.cvtps.512 - return _mm512_cvtps_epi64(__A); -} - -__m512i test_mm512_mask_cvtps_epi64(__m512i __W, __mmask8 __U, __m256 __A) { - // CHECK-LABEL: @test_mm512_mask_cvtps_epi64 - // CHECK: @llvm.x86.avx512.mask.cvtps.512 - return _mm512_mask_cvtps_epi64(__W, __U, __A); -} - -__m512i test_mm512_maskz_cvtps_epi64(__mmask8 __U, __m256 __A) { - // CHECK-LABEL: @test_mm512_maskz_cvtps_epi64 - // CHECK: @llvm.x86.avx512.mask.cvtps.512 - return _mm512_maskz_cvtps_epi64(__U, __A); -} - -__m512i test_mm512_cvt_roundps_epi64(__m256 __A) { - // CHECK-LABEL: @test_mm512_cvt_roundps_epi64 - // CHECK: @llvm.x86.avx512.mask.cvt.512 - return _mm512_cvt_roundps_epi64(__A, _MM_FROUND_TO_NEAREST_INT); -} - -__m512i test_mm512_mask_cvt_roundps_epi64(__m512i __W, __mmask8 __U, __m256 __A) { - // CHECK-LABEL: @test_mm512_mask_cvt_roundps_epi64 - // CHECK: @llvm.x86.avx512.mask.cvt.512 - return _mm512_mask_cvt_roundps_epi64(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); -} - -__m512i test_mm512_maskz_cvt_roundps_epi64(__mmask8 __U, __m256 __A) { - // CHECK-LABEL: @test_mm512_maskz_cvt_roundps_epi64 - // CHECK: @llvm.x86.avx512.mask.cvt.512 - return _mm512_maskz_cvt_roundps_epi64(__U, __A, _MM_FROUND_TO_NEAREST_INT); -} - -__m512i test_mm512_cvtps_epu64(__m256 __A) { - // CHECK-LABEL: @test_mm512_cvtps_epu64 - // CHECK: @llvm.x86.avx512.mask.cvtps.512 - return _mm512_cvtps_epu64(__A); -} - -__m512i test_mm512_mask_cvtps_epu64(__m512i __W, __mmask8 __U, __m256 __A) { - // CHECK-LABEL: @test_mm512_mask_cvtps_epu64 - // CHECK: @llvm.x86.avx512.mask.cvtps.512 - return _mm512_mask_cvtps_epu64(__W, __U, __A); -} - -__m512i test_mm512_maskz_cvtps_epu64(__mmask8 __U, __m256 __A) { - // CHECK-LABEL: @test_mm512_maskz_cvtps_epu64 - // CHECK: @llvm.x86.avx512.mask.cvtps.512 - return _mm512_maskz_cvtps_epu64(__U, __A); -} - -__m512i test_mm512_cvt_roundps_epu64(__m256 __A) { - // CHECK-LABEL: @test_mm512_cvt_roundps_epu64 - // CHECK: @llvm.x86.avx512.mask.cvt.512 - return _mm512_cvt_roundps_epu64(__A, _MM_FROUND_TO_NEAREST_INT); -} - -__m512i test_mm512_mask_cvt_roundps_epu64(__m512i __W, __mmask8 __U, __m256 __A) { - // CHECK-LABEL: @test_mm512_mask_cvt_roundps_epu64 - // CHECK: @llvm.x86.avx512.mask.cvt.512 - return _mm512_mask_cvt_roundps_epu64(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); -} - -__m512i test_mm512_maskz_cvt_roundps_epu64(__mmask8 __U, __m256 __A) { - // CHECK-LABEL: @test_mm512_maskz_cvt_roundps_epu64 - // CHECK: @llvm.x86.avx512.mask.cvt.512 - return _mm512_maskz_cvt_roundps_epu64(__U, __A, _MM_FROUND_TO_NEAREST_INT); -} - -__m512d test_mm512_cvtepi64_pd(__m512i __A) { - // CHECK-LABEL: @test_mm512_cvtepi64_pd - // CHECK: @llvm.x86.avx512.mask.cvtqq2.pd.512 - return _mm512_cvtepi64_pd(__A); -} - -__m512d test_mm512_mask_cvtepi64_pd(__m512d __W, __mmask8 __U, __m512i __A) { - // CHECK-LABEL: @test_mm512_mask_cvtepi64_pd - // CHECK: @llvm.x86.avx512.mask.cvtqq2.pd.512 - return _mm512_mask_cvtepi64_pd(__W, __U, __A); -} - -__m512d test_mm512_maskz_cvtepi64_pd(__mmask8 __U, __m512i __A) { - // CHECK-LABEL: @test_mm512_maskz_cvtepi64_pd - // CHECK: @llvm.x86.avx512.mask.cvtqq2.pd.512 - return _mm512_maskz_cvtepi64_pd(__U, __A); -} - -__m512d test_mm512_cvt_roundepi64_pd(__m512i __A) { - // CHECK-LABEL: @test_mm512_cvt_roundepi64_pd - // CHECK: @llvm.x86.avx512.mask.cvt.512 - return _mm512_cvt_roundepi64_pd(__A, _MM_FROUND_TO_NEAREST_INT); -} - -__m512d test_mm512_mask_cvt_roundepi64_pd(__m512d __W, __mmask8 __U, __m512i __A) { - // CHECK-LABEL: @test_mm512_mask_cvt_roundepi64_pd - // CHECK: @llvm.x86.avx512.mask.cvt.512 - return _mm512_mask_cvt_roundepi64_pd(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); -} - -__m512d test_mm512_maskz_cvt_roundepi64_pd(__mmask8 __U, __m512i __A) { - // CHECK-LABEL: @test_mm512_maskz_cvt_roundepi64_pd - // CHECK: @llvm.x86.avx512.mask.cvt.512 - return _mm512_maskz_cvt_roundepi64_pd(__U, __A, _MM_FROUND_TO_NEAREST_INT); -} - -__m256 test_mm512_cvtepi64_ps(__m512i __A) { - // CHECK-LABEL: @test_mm512_cvtepi64_ps - // CHECK: @llvm.x86.avx512.mask.cvtqq2.ps.512 - return _mm512_cvtepi64_ps(__A); -} - -__m256 test_mm512_mask_cvtepi64_ps(__m256 __W, __mmask8 __U, __m512i __A) { - // CHECK-LABEL: @test_mm512_mask_cvtepi64_ps - // CHECK: @llvm.x86.avx512.mask.cvtqq2.ps.512 - return _mm512_mask_cvtepi64_ps(__W, __U, __A); -} - -__m256 test_mm512_maskz_cvtepi64_ps(__mmask8 __U, __m512i __A) { - // CHECK-LABEL: @test_mm512_maskz_cvtepi64_ps - // CHECK: @llvm.x86.avx512.mask.cvtqq2.ps.512 - return _mm512_maskz_cvtepi64_ps(__U, __A); -} - -__m256 test_mm512_cvt_roundepi64_ps(__m512i __A) { - // CHECK-LABEL: @test_mm512_cvt_roundepi64_ps - // CHECK: @llvm.x86.avx512.mask.cvt.512 - return _mm512_cvt_roundepi64_ps(__A, _MM_FROUND_TO_NEAREST_INT); -} - -__m256 test_mm512_mask_cvt_roundepi64_ps(__m256 __W, __mmask8 __U, __m512i __A) { - // CHECK-LABEL: @test_mm512_mask_cvt_roundepi64_ps - // CHECK: @llvm.x86.avx512.mask.cvt.512 - return _mm512_mask_cvt_roundepi64_ps(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); -} - -__m256 test_mm512_maskz_cvt_roundepi64_ps(__mmask8 __U, __m512i __A) { - // CHECK-LABEL: @test_mm512_maskz_cvt_roundepi64_ps - // CHECK: @llvm.x86.avx512.mask.cvt.512 - return _mm512_maskz_cvt_roundepi64_ps(__U, __A, _MM_FROUND_TO_NEAREST_INT); -} - -__m512i test_mm512_cvttpd_epi64(__m512d __A) { - // CHECK-LABEL: @test_mm512_cvttpd_epi64 - // CHECK: @llvm.x86.avx512.mask.cvttpd.512 - return _mm512_cvttpd_epi64(__A); -} - -__m512i test_mm512_mask_cvttpd_epi64(__m512i __W, __mmask8 __U, __m512d __A) { - // CHECK-LABEL: @test_mm512_mask_cvttpd_epi64 - // CHECK: @llvm.x86.avx512.mask.cvttpd.512 - return _mm512_mask_cvttpd_epi64(__W, __U, __A); -} - -__m512i test_mm512_maskz_cvttpd_epi64(__mmask8 __U, __m512d __A) { - // CHECK-LABEL: @test_mm512_maskz_cvttpd_epi64 - // CHECK: @llvm.x86.avx512.mask.cvttpd.512 - return _mm512_maskz_cvttpd_epi64(__U, __A); -} - -__m512i test_mm512_cvtt_roundpd_epi64(__m512d __A) { - // CHECK-LABEL: @test_mm512_cvtt_roundpd_epi64 - // CHECK: @llvm.x86.avx512.mask.cvtt.512 - return _mm512_cvtt_roundpd_epi64(__A, _MM_FROUND_TO_NEAREST_INT); -} - -__m512i test_mm512_mask_cvtt_roundpd_epi64(__m512i __W, __mmask8 __U, __m512d __A) { - // CHECK-LABEL: @test_mm512_mask_cvtt_roundpd_epi64 - // CHECK: @llvm.x86.avx512.mask.cvtt.512 - return _mm512_mask_cvtt_roundpd_epi64(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); -} - -__m512i test_mm512_maskz_cvtt_roundpd_epi64(__mmask8 __U, __m512d __A) { - // CHECK-LABEL: @test_mm512_maskz_cvtt_roundpd_epi64 - // CHECK: @llvm.x86.avx512.mask.cvtt.512 - return _mm512_maskz_cvtt_roundpd_epi64(__U, __A, _MM_FROUND_TO_NEAREST_INT); -} - -__m512i test_mm512_cvttpd_epu64(__m512d __A) { - // CHECK-LABEL: @test_mm512_cvttpd_epu64 - // CHECK: @llvm.x86.avx512.mask.cvttpd.512 - return _mm512_cvttpd_epu64(__A); -} - -__m512i test_mm512_mask_cvttpd_epu64(__m512i __W, __mmask8 __U, __m512d __A) { - // CHECK-LABEL: @test_mm512_mask_cvttpd_epu64 - // CHECK: @llvm.x86.avx512.mask.cvttpd.512 - return _mm512_mask_cvttpd_epu64(__W, __U, __A); -} - -__m512i test_mm512_maskz_cvttpd_epu64(__mmask8 __U, __m512d __A) { - // CHECK-LABEL: @test_mm512_maskz_cvttpd_epu64 - // CHECK: @llvm.x86.avx512.mask.cvttpd.512 - return _mm512_maskz_cvttpd_epu64(__U, __A); -} - -__m512i test_mm512_cvtt_roundpd_epu64(__m512d __A) { - // CHECK-LABEL: @test_mm512_cvtt_roundpd_epu64 - // CHECK: @llvm.x86.avx512.mask.cvtt.512 - return _mm512_cvtt_roundpd_epu64(__A, _MM_FROUND_TO_NEAREST_INT); -} - -__m512i test_mm512_mask_cvtt_roundpd_epu64(__m512i __W, __mmask8 __U, __m512d __A) { - // CHECK-LABEL: @test_mm512_mask_cvtt_roundpd_epu64 - // CHECK: @llvm.x86.avx512.mask.cvtt.512 - return _mm512_mask_cvtt_roundpd_epu64(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); -} - -__m512i test_mm512_maskz_cvtt_roundpd_epu64(__mmask8 __U, __m512d __A) { - // CHECK-LABEL: @test_mm512_maskz_cvtt_roundpd_epu64 - // CHECK: @llvm.x86.avx512.mask.cvtt.512 - return _mm512_maskz_cvtt_roundpd_epu64(__U, __A, _MM_FROUND_TO_NEAREST_INT); -} - -__m512i test_mm512_cvttps_epi64(__m256 __A) { - // CHECK-LABEL: @test_mm512_cvttps_epi64 - // CHECK: @llvm.x86.avx512.mask.cvttps.512 - return _mm512_cvttps_epi64(__A); -} - -__m512i test_mm512_mask_cvttps_epi64(__m512i __W, __mmask8 __U, __m256 __A) { - // CHECK-LABEL: @test_mm512_mask_cvttps_epi64 - // CHECK: @llvm.x86.avx512.mask.cvttps.512 - return _mm512_mask_cvttps_epi64(__W, __U, __A); -} - -__m512i test_mm512_maskz_cvttps_epi64(__mmask8 __U, __m256 __A) { - // CHECK-LABEL: @test_mm512_maskz_cvttps_epi64 - // CHECK: @llvm.x86.avx512.mask.cvttps.512 - return _mm512_maskz_cvttps_epi64(__U, __A); -} - -__m512i test_mm512_cvtt_roundps_epi64(__m256 __A) { - // CHECK-LABEL: @test_mm512_cvtt_roundps_epi64 - // CHECK: @llvm.x86.avx512.mask.cvtt.512 - return _mm512_cvtt_roundps_epi64(__A, _MM_FROUND_TO_NEAREST_INT); -} - -__m512i test_mm512_mask_cvtt_roundps_epi64(__m512i __W, __mmask8 __U, __m256 __A) { - // CHECK-LABEL: @test_mm512_mask_cvtt_roundps_epi64 - // CHECK: @llvm.x86.avx512.mask.cvtt.512 - return _mm512_mask_cvtt_roundps_epi64(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); -} - -__m512i test_mm512_maskz_cvtt_roundps_epi64(__mmask8 __U, __m256 __A) { - // CHECK-LABEL: @test_mm512_maskz_cvtt_roundps_epi64 - // CHECK: @llvm.x86.avx512.mask.cvtt.512 - return _mm512_maskz_cvtt_roundps_epi64(__U, __A, _MM_FROUND_TO_NEAREST_INT); -} - -__m512i test_mm512_cvttps_epu64(__m256 __A) { - // CHECK-LABEL: @test_mm512_cvttps_epu64 - // CHECK: @llvm.x86.avx512.mask.cvttps.512 - return _mm512_cvttps_epu64(__A); -} - -__m512i test_mm512_mask_cvttps_epu64(__m512i __W, __mmask8 __U, __m256 __A) { - // CHECK-LABEL: @test_mm512_mask_cvttps_epu64 - // CHECK: @llvm.x86.avx512.mask.cvttps.512 - return _mm512_mask_cvttps_epu64(__W, __U, __A); -} - -__m512i test_mm512_maskz_cvttps_epu64(__mmask8 __U, __m256 __A) { - // CHECK-LABEL: @test_mm512_maskz_cvttps_epu64 - // CHECK: @llvm.x86.avx512.mask.cvttps.512 - return _mm512_maskz_cvttps_epu64(__U, __A); -} - -__m512i test_mm512_cvtt_roundps_epu64(__m256 __A) { - // CHECK-LABEL: @test_mm512_cvtt_roundps_epu64 - // CHECK: @llvm.x86.avx512.mask.cvtt.512 - return _mm512_cvtt_roundps_epu64(__A, _MM_FROUND_TO_NEAREST_INT); -} - -__m512i test_mm512_mask_cvtt_roundps_epu64(__m512i __W, __mmask8 __U, __m256 __A) { - // CHECK-LABEL: @test_mm512_mask_cvtt_roundps_epu64 - // CHECK: @llvm.x86.avx512.mask.cvtt.512 - return _mm512_mask_cvtt_roundps_epu64(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); -} - -__m512i test_mm512_maskz_cvtt_roundps_epu64(__mmask8 __U, __m256 __A) { - // CHECK-LABEL: @test_mm512_maskz_cvtt_roundps_epu64 - // CHECK: @llvm.x86.avx512.mask.cvtt.512 - return _mm512_maskz_cvtt_roundps_epu64(__U, __A, _MM_FROUND_TO_NEAREST_INT); -} - -__m512d test_mm512_cvtepu64_pd(__m512i __A) { - // CHECK-LABEL: @test_mm512_cvtepu64_pd - // CHECK: @llvm.x86.avx512.mask.cvtuqq2.pd.512 - return _mm512_cvtepu64_pd(__A); -} - -__m512d test_mm512_mask_cvtepu64_pd(__m512d __W, __mmask8 __U, __m512i __A) { - // CHECK-LABEL: @test_mm512_mask_cvtepu64_pd - // CHECK: @llvm.x86.avx512.mask.cvtuqq2.pd.512 - return _mm512_mask_cvtepu64_pd(__W, __U, __A); -} - -__m512d test_mm512_maskz_cvtepu64_pd(__mmask8 __U, __m512i __A) { - // CHECK-LABEL: @test_mm512_maskz_cvtepu64_pd - // CHECK: @llvm.x86.avx512.mask.cvtuqq2.pd.512 - return _mm512_maskz_cvtepu64_pd(__U, __A); -} - -__m512d test_mm512_cvt_roundepu64_pd(__m512i __A) { - // CHECK-LABEL: @test_mm512_cvt_roundepu64_pd - // CHECK: @llvm.x86.avx512.mask.cvt.512 - return _mm512_cvt_roundepu64_pd(__A, _MM_FROUND_TO_NEAREST_INT); -} - -__m512d test_mm512_mask_cvt_roundepu64_pd(__m512d __W, __mmask8 __U, __m512i __A) { - // CHECK-LABEL: @test_mm512_mask_cvt_roundepu64_pd - // CHECK: @llvm.x86.avx512.mask.cvt.512 - return _mm512_mask_cvt_roundepu64_pd(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); -} - -__m512d test_mm512_maskz_cvt_roundepu64_pd(__mmask8 __U, __m512i __A) { - // CHECK-LABEL: @test_mm512_maskz_cvt_roundepu64_pd - // CHECK: @llvm.x86.avx512.mask.cvt.512 - return _mm512_maskz_cvt_roundepu64_pd(__U, __A, _MM_FROUND_TO_NEAREST_INT); -} - -__m256 test_mm512_cvtepu64_ps(__m512i __A) { - // CHECK-LABEL: @test_mm512_cvtepu64_ps - // CHECK: @llvm.x86.avx512.mask.cvtuqq2.ps.512 - return _mm512_cvtepu64_ps(__A); -} - -__m256 test_mm512_mask_cvtepu64_ps(__m256 __W, __mmask8 __U, __m512i __A) { - // CHECK-LABEL: @test_mm512_mask_cvtepu64_ps - // CHECK: @llvm.x86.avx512.mask.cvtuqq2.ps.512 - return _mm512_mask_cvtepu64_ps(__W, __U, __A); -} - -__m256 test_mm512_maskz_cvtepu64_ps(__mmask8 __U, __m512i __A) { - // CHECK-LABEL: @test_mm512_maskz_cvtepu64_ps - // CHECK: @llvm.x86.avx512.mask.cvtuqq2.ps.512 - return _mm512_maskz_cvtepu64_ps(__U, __A); -} - -__m256 test_mm512_cvt_roundepu64_ps(__m512i __A) { - // CHECK-LABEL: @test_mm512_cvt_roundepu64_ps - // CHECK: @llvm.x86.avx512.mask.cvt.512 - return _mm512_cvt_roundepu64_ps(__A, _MM_FROUND_TO_NEAREST_INT); -} - -__m256 test_mm512_mask_cvt_roundepu64_ps(__m256 __W, __mmask8 __U, __m512i __A) { - // CHECK-LABEL: @test_mm512_mask_cvt_roundepu64_ps - // CHECK: @llvm.x86.avx512.mask.cvt.512 - return _mm512_mask_cvt_roundepu64_ps(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); -} - -__m256 test_mm512_maskz_cvt_roundepu64_ps(__mmask8 __U, __m512i __A) { - // CHECK-LABEL: @test_mm512_maskz_cvt_roundepu64_ps - // CHECK: @llvm.x86.avx512.mask.cvt.512 - return _mm512_maskz_cvt_roundepu64_ps(__U, __A, _MM_FROUND_TO_NEAREST_INT); -} - -__m512d test_mm512_range_pd(__m512d __A, __m512d __B) { - // CHECK-LABEL: @test_mm512_range_pd - // CHECK: @llvm.x86.avx512.mask.range.pd.512 - return _mm512_range_pd(__A, __B, 4); -} - -__m512d test_mm512_mask_range_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512d __B) { - // CHECK-LABEL: @test_mm512_mask_range_pd - // CHECK: @llvm.x86.avx512.mask.range.pd.512 - return _mm512_mask_range_pd(__W, __U, __A, __B, 4); -} - -__m512d test_mm512_maskz_range_pd(__mmask8 __U, __m512d __A, __m512d __B) { - // CHECK-LABEL: @test_mm512_maskz_range_pd - // CHECK: @llvm.x86.avx512.mask.range.pd.512 - return _mm512_maskz_range_pd(__U, __A, __B, 4); -} - -__m512d test_mm512_range_round_pd(__m512d __A, __m512d __B) { - // CHECK-LABEL: @test_mm512_range_round_pd - // CHECK: @llvm.x86.avx512.mask.range.pd.512 - return _mm512_range_round_pd(__A, __B, 4, 8); -} - -__m512d test_mm512_mask_range_round_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512d __B) { - // CHECK-LABEL: @test_mm512_mask_range_round_pd - // CHECK: @llvm.x86.avx512.mask.range.pd.512 - return _mm512_mask_range_round_pd(__W, __U, __A, __B, 4, 8); -} - -__m512d test_mm512_maskz_range_round_pd(__mmask8 __U, __m512d __A, __m512d __B) { - // CHECK-LABEL: @test_mm512_maskz_range_round_pd - // CHECK: @llvm.x86.avx512.mask.range.pd.512 - return _mm512_maskz_range_round_pd(__U, __A, __B, 4, 8); -} - -__m512 test_mm512_range_ps(__m512 __A, __m512 __B) { - // CHECK-LABEL: @test_mm512_range_ps - // CHECK: @llvm.x86.avx512.mask.range.ps.512 - return _mm512_range_ps(__A, __B, 4); -} - -__m512 test_mm512_mask_range_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B) { - // CHECK-LABEL: @test_mm512_mask_range_ps - // CHECK: @llvm.x86.avx512.mask.range.ps.512 - return _mm512_mask_range_ps(__W, __U, __A, __B, 4); -} - -__m512 test_mm512_maskz_range_ps(__mmask16 __U, __m512 __A, __m512 __B) { - // CHECK-LABEL: @test_mm512_maskz_range_ps - // CHECK: @llvm.x86.avx512.mask.range.ps.512 - return _mm512_maskz_range_ps(__U, __A, __B, 4); -} - -__m512 test_mm512_range_round_ps(__m512 __A, __m512 __B) { - // CHECK-LABEL: @test_mm512_range_round_ps - // CHECK: @llvm.x86.avx512.mask.range.ps.512 - return _mm512_range_round_ps(__A, __B, 4, 8); -} - -__m512 test_mm512_mask_range_round_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B) { - // CHECK-LABEL: @test_mm512_mask_range_round_ps - // CHECK: @llvm.x86.avx512.mask.range.ps.512 - return _mm512_mask_range_round_ps(__W, __U, __A, __B, 4, 8); -} - -__m512 test_mm512_maskz_range_round_ps(__mmask16 __U, __m512 __A, __m512 __B) { - // CHECK-LABEL: @test_mm512_maskz_range_round_ps - // CHECK: @llvm.x86.avx512.mask.range.ps.512 - return _mm512_maskz_range_round_ps(__U, __A, __B, 4, 8); -} - -__m512d test_mm512_reduce_pd(__m512d __A) { - // CHECK-LABEL: @test_mm512_reduce_pd - // CHECK: @llvm.x86.avx512.mask.reduce.pd.512 - return _mm512_reduce_pd(__A, 4); -} - -__m512d test_mm512_mask_reduce_pd(__m512d __W, __mmask8 __U, __m512d __A) { - // CHECK-LABEL: @test_mm512_mask_reduce_pd - // CHECK: @llvm.x86.avx512.mask.reduce.pd.512 - return _mm512_mask_reduce_pd(__W, __U, __A, 4); -} - -__m512d test_mm512_maskz_reduce_pd(__mmask8 __U, __m512d __A) { - // CHECK-LABEL: @test_mm512_maskz_reduce_pd - // CHECK: @llvm.x86.avx512.mask.reduce.pd.512 - return _mm512_maskz_reduce_pd(__U, __A, 4); -} - -__m512 test_mm512_reduce_ps(__m512 __A) { - // CHECK-LABEL: @test_mm512_reduce_ps - // CHECK: @llvm.x86.avx512.mask.reduce.ps.512 - return _mm512_reduce_ps(__A, 4); -} - -__m512 test_mm512_mask_reduce_ps(__m512 __W, __mmask16 __U, __m512 __A) { - // CHECK-LABEL: @test_mm512_mask_reduce_ps - // CHECK: @llvm.x86.avx512.mask.reduce.ps.512 - return _mm512_mask_reduce_ps(__W, __U, __A, 4); -} - -__m512 test_mm512_maskz_reduce_ps(__mmask16 __U, __m512 __A) { - // CHECK-LABEL: @test_mm512_maskz_reduce_ps - // CHECK: @llvm.x86.avx512.mask.reduce.ps.512 - return _mm512_maskz_reduce_ps(__U, __A, 4); -} - -__m512d test_mm512_reduce_round_pd(__m512d __A) { - // CHECK-LABEL: @test_mm512_reduce_round_pd - // CHECK: @llvm.x86.avx512.mask.reduce.pd.512 - return _mm512_reduce_round_pd(__A, 4, 8); -} - -__m512d test_mm512_mask_reduce_round_pd(__m512d __W, __mmask8 __U, __m512d __A) { - // CHECK-LABEL: @test_mm512_mask_reduce_round_pd - // CHECK: @llvm.x86.avx512.mask.reduce.pd.512 - return _mm512_mask_reduce_round_pd(__W, __U, __A, 4, 8); -} - -__m512d test_mm512_maskz_reduce_round_pd(__mmask8 __U, __m512d __A) { - // CHECK-LABEL: @test_mm512_maskz_reduce_round_pd - // CHECK: @llvm.x86.avx512.mask.reduce.pd.512 - return _mm512_maskz_reduce_round_pd(__U, __A, 4, 8); -} - -__m512 test_mm512_reduce_round_ps(__m512 __A) { - // CHECK-LABEL: @test_mm512_reduce_round_ps - // CHECK: @llvm.x86.avx512.mask.reduce.ps.512 - return _mm512_reduce_round_ps(__A, 4, 8); -} - -__m512 test_mm512_mask_reduce_round_ps(__m512 __W, __mmask16 __U, __m512 __A) { - // CHECK-LABEL: @test_mm512_mask_reduce_round_ps - // CHECK: @llvm.x86.avx512.mask.reduce.ps.512 - return _mm512_mask_reduce_round_ps(__W, __U, __A, 4, 8); -} - -__m512 test_mm512_maskz_reduce_round_ps(__mmask16 __U, __m512 __A) { - // CHECK-LABEL: @test_mm512_maskz_reduce_round_ps - // CHECK: @llvm.x86.avx512.mask.reduce.ps.512 - return _mm512_maskz_reduce_round_ps(__U, __A, 4, 8); -} - -// REQUIRES: asserts -- 2.40.0