From 5366fbeff832f00bab73860d1a952fd6fae30f83 Mon Sep 17 00:00:00 2001 From: Asaf Badouh Date: Thu, 17 Sep 2015 14:53:37 +0000 Subject: [PATCH] re-apply r.247881 fixed the tests. git-svn-id: https://llvm.org/svn/llvm-project/cfe/trunk@247892 91177308-0d34-0410-b5e6-96231b3b80d8 --- include/clang/Basic/BuiltinsX86.def | 19 +- lib/Headers/avx512dqintrin.h | 536 ++++++++++++++++++++++++++ test/CodeGen/avx512dq-builtins.c | 576 ++++++++++++++++++++++++++++ 3 files changed, 1128 insertions(+), 3 deletions(-) diff --git a/include/clang/Basic/BuiltinsX86.def b/include/clang/Basic/BuiltinsX86.def index b006892186..73e146e8aa 100644 --- a/include/clang/Basic/BuiltinsX86.def +++ b/include/clang/Basic/BuiltinsX86.def @@ -1469,7 +1469,6 @@ TARGET_BUILTIN(__builtin_ia32_vpermt2varq128_mask, "V2LLiV2LLiV2LLiV2LLiUc", "", TARGET_BUILTIN(__builtin_ia32_vpermt2varq128_maskz, "V2LLiV2LLiV2LLiV2LLiUc", "", "avx512vl") TARGET_BUILTIN(__builtin_ia32_vpermt2varq256_mask, "V4LLiV4LLiV4LLiV4LLiUc", "", "avx512vl") TARGET_BUILTIN(__builtin_ia32_vpermt2varq256_maskz, "V4LLiV4LLiV4LLiV4LLiUc", "", "avx512vl") - TARGET_BUILTIN(__builtin_ia32_pmovswb512_mask, "V32cV32sV32cUi", "", "avx512bw") TARGET_BUILTIN(__builtin_ia32_pmovuswb512_mask, "V32cV32sV32cUi", "", "avx512bw") TARGET_BUILTIN(__builtin_ia32_pmovwb512_mask, "V32cV32sV32cUi", "", "avx512bw") @@ -1477,7 +1476,6 @@ TARGET_BUILTIN(__builtin_ia32_punpckhbw512_mask, "V64cV64cV64cV64cULLi", "", "av TARGET_BUILTIN(__builtin_ia32_punpckhwd512_mask, "V32sV32sV32sV32sUi", "", "avx512bw") TARGET_BUILTIN(__builtin_ia32_punpcklbw512_mask, "V64cV64cV64cV64cULLi", "", "avx512bw") TARGET_BUILTIN(__builtin_ia32_punpcklwd512_mask, "V32sV32sV32sV32sUi", "", "avx512bw") - TARGET_BUILTIN(__builtin_ia32_cvtpd2qq128_mask, "V2LLiV2dV2LLiUc", "", "avx512vl,avx512dq") TARGET_BUILTIN(__builtin_ia32_cvtpd2qq256_mask, "V4LLiV4dV4LLiUc", "", "avx512vl,avx512dq") TARGET_BUILTIN(__builtin_ia32_cvtpd2uqq128_mask, "V2LLiV2dV2LLiUc", "", "avx512vl,avx512dq") @@ -1510,7 +1508,6 @@ TARGET_BUILTIN(__builtin_ia32_reducepd128_mask, "V2dV2dIiV2dUc", "", "avx512vl,a TARGET_BUILTIN(__builtin_ia32_reducepd256_mask, "V4dV4dIiV4dUc", "", "avx512vl,avx512dq") TARGET_BUILTIN(__builtin_ia32_reduceps128_mask, "V4fV4fIiV4fUc", "", "avx512vl,avx512dq") TARGET_BUILTIN(__builtin_ia32_reduceps256_mask, "V8fV8fIiV8fUc", "", "avx512vl,avx512dq") - TARGET_BUILTIN(__builtin_ia32_pmaddubsw128_mask, "V8sV16cV16cV8sUc", "", "avx512vl,avx512bw") TARGET_BUILTIN(__builtin_ia32_pmaddubsw256_mask, "V16sV32cV32cV16sUs", "", "avx512vl,avx512bw") TARGET_BUILTIN(__builtin_ia32_pmaddwd128_mask, "V4iV8sV8sV4iUc", "", "avx512vl,avx512bw") @@ -1535,6 +1532,22 @@ TARGET_BUILTIN(__builtin_ia32_punpcklbw128_mask, "V16cV16cV16cV16cUs", "", "avx5 TARGET_BUILTIN(__builtin_ia32_punpcklbw256_mask, "V32cV32cV32cV32cUi", "", "avx512vl,avx512bw") TARGET_BUILTIN(__builtin_ia32_punpcklwd128_mask, "V8sV8sV8sV8sUc", "", "avx512vl,avx512bw") TARGET_BUILTIN(__builtin_ia32_punpcklwd256_mask, "V16sV16sV16sV16sUs", "", "avx512vl,avx512bw") +BUILTIN(__builtin_ia32_cvtpd2qq512_mask, "V8LLiV8dV8LLiUcIi", "") +BUILTIN(__builtin_ia32_cvtpd2uqq512_mask, "V8LLiV8dV8LLiUcIi", "") +BUILTIN(__builtin_ia32_cvtps2qq512_mask, "V8LLiV8fV8LLiUcIi", "") +BUILTIN(__builtin_ia32_cvtps2uqq512_mask, "V8LLiV8fV8LLiUcIi", "") +BUILTIN(__builtin_ia32_cvtqq2pd512_mask, "V8dV8LLiV8dUcIi", "") +BUILTIN(__builtin_ia32_cvtqq2ps512_mask, "V8fV8LLiV8fUcIi", "") +BUILTIN(__builtin_ia32_cvttpd2qq512_mask, "V8LLiV8dV8LLiUcIi", "") +BUILTIN(__builtin_ia32_cvttpd2uqq512_mask, "V8LLiV8dV8LLiUcIi", "") +BUILTIN(__builtin_ia32_cvttps2qq512_mask, "V8LLiV8fV8LLiUcIi", "") +BUILTIN(__builtin_ia32_cvttps2uqq512_mask, "V8LLiV8fV8LLiUcIi", "") +BUILTIN(__builtin_ia32_cvtuqq2pd512_mask, "V8dV8LLiV8dUcIi", "") +BUILTIN(__builtin_ia32_cvtuqq2ps512_mask, "V8fV8LLiV8fUcIi", "") +BUILTIN(__builtin_ia32_rangepd512_mask, "V8dV8dV8dIiV8dUcIi", "") +BUILTIN(__builtin_ia32_rangeps512_mask, "V16fV16fV16fIiV16fUsIi", "") +BUILTIN(__builtin_ia32_reducepd512_mask, "V8dV8dIiV8dUcIi", "") +BUILTIN(__builtin_ia32_reduceps512_mask, "V16fV16fIiV16fUsIi", "") #undef BUILTIN #undef TARGET_BUILTIN diff --git a/lib/Headers/avx512dqintrin.h b/lib/Headers/avx512dqintrin.h index 8a69f7ffbf..afee4903ba 100644 --- a/lib/Headers/avx512dqintrin.h +++ b/lib/Headers/avx512dqintrin.h @@ -237,6 +237,542 @@ _mm512_maskz_andnot_ps (__mmask16 __U, __m512 __A, __m512 __B) { (__mmask16) __U); } +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_cvtpd_epi64 (__m512d __A) { + return (__m512i) __builtin_ia32_cvtpd2qq512_mask ((__v8df) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) -1, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_mask_cvtpd_epi64 (__m512i __W, __mmask8 __U, __m512d __A) { + return (__m512i) __builtin_ia32_cvtpd2qq512_mask ((__v8df) __A, + (__v8di) __W, + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_maskz_cvtpd_epi64 (__mmask8 __U, __m512d __A) { + return (__m512i) __builtin_ia32_cvtpd2qq512_mask ((__v8df) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +#define _mm512_cvt_roundpd_epi64(__A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvtpd2qq512_mask ((__v8df) __A, \ + (__v8di) _mm512_setzero_si512(), (__mmask8) -1, __R);}) + +#define _mm512_mask_cvt_roundpd_epi64(__W, __U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvtpd2qq512_mask ((__v8df) __A, \ + (__v8di) __W, (__mmask8) __U, __R);}) + +#define _mm512_maskz_cvt_roundpd_epi64(__U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvtpd2qq512_mask ((__v8df) __A, \ + (__v8di) _mm512_setzero_si512(), (__mmask8) __U, __R); }) + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_cvtpd_epu64 (__m512d __A) { + return (__m512i) __builtin_ia32_cvtpd2uqq512_mask ((__v8df) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) -1, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_mask_cvtpd_epu64 (__m512i __W, __mmask8 __U, __m512d __A) { + return (__m512i) __builtin_ia32_cvtpd2uqq512_mask ((__v8df) __A, + (__v8di) __W, + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_maskz_cvtpd_epu64 (__mmask8 __U, __m512d __A) { + return (__m512i) __builtin_ia32_cvtpd2uqq512_mask ((__v8df) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +#define _mm512_cvt_roundpd_epu64(__A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvtpd2uqq512_mask ((__v8df) __A, \ + (__v8di) _mm512_setzero_si512(), (__mmask8) -1, __R);}) + +#define _mm512_mask_cvt_roundpd_epu64(__W, __U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvtpd2uqq512_mask ((__v8df) __A, \ + (__v8di) __W, (__mmask8) __U, __R);}) + +#define _mm512_maskz_cvt_roundpd_epu64(__U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvtpd2uqq512_mask ((__v8df) __A, \ + (__v8di) _mm512_setzero_si512(), (__mmask8) __U, __R);}) + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_cvtps_epi64 (__m256 __A) { + return (__m512i) __builtin_ia32_cvtps2qq512_mask ((__v8sf) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) -1, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_mask_cvtps_epi64 (__m512i __W, __mmask8 __U, __m256 __A) { + return (__m512i) __builtin_ia32_cvtps2qq512_mask ((__v8sf) __A, + (__v8di) __W, + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_maskz_cvtps_epi64 (__mmask8 __U, __m256 __A) { + return (__m512i) __builtin_ia32_cvtps2qq512_mask ((__v8sf) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +#define _mm512_cvt_roundps_epi64(__A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvtps2qq512_mask ((__v8sf) __A, \ + (__v8di) _mm512_setzero_si512(), (__mmask8) -1, __R);}) + +#define _mm512_mask_cvt_roundps_epi64(__W, __U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvtps2qq512_mask ((__v8sf) __A, \ + (__v8di) __W, (__mmask8) __U, __R);}) + +#define _mm512_maskz_cvt_roundps_epi64(__U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvtps2qq512_mask ((__v8sf) __A, \ + (__v8di) _mm512_setzero_si512(), (__mmask8) __U, __R);}) + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_cvtps_epu64 (__m256 __A) { + return (__m512i) __builtin_ia32_cvtps2uqq512_mask ((__v8sf) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) -1, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_mask_cvtps_epu64 (__m512i __W, __mmask8 __U, __m256 __A) { + return (__m512i) __builtin_ia32_cvtps2uqq512_mask ((__v8sf) __A, + (__v8di) __W, + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_maskz_cvtps_epu64 (__mmask8 __U, __m256 __A) { + return (__m512i) __builtin_ia32_cvtps2uqq512_mask ((__v8sf) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +#define _mm512_cvt_roundps_epu64(__A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvtps2uqq512_mask ((__v8sf) __A, \ + (__v8di) _mm512_setzero_si512(), (__mmask8) -1, __R);}) + +#define _mm512_mask_cvt_roundps_epu64(__W, __U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvtps2uqq512_mask ((__v8sf) __A, \ + (__v8di) __W, (__mmask8) __U, __R);}) + +#define _mm512_maskz_cvt_roundps_epu64(__U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvtps2uqq512_mask ((__v8sf) __A, \ + (__v8di) _mm512_setzero_si512(), (__mmask8) __U, __R);}) + + +static __inline__ __m512d __DEFAULT_FN_ATTRS +_mm512_cvtepi64_pd (__m512i __A) { + return (__m512d) __builtin_ia32_cvtqq2pd512_mask ((__v8di) __A, + (__v8df) _mm512_setzero_pd(), + (__mmask8) -1, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512d __DEFAULT_FN_ATTRS +_mm512_mask_cvtepi64_pd (__m512d __W, __mmask8 __U, __m512i __A) { + return (__m512d) __builtin_ia32_cvtqq2pd512_mask ((__v8di) __A, + (__v8df) __W, + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512d __DEFAULT_FN_ATTRS +_mm512_maskz_cvtepi64_pd (__mmask8 __U, __m512i __A) { + return (__m512d) __builtin_ia32_cvtqq2pd512_mask ((__v8di) __A, + (__v8df) _mm512_setzero_pd(), + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +#define _mm512_cvt_roundepi64_pd(__A, __R) __extension__ ({ \ + (__m512d) __builtin_ia32_cvtqq2pd512_mask ((__v8di) __A, \ + (__v8df) _mm512_setzero_pd(), (__mmask8) -1, __R);}) + +#define _mm512_mask_cvt_roundepi64_pd(__W, __U, __A, __R) __extension__ ({ \ + (__m512d) __builtin_ia32_cvtqq2pd512_mask ((__v8di) __A, \ + (__v8df) __W, (__mmask8) __U, __R);}) + +#define _mm512_maskz_cvt_roundepi64_pd(__U, __A, __R) __extension__ ({ \ + (__m512d) __builtin_ia32_cvtqq2pd512_mask ((__v8di) __A, \ + (__v8df) _mm512_setzero_pd(), (__mmask8) __U, __R);}) + +static __inline__ __m256 __DEFAULT_FN_ATTRS +_mm512_cvtepi64_ps (__m512i __A) { + return (__m256) __builtin_ia32_cvtqq2ps512_mask ((__v8di) __A, + (__v8sf) _mm256_setzero_ps(), + (__mmask8) -1, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m256 __DEFAULT_FN_ATTRS +_mm512_mask_cvtepi64_ps (__m256 __W, __mmask8 __U, __m512i __A) { + return (__m256) __builtin_ia32_cvtqq2ps512_mask ((__v8di) __A, + (__v8sf) __W, + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m256 __DEFAULT_FN_ATTRS +_mm512_maskz_cvtepi64_ps (__mmask8 __U, __m512i __A) { + return (__m256) __builtin_ia32_cvtqq2ps512_mask ((__v8di) __A, + (__v8sf) _mm256_setzero_ps(), + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +#define _mm512_cvt_roundepi64_ps(__A, __R) __extension__ ({ \ + (__m256) __builtin_ia32_cvtqq2ps512_mask ((__v8di) __A, \ + (__v8sf) _mm256_setzero_ps(), (__mmask8) -1, __R);}) + +#define _mm512_mask_cvt_roundepi64_ps(__W, __U, __A, __R) __extension__ ({ \ + (__m256) __builtin_ia32_cvtqq2ps512_mask ((__v8di) __A, \ + (__v8sf) __W, (__mmask8) __U, __R);}) + +#define _mm512_maskz_cvt_roundepi64_ps(__U, __A, __R) __extension__ ({ \ + (__m256) __builtin_ia32_cvtqq2ps512_mask ((__v8di) __A, \ + (__v8sf) _mm256_setzero_ps(), (__mmask8) __U, __R);}) + + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_cvttpd_epi64 (__m512d __A) { + return (__m512i) __builtin_ia32_cvttpd2qq512_mask ((__v8df) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) -1, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_mask_cvttpd_epi64 (__m512i __W, __mmask8 __U, __m512d __A) { + return (__m512i) __builtin_ia32_cvttpd2qq512_mask ((__v8df) __A, + (__v8di) __W, + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_maskz_cvttpd_epi64 (__mmask8 __U, __m512d __A) { + return (__m512i) __builtin_ia32_cvttpd2qq512_mask ((__v8df) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +#define _mm512_cvtt_roundpd_epi64(__A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvttpd2qq512_mask ((__v8df) __A, \ + (__v8di) _mm512_setzero_si512(), (__mmask8) -1, __R);}) + +#define _mm512_mask_cvtt_roundpd_epi64(__W, __U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvttpd2qq512_mask ((__v8df) __A, \ + (__v8di) __W, (__mmask8) __U, __R);}) + +#define _mm512_maskz_cvtt_roundpd_epi64(__U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvttpd2qq512_mask ((__v8df) __A, \ + (__v8di) _mm512_setzero_si512(), (__mmask8) __U, __R);}) + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_cvttpd_epu64 (__m512d __A) { + return (__m512i) __builtin_ia32_cvttpd2uqq512_mask ((__v8df) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) -1, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_mask_cvttpd_epu64 (__m512i __W, __mmask8 __U, __m512d __A) { + return (__m512i) __builtin_ia32_cvttpd2uqq512_mask ((__v8df) __A, + (__v8di) __W, + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_maskz_cvttpd_epu64 (__mmask8 __U, __m512d __A) { + return (__m512i) __builtin_ia32_cvttpd2uqq512_mask ((__v8df) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +#define _mm512_cvtt_roundpd_epu64(__A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvttpd2uqq512_mask ((__v8df) __A, \ + (__v8di) _mm512_setzero_si512(), (__mmask8) -1, __R);}) + +#define _mm512_mask_cvtt_roundpd_epu64(__W, __U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvttpd2uqq512_mask ((__v8df) __A, \ + (__v8di) __W, (__mmask8) __U, __R);}) + +#define _mm512_maskz_cvtt_roundpd_epu64(__U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvttpd2uqq512_mask ((__v8df) __A, \ + (__v8di) _mm512_setzero_si512(), (__mmask8) __U, __R);}) + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_cvttps_epi64 (__m256 __A) { + return (__m512i) __builtin_ia32_cvttps2qq512_mask ((__v8sf) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) -1, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_mask_cvttps_epi64 (__m512i __W, __mmask8 __U, __m256 __A) { + return (__m512i) __builtin_ia32_cvttps2qq512_mask ((__v8sf) __A, + (__v8di) __W, + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_maskz_cvttps_epi64 (__mmask8 __U, __m256 __A) { + return (__m512i) __builtin_ia32_cvttps2qq512_mask ((__v8sf) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +#define _mm512_cvtt_roundps_epi64(__A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvttps2qq512_mask ((__v8sf) __A, \ + (__v8di) _mm512_setzero_si512(), (__mmask8) -1, __R);}) + +#define _mm512_mask_cvtt_roundps_epi64(__W, __U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvttps2qq512_mask ((__v8sf) __A, \ + (__v8di) __W, (__mmask8) __U, __R);}) + +#define _mm512_maskz_cvtt_roundps_epi64(__U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvttps2qq512_mask ((__v8sf) __A, \ + (__v8di) _mm512_setzero_si512(), (__mmask8) __U, __R);}) + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_cvttps_epu64 (__m256 __A) { + return (__m512i) __builtin_ia32_cvttps2uqq512_mask ((__v8sf) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) -1, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_mask_cvttps_epu64 (__m512i __W, __mmask8 __U, __m256 __A) { + return (__m512i) __builtin_ia32_cvttps2uqq512_mask ((__v8sf) __A, + (__v8di) __W, + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512i __DEFAULT_FN_ATTRS +_mm512_maskz_cvttps_epu64 (__mmask8 __U, __m256 __A) { + return (__m512i) __builtin_ia32_cvttps2uqq512_mask ((__v8sf) __A, + (__v8di) _mm512_setzero_si512(), + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +#define _mm512_cvtt_roundps_epu64(__A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvttps2uqq512_mask ((__v8sf) __A, \ + (__v8di) _mm512_setzero_si512(),(__mmask8) -1, __R);}) + +#define _mm512_mask_cvtt_roundps_epu64(__W, __U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvttps2uqq512_mask ((__v8sf) __A, \ + (__v8di) __W, (__mmask8) __U, __R);}) + +#define _mm512_maskz_cvtt_roundps_epu64(__U, __A, __R) __extension__ ({ \ + (__m512i) __builtin_ia32_cvttps2uqq512_mask ((__v8sf) __A, \ + (__v8di) _mm512_setzero_si512(), (__mmask8) __U, __R);}) + +static __inline__ __m512d __DEFAULT_FN_ATTRS +_mm512_cvtepu64_pd (__m512i __A) { + return (__m512d) __builtin_ia32_cvtuqq2pd512_mask ((__v8di) __A, + (__v8df) _mm512_setzero_pd(), + (__mmask8) -1, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512d __DEFAULT_FN_ATTRS +_mm512_mask_cvtepu64_pd (__m512d __W, __mmask8 __U, __m512i __A) { + return (__m512d) __builtin_ia32_cvtuqq2pd512_mask ((__v8di) __A, + (__v8df) __W, + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m512d __DEFAULT_FN_ATTRS +_mm512_maskz_cvtepu64_pd (__mmask8 __U, __m512i __A) { + return (__m512d) __builtin_ia32_cvtuqq2pd512_mask ((__v8di) __A, + (__v8df) _mm512_setzero_pd(), + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +#define _mm512_cvt_roundepu64_pd(__A, __R) __extension__ ({ \ + (__m512d) __builtin_ia32_cvtuqq2pd512_mask ((__v8di) __A, \ + (__v8df) _mm512_setzero_pd(), (__mmask8) -1, __R);}) + +#define _mm512_mask_cvt_roundepu64_pd(__W, __U, __A, __R) __extension__ ({ \ + (__m512d) __builtin_ia32_cvtuqq2pd512_mask ((__v8di) __A, \ + (__v8df) __W, (__mmask8) __U, __R);}) + + +#define _mm512_maskz_cvt_roundepu64_pd(__U, __A, __R) __extension__ ({ \ + (__m512d) __builtin_ia32_cvtuqq2pd512_mask ((__v8di) __A, \ + (__v8df) _mm512_setzero_pd(), (__mmask8) __U, __R);}) + + +static __inline__ __m256 __DEFAULT_FN_ATTRS +_mm512_cvtepu64_ps (__m512i __A) { + return (__m256) __builtin_ia32_cvtuqq2ps512_mask ((__v8di) __A, + (__v8sf) _mm256_setzero_ps(), + (__mmask8) -1, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m256 __DEFAULT_FN_ATTRS +_mm512_mask_cvtepu64_ps (__m256 __W, __mmask8 __U, __m512i __A) { + return (__m256) __builtin_ia32_cvtuqq2ps512_mask ((__v8di) __A, + (__v8sf) __W, + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m256 __DEFAULT_FN_ATTRS +_mm512_maskz_cvtepu64_ps (__mmask8 __U, __m512i __A) { + return (__m256) __builtin_ia32_cvtuqq2ps512_mask ((__v8di) __A, + (__v8sf) _mm256_setzero_ps(), + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +#define _mm512_cvt_roundepu64_ps(__A, __R) __extension__ ({ \ + (__m256) __builtin_ia32_cvtuqq2ps512_mask ((__v8di) __A, \ + (__v8sf) _mm256_setzero_ps(), (__mmask8) -1, __R);}) + +#define _mm512_mask_cvt_roundepu64_ps(__W, __U, __A, __R) __extension__ ({ \ + (__m256) __builtin_ia32_cvtuqq2ps512_mask ((__v8di) __A, \ + (__v8sf) __W, (__mmask8) __U, __R);}) + +#define _mm512_maskz_cvt_roundepu64_ps(__U, __A, __R) __extension__ ({ \ + (__m256) __builtin_ia32_cvtuqq2ps512_mask ((__v8di) __A, \ + (__v8sf) _mm256_setzero_ps(), (__mmask8) __U, __R);}) + +#define _mm512_range_pd(__A, __B, __C) __extension__ ({ \ + (__m512d) __builtin_ia32_rangepd512_mask ((__v8df) __A, (__v8df) __B, __C,\ + (__v8df) _mm512_setzero_pd(), (__mmask8) -1, \ + _MM_FROUND_CUR_DIRECTION);}) + +#define _mm512_mask_range_pd(__W, __U, __A, __B, __C) __extension__ ({ \ + (__m512d) __builtin_ia32_rangepd512_mask ((__v8df) __A, (__v8df) __B, __C,\ + (__v8df) __W, (__mmask8) __U, _MM_FROUND_CUR_DIRECTION);}) + +#define _mm512_maskz_range_pd(__U, __A, __B, __C) __extension__ ({ \ + (__m512d) __builtin_ia32_rangepd512_mask ((__v8df) __A, (__v8df) __B, __C, \ + (__v8df) _mm512_setzero_pd(), (__mmask8) __U, \ + _MM_FROUND_CUR_DIRECTION);}) + +#define _mm512_range_round_pd(__A, __B, __C, __R) __extension__ ({ \ + (__m512d) __builtin_ia32_rangepd512_mask ((__v8df) __A, (__v8df) __B, __C, \ + (__v8df) _mm512_setzero_pd(), (__mmask8) -1, __R);}) + +#define _mm512_mask_range_round_pd(__W, __U, __A, __B, __C, __R) __extension__ ({ \ + (__m512d) __builtin_ia32_rangepd512_mask ((__v8df) __A, (__v8df) __B, __C, \ + (__v8df) __W, (__mmask8) __U, __R);}) + +#define _mm512_maskz_range_round_pd(__U, __A, __B, __C, __R) __extension__ ({ \ + (__m512d) __builtin_ia32_rangepd512_mask ((__v8df) __A, (__v8df) __B, __C, \ + (__v8df) _mm512_setzero_pd(), (__mmask8) __U, __R);}) + +#define _mm512_range_ps(__A, __B, __C) __extension__ ({ \ + (__m512) __builtin_ia32_rangeps512_mask ((__v16sf) __A, (__v16sf) __B, __C, \ + (__v16sf) _mm512_setzero_ps(), (__mmask16) -1, \ + _MM_FROUND_CUR_DIRECTION);}) + +#define _mm512_mask_range_ps(__W, __U, __A, __B, __C) __extension__ ({ \ + (__m512) __builtin_ia32_rangeps512_mask ((__v16sf) __A, (__v16sf) __B, \ + __C, (__v16sf) __W, (__mmask16) __U, _MM_FROUND_CUR_DIRECTION);}) + +#define _mm512_maskz_range_ps(__U, __A, __B, __C) __extension__ ({ \ + (__m512) __builtin_ia32_rangeps512_mask ((__v16sf) __A,(__v16sf) __B, \ + __C, (__v16sf) _mm512_setzero_ps(), (__mmask16) __U, \ + _MM_FROUND_CUR_DIRECTION);}) + +#define _mm512_range_round_ps(__A, __B, __C, __R) __extension__ ({ \ + (__m512) __builtin_ia32_rangeps512_mask ((__v16sf) __A, (__v16sf) __B, \ + __C, (__v16sf) _mm512_setzero_ps(), (__mmask16) -1, __R);}) + +#define _mm512_mask_range_round_ps(__W, __U, __A, __B, __C, __R) __extension__ ({ \ + (__m512) __builtin_ia32_rangeps512_mask ((__v16sf) __A, (__v16sf) __B, \ + __C, (__v16sf) __W, (__mmask16) __U, __R);}) + +#define _mm512_maskz_range_round_ps(__U, __A, __B, __C, __R) __extension__ ({ \ + (__m512) __builtin_ia32_rangeps512_mask ((__v16sf) __A, (__v16sf) __B, \ + __C, (__v16sf) _mm512_setzero_ps(), (__mmask16) __U, __R);}) + +#define _mm512_reduce_pd(__A, __B) __extension__ ({ \ + (__m512d) __builtin_ia32_reducepd512_mask ((__v8df) __A, __B, \ + (__v8df) _mm512_setzero_pd(), (__mmask8) -1, _MM_FROUND_CUR_DIRECTION);}) + +#define _mm512_mask_reduce_pd(__W, __U, __A, __B) __extension__ ({ \ + (__m512d) __builtin_ia32_reducepd512_mask ((__v8df) __A, __B, \ + (__v8df) __W,(__mmask8) __U, _MM_FROUND_CUR_DIRECTION);}) + +#define _mm512_maskz_reduce_pd(__U, __A, __B) __extension__ ({ \ + (__m512d) __builtin_ia32_reducepd512_mask ((__v8df) __A, __B, \ + (__v8df) _mm512_setzero_pd(), (__mmask8) __U, _MM_FROUND_CUR_DIRECTION);}) + +#define _mm512_reduce_ps(__A, __B) __extension__ ({ \ + (__m512) __builtin_ia32_reduceps512_mask ((__v16sf) __A, __B, \ + (__v16sf) _mm512_setzero_ps(), (__mmask16) -1, _MM_FROUND_CUR_DIRECTION);}) + +#define _mm512_mask_reduce_ps(__W, __U, __A, __B) __extension__ ({ \ + (__m512) __builtin_ia32_reduceps512_mask ((__v16sf) __A, __B, \ + (__v16sf) __W, (__mmask16) __U, _MM_FROUND_CUR_DIRECTION);}) + +#define _mm512_maskz_reduce_ps(__U, __A, __B) __extension__ ({ \ + (__m512) __builtin_ia32_reduceps512_mask ((__v16sf) __A, __B, \ + (__v16sf) _mm512_setzero_ps(), (__mmask16) __U, _MM_FROUND_CUR_DIRECTION);}) + +#define _mm512_reduce_round_pd(__A, __B, __R) __extension__ ({\ + (__m512d) __builtin_ia32_reducepd512_mask ((__v8df) __A, __B, \ + (__v8df) _mm512_setzero_pd(), (__mmask8) -1, __R);}) + +#define _mm512_mask_reduce_round_pd(__W, __U, __A, __B, __R) __extension__ ({\ + (__m512d) __builtin_ia32_reducepd512_mask ((__v8df) __A, __B, \ + (__v8df) __W,(__mmask8) __U, __R);}) + +#define _mm512_maskz_reduce_round_pd(__U, __A, __B, __R) __extension__ ({\ + (__m512d) __builtin_ia32_reducepd512_mask ((__v8df) __A, __B, \ + (__v8df) _mm512_setzero_pd(), (__mmask8) __U, __R);}) + +#define _mm512_reduce_round_ps(__A, __B, __R) __extension__ ({\ + (__m512) __builtin_ia32_reduceps512_mask ((__v16sf) __A, __B, \ + (__v16sf) _mm512_setzero_ps(), (__mmask16) -1, __R);}) + +#define _mm512_mask_reduce_round_ps(__W, __U, __A, __B, __R) __extension__ ({\ + (__m512) __builtin_ia32_reduceps512_mask ((__v16sf) __A, __B, \ + (__v16sf) __W, (__mmask16) __U, __R);}) + +#define _mm512_maskz_reduce_round_ps(__U, __A, __B, __R) __extension__ ({\ + (__m512) __builtin_ia32_reduceps512_mask ((__v16sf) __A, __B, \ + (__v16sf) _mm512_setzero_ps(), (__mmask16) __U, __R);}) + #undef __DEFAULT_FN_ATTRS #endif diff --git a/test/CodeGen/avx512dq-builtins.c b/test/CodeGen/avx512dq-builtins.c index 098083765b..264ccee4ba 100644 --- a/test/CodeGen/avx512dq-builtins.c +++ b/test/CodeGen/avx512dq-builtins.c @@ -163,3 +163,579 @@ __m512 test_mm512_maskz_andnot_ps (__mmask16 __U, __m512 __A, __m512 __B) { return (__m512) _mm512_maskz_andnot_ps(__U, __A, __B); } +__m512i test_mm512_cvtpd_epi64(__m512d __A) { + // CHECK-LABEL: @test_mm512_cvtpd_epi64 + // CHECK: @llvm.x86.avx512.mask.cvtpd2qq.512 + return _mm512_cvtpd_epi64(__A); +} + +__m512i test_mm512_mask_cvtpd_epi64(__m512i __W, __mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_mask_cvtpd_epi64 + // CHECK: @llvm.x86.avx512.mask.cvtpd2qq.512 + return _mm512_mask_cvtpd_epi64(__W, __U, __A); +} + +__m512i test_mm512_maskz_cvtpd_epi64(__mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_maskz_cvtpd_epi64 + // CHECK: @llvm.x86.avx512.mask.cvtpd2qq.512 + return _mm512_maskz_cvtpd_epi64(__U, __A); +} + +__m512i test_mm512_cvt_roundpd_epi64(__m512d __A) { + // CHECK-LABEL: @test_mm512_cvt_roundpd_epi64 + // CHECK: @llvm.x86.avx512.mask.cvtpd2qq.512 + return _mm512_cvt_roundpd_epi64(__A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_mask_cvt_roundpd_epi64(__m512i __W, __mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_mask_cvt_roundpd_epi64 + // CHECK: @llvm.x86.avx512.mask.cvtpd2qq.512 + return _mm512_mask_cvt_roundpd_epi64(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_maskz_cvt_roundpd_epi64(__mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_maskz_cvt_roundpd_epi64 + // CHECK: @llvm.x86.avx512.mask.cvtpd2qq.512 + return _mm512_maskz_cvt_roundpd_epi64(__U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_cvtpd_epu64(__m512d __A) { + // CHECK-LABEL: @test_mm512_cvtpd_epu64 + // CHECK: @llvm.x86.avx512.mask.cvtpd2uqq.512 + return _mm512_cvtpd_epu64(__A); +} + +__m512i test_mm512_mask_cvtpd_epu64(__m512i __W, __mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_mask_cvtpd_epu64 + // CHECK: @llvm.x86.avx512.mask.cvtpd2uqq.512 + return _mm512_mask_cvtpd_epu64(__W, __U, __A); +} + +__m512i test_mm512_maskz_cvtpd_epu64(__mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_maskz_cvtpd_epu64 + // CHECK: @llvm.x86.avx512.mask.cvtpd2uqq.512 + return _mm512_maskz_cvtpd_epu64(__U, __A); +} + +__m512i test_mm512_cvt_roundpd_epu64(__m512d __A) { + // CHECK-LABEL: @test_mm512_cvt_roundpd_epu64 + // CHECK: @llvm.x86.avx512.mask.cvtpd2uqq.512 + return _mm512_cvt_roundpd_epu64(__A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_mask_cvt_roundpd_epu64(__m512i __W, __mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_mask_cvt_roundpd_epu64 + // CHECK: @llvm.x86.avx512.mask.cvtpd2uqq.512 + return _mm512_mask_cvt_roundpd_epu64(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_maskz_cvt_roundpd_epu64(__mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_maskz_cvt_roundpd_epu64 + // CHECK: @llvm.x86.avx512.mask.cvtpd2uqq.512 + return _mm512_maskz_cvt_roundpd_epu64(__U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_cvtps_epi64(__m256 __A) { + // CHECK-LABEL: @test_mm512_cvtps_epi64 + // CHECK: @llvm.x86.avx512.mask.cvtps2qq.512 + return _mm512_cvtps_epi64(__A); +} + +__m512i test_mm512_mask_cvtps_epi64(__m512i __W, __mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_mask_cvtps_epi64 + // CHECK: @llvm.x86.avx512.mask.cvtps2qq.512 + return _mm512_mask_cvtps_epi64(__W, __U, __A); +} + +__m512i test_mm512_maskz_cvtps_epi64(__mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_maskz_cvtps_epi64 + // CHECK: @llvm.x86.avx512.mask.cvtps2qq.512 + return _mm512_maskz_cvtps_epi64(__U, __A); +} + +__m512i test_mm512_cvt_roundps_epi64(__m256 __A) { + // CHECK-LABEL: @test_mm512_cvt_roundps_epi64 + // CHECK: @llvm.x86.avx512.mask.cvtps2qq.512 + return _mm512_cvt_roundps_epi64(__A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_mask_cvt_roundps_epi64(__m512i __W, __mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_mask_cvt_roundps_epi64 + // CHECK: @llvm.x86.avx512.mask.cvtps2qq.512 + return _mm512_mask_cvt_roundps_epi64(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_maskz_cvt_roundps_epi64(__mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_maskz_cvt_roundps_epi64 + // CHECK: @llvm.x86.avx512.mask.cvtps2qq.512 + return _mm512_maskz_cvt_roundps_epi64(__U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_cvtps_epu64(__m256 __A) { + // CHECK-LABEL: @test_mm512_cvtps_epu64 + // CHECK: @llvm.x86.avx512.mask.cvtps2uqq.512 + return _mm512_cvtps_epu64(__A); +} + +__m512i test_mm512_mask_cvtps_epu64(__m512i __W, __mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_mask_cvtps_epu64 + // CHECK: @llvm.x86.avx512.mask.cvtps2uqq.512 + return _mm512_mask_cvtps_epu64(__W, __U, __A); +} + +__m512i test_mm512_maskz_cvtps_epu64(__mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_maskz_cvtps_epu64 + // CHECK: @llvm.x86.avx512.mask.cvtps2uqq.512 + return _mm512_maskz_cvtps_epu64(__U, __A); +} + +__m512i test_mm512_cvt_roundps_epu64(__m256 __A) { + // CHECK-LABEL: @test_mm512_cvt_roundps_epu64 + // CHECK: @llvm.x86.avx512.mask.cvtps2uqq.512 + return _mm512_cvt_roundps_epu64(__A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_mask_cvt_roundps_epu64(__m512i __W, __mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_mask_cvt_roundps_epu64 + // CHECK: @llvm.x86.avx512.mask.cvtps2uqq.512 + return _mm512_mask_cvt_roundps_epu64(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_maskz_cvt_roundps_epu64(__mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_maskz_cvt_roundps_epu64 + // CHECK: @llvm.x86.avx512.mask.cvtps2uqq.512 + return _mm512_maskz_cvt_roundps_epu64(__U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512d test_mm512_cvtepi64_pd(__m512i __A) { + // CHECK-LABEL: @test_mm512_cvtepi64_pd + // CHECK: @llvm.x86.avx512.mask.cvtqq2pd.512 + return _mm512_cvtepi64_pd(__A); +} + +__m512d test_mm512_mask_cvtepi64_pd(__m512d __W, __mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_mask_cvtepi64_pd + // CHECK: @llvm.x86.avx512.mask.cvtqq2pd.512 + return _mm512_mask_cvtepi64_pd(__W, __U, __A); +} + +__m512d test_mm512_maskz_cvtepi64_pd(__mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_maskz_cvtepi64_pd + // CHECK: @llvm.x86.avx512.mask.cvtqq2pd.512 + return _mm512_maskz_cvtepi64_pd(__U, __A); +} + +__m512d test_mm512_cvt_roundepi64_pd(__m512i __A) { + // CHECK-LABEL: @test_mm512_cvt_roundepi64_pd + // CHECK: @llvm.x86.avx512.mask.cvtqq2pd.512 + return _mm512_cvt_roundepi64_pd(__A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512d test_mm512_mask_cvt_roundepi64_pd(__m512d __W, __mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_mask_cvt_roundepi64_pd + // CHECK: @llvm.x86.avx512.mask.cvtqq2pd.512 + return _mm512_mask_cvt_roundepi64_pd(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512d test_mm512_maskz_cvt_roundepi64_pd(__mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_maskz_cvt_roundepi64_pd + // CHECK: @llvm.x86.avx512.mask.cvtqq2pd.512 + return _mm512_maskz_cvt_roundepi64_pd(__U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m256 test_mm512_cvtepi64_ps(__m512i __A) { + // CHECK-LABEL: @test_mm512_cvtepi64_ps + // CHECK: @llvm.x86.avx512.mask.cvtqq2ps.512 + return _mm512_cvtepi64_ps(__A); +} + +__m256 test_mm512_mask_cvtepi64_ps(__m256 __W, __mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_mask_cvtepi64_ps + // CHECK: @llvm.x86.avx512.mask.cvtqq2ps.512 + return _mm512_mask_cvtepi64_ps(__W, __U, __A); +} + +__m256 test_mm512_maskz_cvtepi64_ps(__mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_maskz_cvtepi64_ps + // CHECK: @llvm.x86.avx512.mask.cvtqq2ps.512 + return _mm512_maskz_cvtepi64_ps(__U, __A); +} + +__m256 test_mm512_cvt_roundepi64_ps(__m512i __A) { + // CHECK-LABEL: @test_mm512_cvt_roundepi64_ps + // CHECK: @llvm.x86.avx512.mask.cvtqq2ps.512 + return _mm512_cvt_roundepi64_ps(__A, _MM_FROUND_TO_NEAREST_INT); +} + +__m256 test_mm512_mask_cvt_roundepi64_ps(__m256 __W, __mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_mask_cvt_roundepi64_ps + // CHECK: @llvm.x86.avx512.mask.cvtqq2ps.512 + return _mm512_mask_cvt_roundepi64_ps(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m256 test_mm512_maskz_cvt_roundepi64_ps(__mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_maskz_cvt_roundepi64_ps + // CHECK: @llvm.x86.avx512.mask.cvtqq2ps.512 + return _mm512_maskz_cvt_roundepi64_ps(__U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_cvttpd_epi64(__m512d __A) { + // CHECK-LABEL: @test_mm512_cvttpd_epi64 + // CHECK: @llvm.x86.avx512.mask.cvttpd2qq.512 + return _mm512_cvttpd_epi64(__A); +} + +__m512i test_mm512_mask_cvttpd_epi64(__m512i __W, __mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_mask_cvttpd_epi64 + // CHECK: @llvm.x86.avx512.mask.cvttpd2qq.512 + return _mm512_mask_cvttpd_epi64(__W, __U, __A); +} + +__m512i test_mm512_maskz_cvttpd_epi64(__mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_maskz_cvttpd_epi64 + // CHECK: @llvm.x86.avx512.mask.cvttpd2qq.512 + return _mm512_maskz_cvttpd_epi64(__U, __A); +} + +__m512i test_mm512_cvtt_roundpd_epi64(__m512d __A) { + // CHECK-LABEL: @test_mm512_cvtt_roundpd_epi64 + // CHECK: @llvm.x86.avx512.mask.cvttpd2qq.512 + return _mm512_cvtt_roundpd_epi64(__A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_mask_cvtt_roundpd_epi64(__m512i __W, __mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_mask_cvtt_roundpd_epi64 + // CHECK: @llvm.x86.avx512.mask.cvttpd2qq.512 + return _mm512_mask_cvtt_roundpd_epi64(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_maskz_cvtt_roundpd_epi64(__mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_maskz_cvtt_roundpd_epi64 + // CHECK: @llvm.x86.avx512.mask.cvttpd2qq.512 + return _mm512_maskz_cvtt_roundpd_epi64(__U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_cvttpd_epu64(__m512d __A) { + // CHECK-LABEL: @test_mm512_cvttpd_epu64 + // CHECK: @llvm.x86.avx512.mask.cvttpd2uqq.512 + return _mm512_cvttpd_epu64(__A); +} + +__m512i test_mm512_mask_cvttpd_epu64(__m512i __W, __mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_mask_cvttpd_epu64 + // CHECK: @llvm.x86.avx512.mask.cvttpd2uqq.512 + return _mm512_mask_cvttpd_epu64(__W, __U, __A); +} + +__m512i test_mm512_maskz_cvttpd_epu64(__mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_maskz_cvttpd_epu64 + // CHECK: @llvm.x86.avx512.mask.cvttpd2uqq.512 + return _mm512_maskz_cvttpd_epu64(__U, __A); +} + +__m512i test_mm512_cvtt_roundpd_epu64(__m512d __A) { + // CHECK-LABEL: @test_mm512_cvtt_roundpd_epu64 + // CHECK: @llvm.x86.avx512.mask.cvttpd2uqq.512 + return _mm512_cvtt_roundpd_epu64(__A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_mask_cvtt_roundpd_epu64(__m512i __W, __mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_mask_cvtt_roundpd_epu64 + // CHECK: @llvm.x86.avx512.mask.cvttpd2uqq.512 + return _mm512_mask_cvtt_roundpd_epu64(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_maskz_cvtt_roundpd_epu64(__mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_maskz_cvtt_roundpd_epu64 + // CHECK: @llvm.x86.avx512.mask.cvttpd2uqq.512 + return _mm512_maskz_cvtt_roundpd_epu64(__U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_cvttps_epi64(__m256 __A) { + // CHECK-LABEL: @test_mm512_cvttps_epi64 + // CHECK: @llvm.x86.avx512.mask.cvttps2qq.512 + return _mm512_cvttps_epi64(__A); +} + +__m512i test_mm512_mask_cvttps_epi64(__m512i __W, __mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_mask_cvttps_epi64 + // CHECK: @llvm.x86.avx512.mask.cvttps2qq.512 + return _mm512_mask_cvttps_epi64(__W, __U, __A); +} + +__m512i test_mm512_maskz_cvttps_epi64(__mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_maskz_cvttps_epi64 + // CHECK: @llvm.x86.avx512.mask.cvttps2qq.512 + return _mm512_maskz_cvttps_epi64(__U, __A); +} + +__m512i test_mm512_cvtt_roundps_epi64(__m256 __A) { + // CHECK-LABEL: @test_mm512_cvtt_roundps_epi64 + // CHECK: @llvm.x86.avx512.mask.cvttps2qq.512 + return _mm512_cvtt_roundps_epi64(__A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_mask_cvtt_roundps_epi64(__m512i __W, __mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_mask_cvtt_roundps_epi64 + // CHECK: @llvm.x86.avx512.mask.cvttps2qq.512 + return _mm512_mask_cvtt_roundps_epi64(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_maskz_cvtt_roundps_epi64(__mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_maskz_cvtt_roundps_epi64 + // CHECK: @llvm.x86.avx512.mask.cvttps2qq.512 + return _mm512_maskz_cvtt_roundps_epi64(__U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_cvttps_epu64(__m256 __A) { + // CHECK-LABEL: @test_mm512_cvttps_epu64 + // CHECK: @llvm.x86.avx512.mask.cvttps2uqq.512 + return _mm512_cvttps_epu64(__A); +} + +__m512i test_mm512_mask_cvttps_epu64(__m512i __W, __mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_mask_cvttps_epu64 + // CHECK: @llvm.x86.avx512.mask.cvttps2uqq.512 + return _mm512_mask_cvttps_epu64(__W, __U, __A); +} + +__m512i test_mm512_maskz_cvttps_epu64(__mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_maskz_cvttps_epu64 + // CHECK: @llvm.x86.avx512.mask.cvttps2uqq.512 + return _mm512_maskz_cvttps_epu64(__U, __A); +} + +__m512i test_mm512_cvtt_roundps_epu64(__m256 __A) { + // CHECK-LABEL: @test_mm512_cvtt_roundps_epu64 + // CHECK: @llvm.x86.avx512.mask.cvttps2uqq.512 + return _mm512_cvtt_roundps_epu64(__A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_mask_cvtt_roundps_epu64(__m512i __W, __mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_mask_cvtt_roundps_epu64 + // CHECK: @llvm.x86.avx512.mask.cvttps2uqq.512 + return _mm512_mask_cvtt_roundps_epu64(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512i test_mm512_maskz_cvtt_roundps_epu64(__mmask8 __U, __m256 __A) { + // CHECK-LABEL: @test_mm512_maskz_cvtt_roundps_epu64 + // CHECK: @llvm.x86.avx512.mask.cvttps2uqq.512 + return _mm512_maskz_cvtt_roundps_epu64(__U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512d test_mm512_cvtepu64_pd(__m512i __A) { + // CHECK-LABEL: @test_mm512_cvtepu64_pd + // CHECK: @llvm.x86.avx512.mask.cvtuqq2pd.512 + return _mm512_cvtepu64_pd(__A); +} + +__m512d test_mm512_mask_cvtepu64_pd(__m512d __W, __mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_mask_cvtepu64_pd + // CHECK: @llvm.x86.avx512.mask.cvtuqq2pd.512 + return _mm512_mask_cvtepu64_pd(__W, __U, __A); +} + +__m512d test_mm512_maskz_cvtepu64_pd(__mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_maskz_cvtepu64_pd + // CHECK: @llvm.x86.avx512.mask.cvtuqq2pd.512 + return _mm512_maskz_cvtepu64_pd(__U, __A); +} + +__m512d test_mm512_cvt_roundepu64_pd(__m512i __A) { + // CHECK-LABEL: @test_mm512_cvt_roundepu64_pd + // CHECK: @llvm.x86.avx512.mask.cvtuqq2pd.512 + return _mm512_cvt_roundepu64_pd(__A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512d test_mm512_mask_cvt_roundepu64_pd(__m512d __W, __mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_mask_cvt_roundepu64_pd + // CHECK: @llvm.x86.avx512.mask.cvtuqq2pd.512 + return _mm512_mask_cvt_roundepu64_pd(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512d test_mm512_maskz_cvt_roundepu64_pd(__mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_maskz_cvt_roundepu64_pd + // CHECK: @llvm.x86.avx512.mask.cvtuqq2pd.512 + return _mm512_maskz_cvt_roundepu64_pd(__U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m256 test_mm512_cvtepu64_ps(__m512i __A) { + // CHECK-LABEL: @test_mm512_cvtepu64_ps + // CHECK: @llvm.x86.avx512.mask.cvtuqq2ps.512 + return _mm512_cvtepu64_ps(__A); +} + +__m256 test_mm512_mask_cvtepu64_ps(__m256 __W, __mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_mask_cvtepu64_ps + // CHECK: @llvm.x86.avx512.mask.cvtuqq2ps.512 + return _mm512_mask_cvtepu64_ps(__W, __U, __A); +} + +__m256 test_mm512_maskz_cvtepu64_ps(__mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_maskz_cvtepu64_ps + // CHECK: @llvm.x86.avx512.mask.cvtuqq2ps.512 + return _mm512_maskz_cvtepu64_ps(__U, __A); +} + +__m256 test_mm512_cvt_roundepu64_ps(__m512i __A) { + // CHECK-LABEL: @test_mm512_cvt_roundepu64_ps + // CHECK: @llvm.x86.avx512.mask.cvtuqq2ps.512 + return _mm512_cvt_roundepu64_ps(__A, _MM_FROUND_TO_NEAREST_INT); +} + +__m256 test_mm512_mask_cvt_roundepu64_ps(__m256 __W, __mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_mask_cvt_roundepu64_ps + // CHECK: @llvm.x86.avx512.mask.cvtuqq2ps.512 + return _mm512_mask_cvt_roundepu64_ps(__W, __U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m256 test_mm512_maskz_cvt_roundepu64_ps(__mmask8 __U, __m512i __A) { + // CHECK-LABEL: @test_mm512_maskz_cvt_roundepu64_ps + // CHECK: @llvm.x86.avx512.mask.cvtuqq2ps.512 + return _mm512_maskz_cvt_roundepu64_ps(__U, __A, _MM_FROUND_TO_NEAREST_INT); +} + +__m512d test_mm512_range_pd(__m512d __A, __m512d __B) { + // CHECK-LABEL: @test_mm512_range_pd + // CHECK: @llvm.x86.avx512.mask.range.pd.512 + return _mm512_range_pd(__A, __B, 4); +} + +__m512d test_mm512_mask_range_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512d __B) { + // CHECK-LABEL: @test_mm512_mask_range_pd + // CHECK: @llvm.x86.avx512.mask.range.pd.512 + return _mm512_mask_range_pd(__W, __U, __A, __B, 4); +} + +__m512d test_mm512_maskz_range_pd(__mmask8 __U, __m512d __A, __m512d __B) { + // CHECK-LABEL: @test_mm512_maskz_range_pd + // CHECK: @llvm.x86.avx512.mask.range.pd.512 + return _mm512_maskz_range_pd(__U, __A, __B, 4); +} + +__m512d test_mm512_range_round_pd(__m512d __A, __m512d __B) { + // CHECK-LABEL: @test_mm512_range_round_pd + // CHECK: @llvm.x86.avx512.mask.range.pd.512 + return _mm512_range_round_pd(__A, __B, 4, 8); +} + +__m512d test_mm512_mask_range_round_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512d __B) { + // CHECK-LABEL: @test_mm512_mask_range_round_pd + // CHECK: @llvm.x86.avx512.mask.range.pd.512 + return _mm512_mask_range_round_pd(__W, __U, __A, __B, 4, 8); +} + +__m512d test_mm512_maskz_range_round_pd(__mmask8 __U, __m512d __A, __m512d __B) { + // CHECK-LABEL: @test_mm512_maskz_range_round_pd + // CHECK: @llvm.x86.avx512.mask.range.pd.512 + return _mm512_maskz_range_round_pd(__U, __A, __B, 4, 8); +} + +__m512 test_mm512_range_ps(__m512 __A, __m512 __B) { + // CHECK-LABEL: @test_mm512_range_ps + // CHECK: @llvm.x86.avx512.mask.range.ps.512 + return _mm512_range_ps(__A, __B, 4); +} + +__m512 test_mm512_mask_range_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B) { + // CHECK-LABEL: @test_mm512_mask_range_ps + // CHECK: @llvm.x86.avx512.mask.range.ps.512 + return _mm512_mask_range_ps(__W, __U, __A, __B, 4); +} + +__m512 test_mm512_maskz_range_ps(__mmask16 __U, __m512 __A, __m512 __B) { + // CHECK-LABEL: @test_mm512_maskz_range_ps + // CHECK: @llvm.x86.avx512.mask.range.ps.512 + return _mm512_maskz_range_ps(__U, __A, __B, 4); +} + +__m512 test_mm512_range_round_ps(__m512 __A, __m512 __B) { + // CHECK-LABEL: @test_mm512_range_round_ps + // CHECK: @llvm.x86.avx512.mask.range.ps.512 + return _mm512_range_round_ps(__A, __B, 4, 8); +} + +__m512 test_mm512_mask_range_round_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B) { + // CHECK-LABEL: @test_mm512_mask_range_round_ps + // CHECK: @llvm.x86.avx512.mask.range.ps.512 + return _mm512_mask_range_round_ps(__W, __U, __A, __B, 4, 8); +} + +__m512 test_mm512_maskz_range_round_ps(__mmask16 __U, __m512 __A, __m512 __B) { + // CHECK-LABEL: @test_mm512_maskz_range_round_ps + // CHECK: @llvm.x86.avx512.mask.range.ps.512 + return _mm512_maskz_range_round_ps(__U, __A, __B, 4, 8); +} + +__m512d test_mm512_reduce_pd(__m512d __A) { + // CHECK-LABEL: @test_mm512_reduce_pd + // CHECK: @llvm.x86.avx512.mask.reduce.pd.512 + return _mm512_reduce_pd(__A, 4); +} + +__m512d test_mm512_mask_reduce_pd(__m512d __W, __mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_mask_reduce_pd + // CHECK: @llvm.x86.avx512.mask.reduce.pd.512 + return _mm512_mask_reduce_pd(__W, __U, __A, 4); +} + +__m512d test_mm512_maskz_reduce_pd(__mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_maskz_reduce_pd + // CHECK: @llvm.x86.avx512.mask.reduce.pd.512 + return _mm512_maskz_reduce_pd(__U, __A, 4); +} + +__m512 test_mm512_reduce_ps(__m512 __A) { + // CHECK-LABEL: @test_mm512_reduce_ps + // CHECK: @llvm.x86.avx512.mask.reduce.ps.512 + return _mm512_reduce_ps(__A, 4); +} + +__m512 test_mm512_mask_reduce_ps(__m512 __W, __mmask16 __U, __m512 __A) { + // CHECK-LABEL: @test_mm512_mask_reduce_ps + // CHECK: @llvm.x86.avx512.mask.reduce.ps.512 + return _mm512_mask_reduce_ps(__W, __U, __A, 4); +} + +__m512 test_mm512_maskz_reduce_ps(__mmask16 __U, __m512 __A) { + // CHECK-LABEL: @test_mm512_maskz_reduce_ps + // CHECK: @llvm.x86.avx512.mask.reduce.ps.512 + return _mm512_maskz_reduce_ps(__U, __A, 4); +} + +__m512d test_mm512_reduce_round_pd(__m512d __A) { + // CHECK-LABEL: @test_mm512_reduce_round_pd + // CHECK: @llvm.x86.avx512.mask.reduce.pd.512 + return _mm512_reduce_round_pd(__A, 4, 8); +} + +__m512d test_mm512_mask_reduce_round_pd(__m512d __W, __mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_mask_reduce_round_pd + // CHECK: @llvm.x86.avx512.mask.reduce.pd.512 + return _mm512_mask_reduce_round_pd(__W, __U, __A, 4, 8); +} + +__m512d test_mm512_maskz_reduce_round_pd(__mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_maskz_reduce_round_pd + // CHECK: @llvm.x86.avx512.mask.reduce.pd.512 + return _mm512_maskz_reduce_round_pd(__U, __A, 4, 8); +} + +__m512 test_mm512_reduce_round_ps(__m512 __A) { + // CHECK-LABEL: @test_mm512_reduce_round_ps + // CHECK: @llvm.x86.avx512.mask.reduce.ps.512 + return _mm512_reduce_round_ps(__A, 4, 8); +} + +__m512 test_mm512_mask_reduce_round_ps(__m512 __W, __mmask16 __U, __m512 __A) { + // CHECK-LABEL: @test_mm512_mask_reduce_round_ps + // CHECK: @llvm.x86.avx512.mask.reduce.ps.512 + return _mm512_mask_reduce_round_ps(__W, __U, __A, 4, 8); +} + +__m512 test_mm512_maskz_reduce_round_ps(__mmask16 __U, __m512 __A) { + // CHECK-LABEL: @test_mm512_maskz_reduce_round_ps + // CHECK: @llvm.x86.avx512.mask.reduce.ps.512 + return _mm512_maskz_reduce_round_ps(__U, __A, 4, 8); +} + -- 2.40.0