From: Michael Zuckerman Date: Tue, 3 May 2016 11:05:24 +0000 (+0000) Subject: [Clang][AVX512][Builtin] Adding intrinsics for vcvttpd2udq instruction set X-Git-Url: https://granicus.if.org/sourcecode?a=commitdiff_plain;h=231ca7b7efc4f19af0c3cdec2a77fd8f1ca94097;p=clang [Clang][AVX512][Builtin] Adding intrinsics for vcvttpd2udq instruction set Differential Revision: http://reviews.llvm.org/D19768 git-svn-id: https://llvm.org/svn/llvm-project/cfe/trunk@268373 91177308-0d34-0410-b5e6-96231b3b80d8 --- diff --git a/lib/Headers/avx512fintrin.h b/lib/Headers/avx512fintrin.h index 3ab7aa5435..aca2364468 100644 --- a/lib/Headers/avx512fintrin.h +++ b/lib/Headers/avx512fintrin.h @@ -5229,6 +5229,54 @@ _mm512_mask_testn_epi64_mask (__mmask8 __U, __m512i __A, __m512i __B) (__v8di) __B, __U); } +#define _mm512_cvtt_roundpd_epu32( __A, __R) __extension__ ({ \ +__builtin_ia32_cvttpd2udq512_mask ((__v8df)( __A),\ + (__v8si)\ + _mm256_undefined_si256 (),\ + (__mmask8) -1,( __R));\ +}) + +#define _mm512_mask_cvtt_roundpd_epu32( __W, __U, __A, __R) __extension__ ({ \ +__builtin_ia32_cvttpd2udq512_mask ((__v8df)( __A),\ + (__v8si)( __W),\ + (__mmask8)( __U),( __R));\ +}) + +#define _mm512_maskz_cvtt_roundpd_epu32( __U, __A, __R) __extension__ ({ \ +__builtin_ia32_cvttpd2udq512_mask ((__v8df)( __A),\ + (__v8si)\ + _mm256_setzero_si256 (),\ + (__mmask8)( __U),( __R));\ +}) + +static __inline__ __m256i __DEFAULT_FN_ATTRS +_mm512_cvttpd_epu32 (__m512d __A) +{ + return (__m256i) __builtin_ia32_cvttpd2udq512_mask ((__v8df) __A, + (__v8si) + _mm256_undefined_si256 (), + (__mmask8) -1, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m256i __DEFAULT_FN_ATTRS +_mm512_mask_cvttpd_epu32 (__m256i __W, __mmask8 __U, __m512d __A) +{ + return (__m256i) __builtin_ia32_cvttpd2udq512_mask ((__v8df) __A, + (__v8si) __W, + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} + +static __inline__ __m256i __DEFAULT_FN_ATTRS +_mm512_maskz_cvttpd_epu32 (__mmask8 __U, __m512d __A) +{ + return (__m256i) __builtin_ia32_cvttpd2udq512_mask ((__v8df) __A, + (__v8si) + _mm256_setzero_si256 (), + (__mmask8) __U, + _MM_FROUND_CUR_DIRECTION); +} static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_unpackhi_epi32 (__m512i __W, __mmask16 __U, __m512i __A, diff --git a/test/CodeGen/avx512f-builtins.c b/test/CodeGen/avx512f-builtins.c index b2926b904a..ffc54c747d 100644 --- a/test/CodeGen/avx512f-builtins.c +++ b/test/CodeGen/avx512f-builtins.c @@ -5552,3 +5552,39 @@ void test_mm512_mask_compressstoreu_epi32(void *__P, __mmask16 __U, __m512i __A) // CHECK: @llvm.x86.avx512.mask.compress.store.d.512 return _mm512_mask_compressstoreu_epi32(__P, __U, __A); } + +__m256i test_mm512_cvtt_roundpd_epu32(__m512d __A) { + // CHECK-LABEL: @test_mm512_cvtt_roundpd_epu32 + // CHECK: @llvm.x86.avx512.mask.cvttpd2udq.512 + return _mm512_cvtt_roundpd_epu32(__A, _MM_FROUND_CUR_DIRECTION); +} + +__m256i test_mm512_mask_cvtt_roundpd_epu32(__m256i __W, __mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_mask_cvtt_roundpd_epu32 + // CHECK: @llvm.x86.avx512.mask.cvttpd2udq.512 + return _mm512_mask_cvtt_roundpd_epu32(__W, __U, __A, _MM_FROUND_CUR_DIRECTION); +} + +__m256i test_mm512_maskz_cvtt_roundpd_epu32(__mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_maskz_cvtt_roundpd_epu32 + // CHECK: @llvm.x86.avx512.mask.cvttpd2udq.512 + return _mm512_maskz_cvtt_roundpd_epu32(__U, __A, _MM_FROUND_CUR_DIRECTION); +} + +__m256i test_mm512_cvttpd_epu32(__m512d __A) { + // CHECK-LABEL: @test_mm512_cvttpd_epu32 + // CHECK: @llvm.x86.avx512.mask.cvttpd2udq.512 + return _mm512_cvttpd_epu32(__A); +} + +__m256i test_mm512_mask_cvttpd_epu32(__m256i __W, __mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_mask_cvttpd_epu32 + // CHECK: @llvm.x86.avx512.mask.cvttpd2udq.512 + return _mm512_mask_cvttpd_epu32(__W, __U, __A); +} + +__m256i test_mm512_maskz_cvttpd_epu32(__mmask8 __U, __m512d __A) { + // CHECK-LABEL: @test_mm512_maskz_cvttpd_epu32 + // CHECK: @llvm.x86.avx512.mask.cvttpd2udq.512 + return _mm512_maskz_cvttpd_epu32(__U, __A); +}