[AVX-512] Use iPTR instead of i64 in patterns for extract_subvector/insert_subvector...

author Craig Topper <craig.topper@gmail.com>

Tue, 14 Mar 2017 06:40:04 +0000 (06:40 +0000)

committer Craig Topper <craig.topper@gmail.com>

Tue, 14 Mar 2017 06:40:04 +0000 (06:40 +0000)
author Craig Topper <craig.topper@gmail.com>
Tue, 14 Mar 2017 06:40:04 +0000 (06:40 +0000)
committer Craig Topper <craig.topper@gmail.com>
Tue, 14 Mar 2017 06:40:04 +0000 (06:40 +0000)
diff --git a/lib/Target/X86/X86InstrAVX512.td b/lib/Target/X86/X86InstrAVX512.td

index d389ea4313337a5963fcf729fd898b8fff10b9dc..a5e3b7a8e3428616d503865d4efc132fba1db262 100644 (file)
--- a/lib/Target/X86/X86InstrAVX512.td
+++ b/lib/Target/X86/X86InstrAVX512.td
@@ -3303,8 +3303,8 @@ def : Pat<(masked_store addr:$dst, Mask,
               (_.info512.VT (insert_subvector undef,
                                 (_.info256.VT (insert_subvector undef,
                                                   (_.info128.VT _.info128.RC:$src),
-                                                 (i64 0))),
-                               (i64 0)))),
+                                                 (iPTR 0))),
+                               (iPTR 0)))),
            (!cast<Instruction>(InstrStr#mrk) addr:$dst,
                        (i1 (COPY_TO_REGCLASS MaskRC:$mask, VK1WM)),
                        (COPY_TO_REGCLASS _.info128.RC:$src, _.info128.FRC))>;
@@ -3318,7 +3318,7 @@ def : Pat<(_.info128.VT (extract_subvector
                           (_.info512.VT (masked_load addr:$srcAddr, Mask,
                                          (_.info512.VT (bitconvert
                                                         (v16i32 immAllZerosV))))),
-                           (i64 0))),
+                           (iPTR 0))),
            (!cast<Instruction>(InstrStr#rmkz)
                        (i1 (COPY_TO_REGCLASS MaskRC:$mask, VK1WM)),
                        addr:$srcAddr)>;
@@ -3328,9 +3328,9 @@ def : Pat<(_.info128.VT (extract_subvector
                        (_.info512.VT (insert_subvector undef,
                              (_.info256.VT (insert_subvector undef,
                                    (_.info128.VT (X86vzmovl _.info128.RC:$src)),
-                                  (i64 0))),
-                            (i64 0))))),
-                (i64 0))),
+                                  (iPTR 0))),
+                            (iPTR 0))))),
+                (iPTR 0))),
            (!cast<Instruction>(InstrStr#rmk) _.info128.RC:$src,
                        (i1 (COPY_TO_REGCLASS MaskRC:$mask, VK1WM)),
                        addr:$srcAddr)>;
diff --git a/test/CodeGen/X86/avx512-load-store.ll b/test/CodeGen/X86/avx512-load-store.ll

index 92b55eaab1d7a0b99f1e968509c91b11c51fa8be..3295c66c6d420129284a10c989c20dda119d09e0 100644 (file)
--- a/test/CodeGen/X86/avx512-load-store.ll
+++ b/test/CodeGen/X86/avx512-load-store.ll
@@ -111,13 +111,10 @@ define void @test_mm_mask_store_ss(float* %__W, i8 zeroext %__U, <4 x float> %__
  ;
  ; CHECK32-LABEL: test_mm_mask_store_ss:
  ; CHECK32:       # BB#0: # %entry
-; CHECK32-NEXT:    # kill: %XMM0<def> %XMM0<kill> %ZMM0<def>
  ; CHECK32-NEXT:    movl {{[0-9]+}}(%esp), %eax
  ; CHECK32-NEXT:    movzbl {{[0-9]+}}(%esp), %ecx
-; CHECK32-NEXT:    andl $1, %ecx
  ; CHECK32-NEXT:    kmovw %ecx, %k1
-; CHECK32-NEXT:    vmovups %zmm0, (%eax) {%k1}
-; CHECK32-NEXT:    vzeroupper
+; CHECK32-NEXT:    vmovss %xmm0, (%eax) {%k1}
  ; CHECK32-NEXT:    retl
  entry:
    %0 = bitcast float* %__W to <16 x float>*
@@ -138,13 +135,10 @@ define void @test_mm_mask_store_sd(double* %__W, i8 zeroext %__U, <2 x double> %
  ;
  ; CHECK32-LABEL: test_mm_mask_store_sd:
  ; CHECK32:       # BB#0: # %entry
-; CHECK32-NEXT:    # kill: %XMM0<def> %XMM0<kill> %ZMM0<def>
  ; CHECK32-NEXT:    movl {{[0-9]+}}(%esp), %eax
  ; CHECK32-NEXT:    movb {{[0-9]+}}(%esp), %cl
-; CHECK32-NEXT:    andb $1, %cl
  ; CHECK32-NEXT:    kmovw %ecx, %k1
-; CHECK32-NEXT:    vmovupd %zmm0, (%eax) {%k1}
-; CHECK32-NEXT:    vzeroupper
+; CHECK32-NEXT:    vmovsd %xmm0, (%eax) {%k1}
  ; CHECK32-NEXT:    retl
  entry:
    %0 = bitcast double* %__W to <8 x double>*
@@ -166,13 +160,8 @@ define <4 x float> @test_mm_mask_load_ss(<4 x float> %__A, i8 zeroext %__U, floa
  ; CHECK32:       # BB#0: # %entry
  ; CHECK32-NEXT:    movl {{[0-9]+}}(%esp), %eax
  ; CHECK32-NEXT:    movzbl {{[0-9]+}}(%esp), %ecx
-; CHECK32-NEXT:    vxorps %xmm1, %xmm1, %xmm1
-; CHECK32-NEXT:    vmovss {{.*#+}} xmm0 = xmm0[0],xmm1[1,2,3]
-; CHECK32-NEXT:    andl $1, %ecx
  ; CHECK32-NEXT:    kmovw %ecx, %k1
-; CHECK32-NEXT:    vmovups (%eax), %zmm0 {%k1}
-; CHECK32-NEXT:    # kill: %XMM0<def> %XMM0<kill> %ZMM0<kill>
-; CHECK32-NEXT:    vzeroupper
+; CHECK32-NEXT:    vmovss (%eax), %xmm0 {%k1}
  ; CHECK32-NEXT:    retl
  entry:
    %shuffle.i = shufflevector <4 x float> %__A, <4 x float> <float 0.000000e+00, float undef, float undef, float undef>, <4 x i32> <i32 0, i32 4, i32 4, i32 4>
@@ -197,12 +186,8 @@ define <2 x double> @test_mm_mask_load_sd(<2 x double> %__A, i8 zeroext %__U, do
  ; CHECK32:       # BB#0: # %entry
  ; CHECK32-NEXT:    movl {{[0-9]+}}(%esp), %eax
  ; CHECK32-NEXT:    movb {{[0-9]+}}(%esp), %cl
-; CHECK32-NEXT:    vmovq {{.*#+}} xmm0 = xmm0[0],zero
-; CHECK32-NEXT:    andb $1, %cl
  ; CHECK32-NEXT:    kmovw %ecx, %k1
-; CHECK32-NEXT:    vmovupd (%eax), %zmm0 {%k1}
-; CHECK32-NEXT:    # kill: %XMM0<def> %XMM0<kill> %ZMM0<kill>
-; CHECK32-NEXT:    vzeroupper
+; CHECK32-NEXT:    vmovsd (%eax), %xmm0 {%k1}
  ; CHECK32-NEXT:    retl
  entry:
    %shuffle5.i = insertelement <2 x double> %__A, double 0.000000e+00, i32 1
@@ -226,11 +211,8 @@ define <4 x float> @test_mm_maskz_load_ss(i8 zeroext %__U, float* %__W) local_un
  ; CHECK32:       # BB#0: # %entry
  ; CHECK32-NEXT:    movl {{[0-9]+}}(%esp), %eax
  ; CHECK32-NEXT:    movzbl {{[0-9]+}}(%esp), %ecx
-; CHECK32-NEXT:    andl $1, %ecx
  ; CHECK32-NEXT:    kmovw %ecx, %k1
-; CHECK32-NEXT:    vmovups (%eax), %zmm0 {%k1} {z}
-; CHECK32-NEXT:    # kill: %XMM0<def> %XMM0<kill> %ZMM0<kill>
-; CHECK32-NEXT:    vzeroupper
+; CHECK32-NEXT:    vmovss (%eax), %xmm0 {%k1} {z}
  ; CHECK32-NEXT:    retl
  entry:
    %0 = bitcast float* %__W to <16 x float>*
@@ -253,11 +235,8 @@ define <2 x double> @test_mm_maskz_load_sd(i8 zeroext %__U, double* %__W) local_
  ; CHECK32:       # BB#0: # %entry
  ; CHECK32-NEXT:    movl {{[0-9]+}}(%esp), %eax
  ; CHECK32-NEXT:    movb {{[0-9]+}}(%esp), %cl
-; CHECK32-NEXT:    andb $1, %cl
  ; CHECK32-NEXT:    kmovw %ecx, %k1
-; CHECK32-NEXT:    vmovupd (%eax), %zmm0 {%k1} {z}
-; CHECK32-NEXT:    # kill: %XMM0<def> %XMM0<kill> %ZMM0<kill>
-; CHECK32-NEXT:    vzeroupper
+; CHECK32-NEXT:    vmovsd (%eax), %xmm0 {%k1} {z}
  ; CHECK32-NEXT:    retl
  entry:
    %0 = bitcast double* %__W to <8 x double>*
author	Craig Topper <craig.topper@gmail.com>
	Tue, 14 Mar 2017 06:40:04 +0000 (06:40 +0000)
committer	Craig Topper <craig.topper@gmail.com>
	Tue, 14 Mar 2017 06:40:04 +0000 (06:40 +0000)
lib/Target/X86/X86InstrAVX512.td		patch \| blob \| history
test/CodeGen/X86/avx512-load-store.ll		patch \| blob \| history