Code clean of tm_predictor_32x32

author Jian Zhou <zhoujian@google.com>

Fri, 11 Dec 2015 01:25:18 +0000 (17:25 -0800)

committer Jian Zhou <zhoujian@google.com>

Fri, 11 Dec 2015 18:32:08 +0000 (10:32 -0800)
author Jian Zhou <zhoujian@google.com>
Fri, 11 Dec 2015 01:25:18 +0000 (17:25 -0800)
committer Jian Zhou <zhoujian@google.com>
Fri, 11 Dec 2015 18:32:08 +0000 (10:32 -0800)
diff --git a/test/test_intra_pred_speed.cc b/test/test_intra_pred_speed.cc

index 4064ea64524e1e211fcf20f24dbca1c7330a3a54..3e65fecfb6324ced7bcf5656e0d0480f0b38d86b 100644 (file)
--- a/test/test_intra_pred_speed.cc
+++ b/test/test_intra_pred_speed.cc
@@ -337,21 +337,12 @@ INTRA_PRED_TEST(C, TestIntraPred32, vpx_dc_predictor_32x32_c,
                  vpx_d63_predictor_32x32_c, vpx_tm_predictor_32x32_c)
  
  #if HAVE_SSE2 && CONFIG_USE_X86INC
-#if ARCH_X86_64
  INTRA_PRED_TEST(SSE2, TestIntraPred32, vpx_dc_predictor_32x32_sse2,
                  vpx_dc_left_predictor_32x32_sse2,
                  vpx_dc_top_predictor_32x32_sse2,
                  vpx_dc_128_predictor_32x32_sse2, vpx_v_predictor_32x32_sse2,
                  vpx_h_predictor_32x32_sse2, NULL, NULL, NULL, NULL, NULL,
                  NULL, vpx_tm_predictor_32x32_sse2)
-#else
-INTRA_PRED_TEST(SSE2, TestIntraPred32, vpx_dc_predictor_32x32_sse2,
-                vpx_dc_left_predictor_32x32_sse2,
-                vpx_dc_top_predictor_32x32_sse2,
-                vpx_dc_128_predictor_32x32_sse2, vpx_v_predictor_32x32_sse2,
-                vpx_h_predictor_32x32_sse2, NULL, NULL, NULL, NULL, NULL,
-                NULL, NULL)
-#endif  // ARCH_X86_64
  #endif  // HAVE_SSE2 && CONFIG_USE_X86INC
  
  #if HAVE_SSSE3 && CONFIG_USE_X86INC
diff --git a/vpx_dsp/vpx_dsp_rtcd_defs.pl b/vpx_dsp/vpx_dsp_rtcd_defs.pl

index 4d36e2796bb025e89f00b5ab5ef75b7de2dd71a3..798dbf124899ddc0297d5c0fe446d57c6d46707a 100644 (file)
--- a/vpx_dsp/vpx_dsp_rtcd_defs.pl
+++ b/vpx_dsp/vpx_dsp_rtcd_defs.pl
@@ -241,7 +241,7 @@ add_proto qw/void vpx_v_predictor_32x32/, "uint8_t *dst, ptrdiff_t y_stride, con
  specialize qw/vpx_v_predictor_32x32 neon msa/, "$sse2_x86inc";
  
  add_proto qw/void vpx_tm_predictor_32x32/, "uint8_t *dst, ptrdiff_t y_stride, const uint8_t *above, const uint8_t *left";
-specialize qw/vpx_tm_predictor_32x32 neon msa/, "$sse2_x86_64_x86inc";
+specialize qw/vpx_tm_predictor_32x32 neon msa/, "$sse2_x86inc";
  
  add_proto qw/void vpx_dc_predictor_32x32/, "uint8_t *dst, ptrdiff_t y_stride, const uint8_t *above, const uint8_t *left";
  specialize qw/vpx_dc_predictor_32x32 msa neon/, "$sse2_x86inc";
diff --git a/vpx_dsp/x86/intrapred_sse2.asm b/vpx_dsp/x86/intrapred_sse2.asm

index f27b8d94ee87b30f7386126a9d1dcbd9ffaf808a..151bbb37e8a6c97ccd364130699e5d7e2da0e77e 100644 (file)
--- a/vpx_dsp/x86/intrapred_sse2.asm
+++ b/vpx_dsp/x86/intrapred_sse2.asm
@@ -699,9 +699,8 @@ cglobal tm_predictor_16x16, 4, 4, 7, dst, stride, above, left
    jnz .loop
    REP_RET
  
-%if ARCH_X86_64
  INIT_XMM sse2
-cglobal tm_predictor_32x32, 4, 4, 10, dst, stride, above, left
+cglobal tm_predictor_32x32, 4, 4, 8, dst, stride, above, left
    pxor                  m1, m1
    movd                  m2, [aboveq-1]
    mova                  m0, [aboveq]
@@ -722,31 +721,29 @@ cglobal tm_predictor_32x32, 4, 4, 10, dst, stride, above, left
    psubw                 m5, m2
  .loop:
    movd                  m2, [leftq+lineq*2]
-  movd                  m6, [leftq+lineq*2+1]
+  pxor                  m1, m1
    punpcklbw             m2, m1
-  punpcklbw             m6, m1
+  pshuflw               m7, m2, 0x55
    pshuflw               m2, m2, 0x0
-  pshuflw               m6, m6, 0x0
    punpcklqdq            m2, m2
-  punpcklqdq            m6, m6
-  paddw                 m7, m2, m0
-  paddw                 m8, m2, m3
-  paddw                 m9, m2, m4
-  paddw                 m2, m5
-  packuswb              m7, m8
-  packuswb              m9, m2
-  paddw                 m2, m6, m0
-  paddw                 m8, m6, m3
-  mova   [dstq           ], m7
-  paddw                 m7, m6, m4
-  paddw                 m6, m5
-  mova   [dstq        +16], m9
-  packuswb              m2, m8
-  packuswb              m7, m6
-  mova   [dstq+strideq   ], m2
-  mova   [dstq+strideq+16], m7
+  punpcklqdq            m7, m7
+  paddw                 m6, m2, m3
+  paddw                 m1, m2, m0
+  packuswb              m1, m6
+  mova   [dstq           ], m1
+  paddw                 m6, m2, m5
+  paddw                 m1, m2, m4
+  packuswb              m1, m6
+  mova   [dstq+16        ], m1
+  paddw                 m6, m7, m3
+  paddw                 m1, m7, m0
+  packuswb              m1, m6
+  mova   [dstq+strideq   ], m1
+  paddw                 m6, m7, m5
+  paddw                 m1, m7, m4
+  packuswb              m1, m6
+  mova   [dstq+strideq+16], m1
    lea                 dstq, [dstq+strideq*2]
    inc                lineq
    jnz .loop
    REP_RET
-%endif
author	Jian Zhou <zhoujian@google.com>
	Fri, 11 Dec 2015 01:25:18 +0000 (17:25 -0800)
committer	Jian Zhou <zhoujian@google.com>
	Fri, 11 Dec 2015 18:32:08 +0000 (10:32 -0800)
test/test_intra_pred_speed.cc		patch \| blob \| history
vpx_dsp/vpx_dsp_rtcd_defs.pl		patch \| blob \| history
vpx_dsp/x86/intrapred_sse2.asm		patch \| blob \| history