Change eob threshold for partial inverse 8x8 2D-DCT to 12

author Jingning Han <jingning@google.com>

Thu, 8 May 2014 16:42:26 +0000 (09:42 -0700)

committer Jingning Han <jingning@google.com>

Thu, 8 May 2014 16:48:58 +0000 (09:48 -0700)
author Jingning Han <jingning@google.com>
Thu, 8 May 2014 16:42:26 +0000 (09:42 -0700)
committer Jingning Han <jingning@google.com>
Thu, 8 May 2014 16:48:58 +0000 (09:48 -0700)
diff --git a/test/partial_idct_test.cc b/test/partial_idct_test.cc

index 8849ce6260a4f80df0f7c41c33b40cb3b12109f4..e95fc6790ee798509732d411b95cdd511099ccb0 100644 (file)
--- a/test/partial_idct_test.cc
+++ b/test/partial_idct_test.cc
@@ -132,8 +132,8 @@ INSTANTIATE_TEST_CASE_P(
                     &vp9_idct16x16_1_add_c,
                     TX_16X16, 1),
          make_tuple(&vp9_idct8x8_64_add_c,
-                   &vp9_idct8x8_10_add_c,
-                   TX_8X8, 10),
+                   &vp9_idct8x8_12_add_c,
+                   TX_8X8, 12),
          make_tuple(&vp9_idct8x8_64_add_c,
                     &vp9_idct8x8_1_add_c,
                     TX_8X8, 1),
@@ -154,8 +154,8 @@ INSTANTIATE_TEST_CASE_P(
                     &vp9_idct16x16_1_add_neon,
                     TX_16X16, 1),
          make_tuple(&vp9_idct8x8_64_add_c,
-                   &vp9_idct8x8_10_add_neon,
-                   TX_8X8, 10),
+                   &vp9_idct8x8_12_add_neon,
+                   TX_8X8, 12),
          make_tuple(&vp9_idct8x8_64_add_c,
                     &vp9_idct8x8_1_add_neon,
                     TX_8X8, 1),
@@ -181,8 +181,8 @@ INSTANTIATE_TEST_CASE_P(
                     &vp9_idct16x16_1_add_sse2,
                     TX_16X16, 1),
          make_tuple(&vp9_idct8x8_64_add_c,
-                   &vp9_idct8x8_10_add_sse2,
-                   TX_8X8, 10),
+                   &vp9_idct8x8_12_add_sse2,
+                   TX_8X8, 12),
          make_tuple(&vp9_idct8x8_64_add_c,
                     &vp9_idct8x8_1_add_sse2,
                     TX_8X8, 1),
diff --git a/vp9/common/arm/neon/vp9_idct8x8_add_neon.asm b/vp9/common/arm/neon/vp9_idct8x8_add_neon.asm

index 54764008bdf853eb716e10e91194f3a674876b7c..ab5bb69202a4d0aff4b2f7cba6f5894d278288ba 100644 (file)
--- a/vp9/common/arm/neon/vp9_idct8x8_add_neon.asm
+++ b/vp9/common/arm/neon/vp9_idct8x8_add_neon.asm
@@ -9,7 +9,7 @@
  ;
  
      EXPORT  |vp9_idct8x8_64_add_neon|
-    EXPORT  |vp9_idct8x8_10_add_neon|
+    EXPORT  |vp9_idct8x8_12_add_neon|
      ARM
      REQUIRE8
      PRESERVE8
@@ -310,13 +310,13 @@
      bx              lr
      ENDP  ; |vp9_idct8x8_64_add_neon|
  
-;void vp9_idct8x8_10_add_neon(int16_t *input, uint8_t *dest, int dest_stride)
+;void vp9_idct8x8_12_add_neon(int16_t *input, uint8_t *dest, int dest_stride)
  ;
  ; r0  int16_t input
  ; r1  uint8_t *dest
  ; r2  int dest_stride)
  
-|vp9_idct8x8_10_add_neon| PROC
+|vp9_idct8x8_12_add_neon| PROC
      push            {r4-r9}
      vpush           {d8-d15}
      vld1.s16        {q8,q9}, [r0]!
@@ -514,6 +514,6 @@
      vpop            {d8-d15}
      pop             {r4-r9}
      bx              lr
-    ENDP  ; |vp9_idct8x8_10_add_neon|
+    ENDP  ; |vp9_idct8x8_12_add_neon|
  
      END
diff --git a/vp9/common/mips/dspr2/vp9_itrans8_dspr2.c b/vp9/common/mips/dspr2/vp9_itrans8_dspr2.c

index acccaea6d630569c43cf03765e0dcc3d12c4b775..fc44ffa311d62f871a080010c6d439af78974e45 100644 (file)
--- a/vp9/common/mips/dspr2/vp9_itrans8_dspr2.c
+++ b/vp9/common/mips/dspr2/vp9_itrans8_dspr2.c
@@ -617,7 +617,7 @@ void vp9_iht8x8_64_add_dspr2(const int16_t *input, uint8_t *dest,
    }
  }
  
-void vp9_idct8x8_10_add_dspr2(const int16_t *input, uint8_t *dest,
+void vp9_idct8x8_12_add_dspr2(const int16_t *input, uint8_t *dest,
                                int dest_stride) {
    DECLARE_ALIGNED(32, int16_t, out[8 * 8]);
    int16_t *outptr = out;
diff --git a/vp9/common/vp9_idct.c b/vp9/common/vp9_idct.c

index 20b78bfedb19f5ffb246d62521c6ff4002235838..856d41e7001e597591994e2bf6b19d6de521ae6e 100644 (file)
--- a/vp9/common/vp9_idct.c
+++ b/vp9/common/vp9_idct.c
@@ -421,7 +421,7 @@ void vp9_iht8x8_64_add_c(const int16_t *input, uint8_t *dest, int stride,
    }
  }
  
-void vp9_idct8x8_10_add_c(const int16_t *input, uint8_t *dest, int stride) {
+void vp9_idct8x8_12_add_c(const int16_t *input, uint8_t *dest, int stride) {
    int16_t out[8 * 8] = { 0 };
    int16_t *outptr = out;
    int i, j;
@@ -1348,8 +1348,8 @@ void vp9_idct8x8_add(const int16_t *input, uint8_t *dest, int stride, int eob) {
    if (eob == 1)
      // DC only DCT coefficient
      vp9_idct8x8_1_add(input, dest, stride);
-  else if (eob <= 10)
-    vp9_idct8x8_10_add(input, dest, stride);
+  else if (eob <= 12)
+    vp9_idct8x8_12_add(input, dest, stride);
    else
      vp9_idct8x8_64_add(input, dest, stride);
  }
diff --git a/vp9/common/vp9_rtcd_defs.pl b/vp9/common/vp9_rtcd_defs.pl

index aacabb117b386ba33fb1261625c0b1f0aec01512..11990265d1a6399782af50fc99c1e2e9760548bf 100644 (file)
--- a/vp9/common/vp9_rtcd_defs.pl
+++ b/vp9/common/vp9_rtcd_defs.pl
@@ -312,8 +312,8 @@ specialize qw/vp9_idct8x8_1_add sse2 neon dspr2/;
  add_proto qw/void vp9_idct8x8_64_add/, "const int16_t *input, uint8_t *dest, int dest_stride";
  specialize qw/vp9_idct8x8_64_add sse2 neon dspr2/, "$ssse3_x86_64";
  
-add_proto qw/void vp9_idct8x8_10_add/, "const int16_t *input, uint8_t *dest, int dest_stride";
-specialize qw/vp9_idct8x8_10_add sse2 neon dspr2/, "$ssse3_x86_64";
+add_proto qw/void vp9_idct8x8_12_add/, "const int16_t *input, uint8_t *dest, int dest_stride";
+specialize qw/vp9_idct8x8_12_add sse2 neon dspr2/, "$ssse3_x86_64";
  
  add_proto qw/void vp9_idct16x16_1_add/, "const int16_t *input, uint8_t *dest, int dest_stride";
  specialize qw/vp9_idct16x16_1_add sse2 neon dspr2/;
diff --git a/vp9/common/x86/vp9_idct_intrin_sse2.c b/vp9/common/x86/vp9_idct_intrin_sse2.c

index 13a5b5a82a0ffd92d2a4c938f69d36097a198beb..0231726dcffea528e7cb42ecc765c7d53e78ab91 100644 (file)
--- a/vp9/common/x86/vp9_idct_intrin_sse2.c
+++ b/vp9/common/x86/vp9_idct_intrin_sse2.c
@@ -995,7 +995,7 @@ void vp9_iht8x8_64_add_sse2(const int16_t *input, uint8_t *dest, int stride,
    RECON_AND_STORE(dest, in[7]);
  }
  
-void vp9_idct8x8_10_add_sse2(const int16_t *input, uint8_t *dest, int stride) {
+void vp9_idct8x8_12_add_sse2(const int16_t *input, uint8_t *dest, int stride) {
    const __m128i zero = _mm_setzero_si128();
    const __m128i rounding = _mm_set1_epi32(DCT_CONST_ROUNDING);
    const __m128i final_rounding = _mm_set1_epi16(1<<4);
diff --git a/vp9/common/x86/vp9_idct_ssse3.asm b/vp9/common/x86/vp9_idct_ssse3.asm

index 7448011799bd1740886091733cbe40fcc674101f..2c1060710cc0c0d552af193907b9b6b7e25a6f15 100644 (file)
--- a/vp9/common/x86/vp9_idct_ssse3.asm
+++ b/vp9/common/x86/vp9_idct_ssse3.asm
@@ -185,7 +185,7 @@ cglobal idct8x8_64_add, 3, 5, 13, input, output, stride
    RET
  
  ; inverse 8x8 2D-DCT transform with only first 10 coeffs non-zero
-cglobal idct8x8_10_add, 3, 5, 13, input, output, stride
+cglobal idct8x8_12_add, 3, 5, 13, input, output, stride
    mova       m8, [pd_8192]
    mova      m11, [pw_16]
    mova      m12, [pw_11585x2]
author	Jingning Han <jingning@google.com>
	Thu, 8 May 2014 16:42:26 +0000 (09:42 -0700)
committer	Jingning Han <jingning@google.com>
	Thu, 8 May 2014 16:48:58 +0000 (09:48 -0700)
test/partial_idct_test.cc		patch \| blob \| history
vp9/common/arm/neon/vp9_idct8x8_add_neon.asm		patch \| blob \| history
vp9/common/mips/dspr2/vp9_itrans8_dspr2.c		patch \| blob \| history
vp9/common/vp9_idct.c		patch \| blob \| history
vp9/common/vp9_rtcd_defs.pl		patch \| blob \| history
vp9/common/x86/vp9_idct_intrin_sse2.c		patch \| blob \| history
vp9/common/x86/vp9_idct_ssse3.asm		patch \| blob \| history