]> granicus.if.org Git - libvpx/commitdiff
Corrected optimization of 8x8 DCT code highbitdepth
authorPeter de Rivaz <peter.derivaz@gmail.com>
Thu, 11 Dec 2014 15:54:23 +0000 (15:54 +0000)
committerPeter de Rivaz <peter.derivaz@gmail.com>
Thu, 11 Dec 2014 15:54:23 +0000 (15:54 +0000)
The 8x8 DCT uses a fast version whenever possible.
There was a mistake in the checking code which
meant sometimes the fast version was used when it
was not safe to do so.

Change-Id: I154c84c9e2d836764768a11082947ca30f4b5ab7

vp9/common/x86/vp9_idct_intrin_sse2.c

index c5406b4cc80c22154d74aa1461cd93b2f0f575b1..45fd95b8120dda1a20838edda46c3584cccec2ea 100644 (file)
@@ -4260,7 +4260,7 @@ void vp9_highbd_idct8x8_10_add_sse2(const tran_low_t *input, uint8_t *dest8,
     // N.B. Only first 4 cols contain non-zero coeffs
     max_input = _mm_max_epi16(inptr[0], inptr[1]);
     min_input = _mm_min_epi16(inptr[0], inptr[1]);
-    for (i = 2; i < 4; i++) {
+    for (i = 2; i < 8; i++) {
       max_input = _mm_max_epi16(max_input, inptr[i]);
       min_input = _mm_min_epi16(min_input, inptr[i]);
     }