More CABAC and CAVLC optimizations

author Fiona Glaser <fiona@x264.com>

Mon, 4 May 2009 11:19:28 +0000 (04:19 -0700)

committer Fiona Glaser <fiona@x264.com>

Sun, 10 May 2009 08:16:29 +0000 (01:16 -0700)
author Fiona Glaser <fiona@x264.com>
Mon, 4 May 2009 11:19:28 +0000 (04:19 -0700)
committer Fiona Glaser <fiona@x264.com>
Sun, 10 May 2009 08:16:29 +0000 (01:16 -0700)
diff --git a/common/cabac.c b/common/cabac.c

index 65d143f5b363e107815841bf9335eb12f95f8acb..ad05203c5885e64191a29419d78b317e7597c93c 100644 (file)
--- a/common/cabac.c
+++ b/common/cabac.c
@@ -858,6 +858,9 @@ static inline void x264_cabac_encode_renorm( x264_cabac_t *cb )
      x264_cabac_putbyte( cb );
  }
  
+/* Making custom versions of this function, even in asm, for the cases where
+ * b is known to be 0 or 1, proved to be somewhat useful on x86_32 with GCC 3.4
+ * but nearly useless with GCC 4.3 and worse than useless on x86_64. */
  void x264_cabac_encode_decision_c( x264_cabac_t *cb, int i_ctx, int b )
  {
      int i_state = cb->state[i_ctx];
diff --git a/encoder/cabac.c b/encoder/cabac.c

index 188e0488005994a255f5fa7dc7af4bb474390cb6..ff6b7d28b38dd542c71c88dc30ac6b25c9e171dd 100644 (file)
--- a/encoder/cabac.c
+++ b/encoder/cabac.c
@@ -525,17 +525,17 @@ static int ALWAYS_INLINE x264_cabac_mb_cbf_ctxidxinc( x264_t *h, int i_cat, int
              i_nzb = h->mb.cache.non_zero_count[x264_scan8[i_idx] - 8];
              i_nza &= 0x7f + (b_intra << 7);
              i_nzb &= 0x7f + (b_intra << 7);
-            return 4*i_cat + 2*!!i_nzb + !!i_nza;
+            return 85 + 4*i_cat + 2*!!i_nzb + !!i_nza;
          case DCT_LUMA_DC:
              i_nza = (h->mb.cache.i_cbp_left >> 8) & 1;
              i_nzb = (h->mb.cache.i_cbp_top  >> 8) & 1;
-            return 4*i_cat + 2*i_nzb + i_nza;
+            return 85 + 4*i_cat + 2*i_nzb + i_nza;
          case DCT_CHROMA_DC:
              /* no need to test skip/pcm */
              i_idx -= 25;
              i_nza = h->mb.cache.i_cbp_left != -1 ? (h->mb.cache.i_cbp_left >> (9 + i_idx)) & 1 : b_intra;
              i_nzb = h->mb.cache.i_cbp_top  != -1 ? (h->mb.cache.i_cbp_top  >> (9 + i_idx)) & 1 : b_intra;
-            return 4*i_cat + 2*i_nzb + i_nza;
+            return 85 + 4*i_cat + 2*i_nzb + i_nza;
          default:
              return 0;
      }
@@ -583,66 +583,74 @@ static const uint8_t coeff_abs_level_transition[2][8] = {
  /* update node ctx after coding a level>1 */
      { 4, 4, 4, 4, 5, 6, 7, 7 }
  };
+static const int count_cat_m1[5] = {15, 14, 15, 3, 14};
  
  #if !RDO_SKIP_BS
-static void block_residual_write_cabac( x264_t *h, x264_cabac_t *cb, int i_ctxBlockCat, int i_idx, int16_t *l, int i_count, int ctxidxinc )
+static void block_residual_write_cabac( x264_t *h, x264_cabac_t *cb, int i_ctxBlockCat, int i_idx, int16_t *l, int ctxidxinc )
  {
      const int i_ctx_sig = significant_coeff_flag_offset[h->mb.b_interlaced][i_ctxBlockCat];
      const int i_ctx_last = last_coeff_flag_offset[h->mb.b_interlaced][i_ctxBlockCat];
      const int i_ctx_level = coeff_abs_level_m1_offset[i_ctxBlockCat];
      const uint8_t *significant_coeff_flag_offset = significant_coeff_flag_offset_8x8[h->mb.b_interlaced];
-
      int i_coeff_abs_m1[64];
      int i_coeff_sign[64];
      int i_coeff = 0;
      int i_last;
-    int i_sigmap_size;
      int node_ctx = 0;
-    int i;
+    int i = 0;
  
-    if( i_count != 64 )
+    if( i_ctxBlockCat != DCT_LUMA_8x8 )
      {
          /* coded block flag */
-        int ctx = 85 + ctxidxinc;
          if( h->mb.cache.non_zero_count[x264_scan8[i_idx]] )
-            x264_cabac_encode_decision( cb, ctx, 1 );
+            x264_cabac_encode_decision( cb, ctxidxinc, 1 );
          else
          {
-            x264_cabac_encode_decision( cb, ctx, 0 );
+            x264_cabac_encode_decision( cb, ctxidxinc, 0 );
              return;
          }
      }
  
      i_last = h->quantf.coeff_last[i_ctxBlockCat](l);
  
-    i_sigmap_size = X264_MIN( i_last+1, i_count-1 );
-
  #define WRITE_SIGMAP( l8x8 )\
-    for( i = 0; i < i_sigmap_size; i++ )\
+    while(1)\
      {\
          if( l[i] )\
          {\
              i_coeff_abs_m1[i_coeff] = abs(l[i]) - 1;\
-            if( !RDO_SKIP_BS )\
-                i_coeff_sign[i_coeff] = l[i] < 0;\
+            i_coeff_sign[i_coeff] = l[i] < 0;\
              i_coeff++;\
              x264_cabac_encode_decision( cb, i_ctx_sig + (l8x8 ? significant_coeff_flag_offset[i] : i), 1 );\
-            x264_cabac_encode_decision( cb, i_ctx_last + (l8x8 ? last_coeff_flag_offset_8x8[i] : i), i == i_last );\
+            if( i == i_last )\
+            {\
+                x264_cabac_encode_decision( cb, i_ctx_last + (l8x8 ? last_coeff_flag_offset_8x8[i] : i), 1 );\
+                break;\
+            }\
+            else\
+                x264_cabac_encode_decision( cb, i_ctx_last + (l8x8 ? last_coeff_flag_offset_8x8[i] : i), 0 );\
          }\
          else\
              x264_cabac_encode_decision( cb, i_ctx_sig + (l8x8 ? significant_coeff_flag_offset[i] : i), 0 );\
+        i++;\
+        if( i == i_count_m1 )\
+        {\
+            i_coeff_abs_m1[i_coeff] = abs(l[i]) - 1;\
+            i_coeff_sign[i_coeff]   = l[i] < 0;\
+            i_coeff++;\
+            break;\
+        }\
      }
  
      if( i_ctxBlockCat == DCT_LUMA_8x8 )
+    {
+        const int i_count_m1 = 63;
          WRITE_SIGMAP( 1 )
+    }
      else
-        WRITE_SIGMAP( 0 )
-
-    if( i == i_last )
      {
-        i_coeff_abs_m1[i_coeff] = abs(l[i]) - 1;
-        i_coeff_sign[i_coeff]   = l[i] < 0;
-        i_coeff++;
+        const int i_count_m1 = count_cat_m1[i_ctxBlockCat];
+        WRITE_SIGMAP( 0 )
      }
  
      do
@@ -676,7 +684,7 @@ static void block_residual_write_cabac( x264_t *h, x264_cabac_t *cb, int i_ctxBl
          x264_cabac_encode_bypass( cb, i_coeff_sign[i_coeff] );
      } while( i_coeff > 0 );
  }
-#define block_residual_write_cabac_8x8( h, cb, idx, l ) block_residual_write_cabac( h, cb, DCT_LUMA_8x8, idx, l, 64, 0 )
+#define block_residual_write_cabac_8x8( h, cb, idx, l ) block_residual_write_cabac( h, cb, DCT_LUMA_8x8, idx, l, 0 )
  
  #else
  
@@ -684,33 +692,35 @@ static void block_residual_write_cabac( x264_t *h, x264_cabac_t *cb, int i_ctxBl
   * this is slightly incorrect because the sigmap is not reversible
   * (contexts are repeated).  However, there is nearly no quality penalty
   * for this (~0.001db) and the speed boost (~30%) is worth it. */
-static void ALWAYS_INLINE block_residual_write_cabac_internal( x264_t *h, x264_cabac_t *cb, int i_ctxBlockCat, int i_idx, int16_t *l, int i_count, int ctxidxinc, int b_8x8 )
+static void ALWAYS_INLINE block_residual_write_cabac_internal( x264_t *h, x264_cabac_t *cb, int i_ctxBlockCat, int i_idx, int16_t *l, int ctxidxinc, int b_8x8 )
  {
      const int i_ctx_sig = significant_coeff_flag_offset[h->mb.b_interlaced][i_ctxBlockCat];
      const int i_ctx_last = last_coeff_flag_offset[h->mb.b_interlaced][i_ctxBlockCat];
      const int i_ctx_level = coeff_abs_level_m1_offset[i_ctxBlockCat];
      const uint8_t *significant_coeff_flag_offset = significant_coeff_flag_offset_8x8[h->mb.b_interlaced];
-    int i_last, i_coeff_abs, ctx, i, node_ctx;
+    int i_last, i_coeff_abs, ctx, i, node_ctx, i_count_m1;
  
      if( !b_8x8 )
      {
          /* coded block flag */
-        ctx = 85 + ctxidxinc;
          if( h->mb.cache.non_zero_count[x264_scan8[i_idx]] )
-            x264_cabac_encode_decision( cb, ctx, 1 );
+            x264_cabac_encode_decision( cb, ctxidxinc, 1 );
          else
          {
-            x264_cabac_encode_decision( cb, ctx, 0 );
+            x264_cabac_encode_decision( cb, ctxidxinc, 0 );
              return;
          }
+        i_count_m1 = count_cat_m1[i_ctxBlockCat];
      }
+    else
+        i_count_m1 = 63;
  
      i_last = h->quantf.coeff_last[i_ctxBlockCat](l);
  
      i_coeff_abs = abs(l[i_last]);
      ctx = coeff_abs_level1_ctx[0] + i_ctx_level;
  
-    if( i_last != i_count - 1 )
+    if( i_last != i_count_m1 )
      {
          x264_cabac_encode_decision( cb, i_ctx_sig + (b_8x8?significant_coeff_flag_offset[i_last]:i_last), 1 );
          x264_cabac_encode_decision( cb, i_ctx_last + (b_8x8?last_coeff_flag_offset_8x8[i_last]:i_last), 1 );
@@ -780,18 +790,18 @@ static void ALWAYS_INLINE block_residual_write_cabac_internal( x264_t *h, x264_c
  
  static void block_residual_write_cabac_8x8( x264_t *h, x264_cabac_t *cb, int i_idx, int16_t *l )
  {
-    block_residual_write_cabac_internal( h, cb, DCT_LUMA_8x8, i_idx, l, 64, 0, 1 );
+    block_residual_write_cabac_internal( h, cb, DCT_LUMA_8x8, i_idx, l, 0, 1 );
  }
-static void block_residual_write_cabac( x264_t *h, x264_cabac_t *cb, int i_ctxBlockCat, int i_idx, int16_t *l, int i_count, int ctxidxinc )
+static void block_residual_write_cabac( x264_t *h, x264_cabac_t *cb, int i_ctxBlockCat, int i_idx, int16_t *l, int ctxidxinc )
  {
-    block_residual_write_cabac_internal( h, cb, i_ctxBlockCat, i_idx, l, i_count, ctxidxinc, 0 );
+    block_residual_write_cabac_internal( h, cb, i_ctxBlockCat, i_idx, l, ctxidxinc, 0 );
  }
  #endif
  
-#define block_residual_write_cabac( h, cb, i_ctxBlockCat, i_idx, l, i_count, b_intra ) \
+#define block_residual_write_cabac( h, cb, i_ctxBlockCat, i_idx, l, b_intra ) \
  { \
      int ctxidxinc = x264_cabac_mb_cbf_ctxidxinc( h, i_ctxBlockCat, i_idx, b_intra ); \
-    block_residual_write_cabac( h, cb, i_ctxBlockCat, i_idx, l, i_count, ctxidxinc ); \
+    block_residual_write_cabac( h, cb, i_ctxBlockCat, i_idx, l, ctxidxinc ); \
  }
  
  void x264_macroblock_write_cabac( x264_t *h, x264_cabac_t *cb )
@@ -1001,12 +1011,12 @@ void x264_macroblock_write_cabac( x264_t *h, x264_cabac_t *cb )
          if( i_mb_type == I_16x16 )
          {
              /* DC Luma */
-            block_residual_write_cabac( h, cb, DCT_LUMA_DC, 24, h->dct.luma16x16_dc, 16, 1 );
+            block_residual_write_cabac( h, cb, DCT_LUMA_DC, 24, h->dct.luma16x16_dc, 1 );
  
              /* AC Luma */
              if( h->mb.i_cbp_luma != 0 )
                  for( i = 0; i < 16; i++ )
-                    block_residual_write_cabac( h, cb, DCT_LUMA_AC, i, h->dct.luma4x4[i]+1, 15, 1 );
+                    block_residual_write_cabac( h, cb, DCT_LUMA_AC, i, h->dct.luma4x4[i]+1, 1 );
          }
          else if( h->mb.b_transform_8x8 )
          {
@@ -1018,18 +1028,18 @@ void x264_macroblock_write_cabac( x264_t *h, x264_cabac_t *cb )
          {
              for( i = 0; i < 16; i++ )
                  if( h->mb.i_cbp_luma & ( 1 << ( i / 4 ) ) )
-                    block_residual_write_cabac( h, cb, DCT_LUMA_4x4, i, h->dct.luma4x4[i], 16, b_intra );
+                    block_residual_write_cabac( h, cb, DCT_LUMA_4x4, i, h->dct.luma4x4[i], b_intra );
          }
  
          if( h->mb.i_cbp_chroma &0x03 )    /* Chroma DC residual present */
          {
-            block_residual_write_cabac( h, cb, DCT_CHROMA_DC, 25, h->dct.chroma_dc[0], 4, b_intra );
-            block_residual_write_cabac( h, cb, DCT_CHROMA_DC, 26, h->dct.chroma_dc[1], 4, b_intra );
+            block_residual_write_cabac( h, cb, DCT_CHROMA_DC, 25, h->dct.chroma_dc[0], b_intra );
+            block_residual_write_cabac( h, cb, DCT_CHROMA_DC, 26, h->dct.chroma_dc[1], b_intra );
          }
          if( h->mb.i_cbp_chroma&0x02 ) /* Chroma AC residual present */
          {
              for( i = 16; i < 24; i++ )
-                block_residual_write_cabac( h, cb, DCT_CHROMA_AC, i, h->dct.luma4x4[i]+1, 15, b_intra );
+                block_residual_write_cabac( h, cb, DCT_CHROMA_AC, i, h->dct.luma4x4[i]+1, b_intra );
          }
      }
  
@@ -1084,12 +1094,12 @@ static void x264_partition_size_cabac( x264_t *h, x264_cabac_t *cb, int i8, int
              {
                  int i4;
                  for( i4 = 0; i4 < 4; i4++ )
-                    block_residual_write_cabac( h, cb, DCT_LUMA_4x4, i4+i8*4, h->dct.luma4x4[i4+i8*4], 16, 0 );
+                    block_residual_write_cabac( h, cb, DCT_LUMA_4x4, i4+i8*4, h->dct.luma4x4[i4+i8*4], 0 );
              }
          }
  
-        block_residual_write_cabac( h, cb, DCT_CHROMA_AC, 16+i8, h->dct.luma4x4[16+i8]+1, 15, 0 );
-        block_residual_write_cabac( h, cb, DCT_CHROMA_AC, 20+i8, h->dct.luma4x4[20+i8]+1, 15, 0 );
+        block_residual_write_cabac( h, cb, DCT_CHROMA_AC, 16+i8, h->dct.luma4x4[16+i8]+1, 0 );
+        block_residual_write_cabac( h, cb, DCT_CHROMA_AC, 20+i8, h->dct.luma4x4[20+i8]+1, 0 );
  
          i8 += x264_pixel_size[i_pixel].h >> 3;
      }
@@ -1098,7 +1108,7 @@ static void x264_partition_size_cabac( x264_t *h, x264_cabac_t *cb, int i8, int
  static void x264_subpartition_size_cabac( x264_t *h, x264_cabac_t *cb, int i4, int i_pixel )
  {
      int b_8x4 = i_pixel == PIXEL_8x4;
-    block_residual_write_cabac( h, cb, DCT_LUMA_4x4, i4, h->dct.luma4x4[i4], 16, 0 );
+    block_residual_write_cabac( h, cb, DCT_LUMA_4x4, i4, h->dct.luma4x4[i4], 0 );
      if( i_pixel == PIXEL_4x4 )
      {
          x264_cabac_mb_mvd( h, cb, 0, i4, 1, 1 );
@@ -1106,7 +1116,7 @@ static void x264_subpartition_size_cabac( x264_t *h, x264_cabac_t *cb, int i4, i
      else
      {
          x264_cabac_mb_mvd( h, cb, 0, i4, 1+b_8x4, 2-b_8x4 );
-        block_residual_write_cabac( h, cb, DCT_LUMA_4x4, i4+2-b_8x4, h->dct.luma4x4[i4+2-b_8x4], 16, 0 );
+        block_residual_write_cabac( h, cb, DCT_LUMA_4x4, i4+2-b_8x4, h->dct.luma4x4[i4+2-b_8x4], 0 );
      }
  }
  
@@ -1125,7 +1135,7 @@ static void x264_partition_i4x4_size_cabac( x264_t *h, x264_cabac_t *cb, int i4,
      const int i_pred = x264_mb_predict_intra4x4_mode( h, i4 );
      i_mode = x264_mb_pred_mode4x4_fix( i_mode );
      x264_cabac_mb_intra4x4_pred_mode( cb, i_pred, i_mode );
-    block_residual_write_cabac( h, cb, DCT_LUMA_4x4, i4, h->dct.luma4x4[i4], 16, 1 );
+    block_residual_write_cabac( h, cb, DCT_LUMA_4x4, i4, h->dct.luma4x4[i4], 1 );
  }
  
  static void x264_i8x8_chroma_size_cabac( x264_t *h, x264_cabac_t *cb )
@@ -1134,14 +1144,14 @@ static void x264_i8x8_chroma_size_cabac( x264_t *h, x264_cabac_t *cb )
      x264_cabac_mb_cbp_chroma( h, cb );
      if( h->mb.i_cbp_chroma > 0 )
      {
-        block_residual_write_cabac( h, cb, DCT_CHROMA_DC, 25, h->dct.chroma_dc[0], 4, 1 );
-        block_residual_write_cabac( h, cb, DCT_CHROMA_DC, 26, h->dct.chroma_dc[1], 4, 1 );
+        block_residual_write_cabac( h, cb, DCT_CHROMA_DC, 25, h->dct.chroma_dc[0], 1 );
+        block_residual_write_cabac( h, cb, DCT_CHROMA_DC, 26, h->dct.chroma_dc[1], 1 );
  
          if( h->mb.i_cbp_chroma == 2 )
          {
              int i;
              for( i = 16; i < 24; i++ )
-                block_residual_write_cabac( h, cb, DCT_CHROMA_AC, i, h->dct.luma4x4[i]+1, 15, 1 );
+                block_residual_write_cabac( h, cb, DCT_CHROMA_AC, i, h->dct.luma4x4[i]+1, 1 );
          }
      }
  }
diff --git a/encoder/cavlc.c b/encoder/cavlc.c

index cc5964e8ed24a87423781d2ba6d474ed24b63d6f..d0176c19ea993ef19367956a703a8d965aec222d 100644 (file)
--- a/encoder/cavlc.c
+++ b/encoder/cavlc.c
@@ -112,20 +112,15 @@ static inline int block_residual_write_cavlc_escape( x264_t *h, bs_t *s, int i_s
      return i_suffix_length;
  }
  
-static void block_residual_write_cavlc( x264_t *h, bs_t *s, int i_ctxBlockCat, int i_idx, int16_t *l, int i_count, int nC )
+static int block_residual_write_cavlc( x264_t *h, bs_t *s, int i_ctxBlockCat, int16_t *l, int nC )
  {
      static const uint8_t ctz_index[8] = {3,0,1,0,2,0,1,0};
+    static const int count_cat[5] = {16, 15, 16, 4, 15};
      x264_run_level_t runlevel;
      int i_trailing, i_total_zero, i_suffix_length, i;
      int i_total = 0;
      unsigned int i_sign;
  
-    if( !h->mb.cache.non_zero_count[x264_scan8[i_idx]] )
-    {
-        bs_write_vlc( s, x264_coeff0_token[nC] );
-        return;
-    }
-
      /* level and run and total */
      /* set these to 2 to allow branchless i_trailing calculation */
      runlevel.level[1] = 2;
@@ -133,8 +128,6 @@ static void block_residual_write_cavlc( x264_t *h, bs_t *s, int i_ctxBlockCat, i
      i_total = h->quantf.coeff_level_run[i_ctxBlockCat]( l, &runlevel );
      i_total_zero = runlevel.last + 1 - i_total;
  
-    h->mb.cache.non_zero_count[x264_scan8[i_idx]] = i_total;
-
      i_trailing = ((((runlevel.level[0]+1) | (1-runlevel.level[0])) >> 31) & 1) // abs(runlevel.level[0])>1
                 | ((((runlevel.level[1]+1) | (1-runlevel.level[1])) >> 31) & 2)
                 | ((((runlevel.level[2]+1) | (1-runlevel.level[2])) >> 31) & 4);
@@ -179,9 +172,9 @@ static void block_residual_write_cavlc( x264_t *h, bs_t *s, int i_ctxBlockCat, i
          }
      }
  
-    if( i_total < i_count )
+    if( i_total < count_cat[i_ctxBlockCat] )
      {
-        if( i_idx >= 25 )
+        if( i_ctxBlockCat == DCT_CHROMA_DC )
              bs_write_vlc( s, x264_total_zeros_dc[i_total-1][i_total_zero] );
          else
              bs_write_vlc( s, x264_total_zeros[i_total-1][i_total_zero] );
@@ -193,14 +186,20 @@ static void block_residual_write_cavlc( x264_t *h, bs_t *s, int i_ctxBlockCat, i
          bs_write_vlc( s, x264_run_before[i_zl][runlevel.run[i]] );
          i_total_zero -= runlevel.run[i];
      }
+
+    return i_total;
  }
  
  static const uint8_t ct_index[17] = {0,0,1,1,2,2,2,2,3,3,3,3,3,3,3,3,3};
  
-#define block_residual_write_cavlc(h,s,cat,idx,l,count)\
+#define block_residual_write_cavlc(h,s,cat,idx,l)\
  {\
      int nC = cat == DCT_CHROMA_DC ? 4 : ct_index[x264_mb_predict_non_zero_code( h, cat == DCT_LUMA_DC ? 0 : idx )];\
-    block_residual_write_cavlc(h,s,cat,idx,l,count,nC);\
+    uint8_t *nnz = &h->mb.cache.non_zero_count[x264_scan8[idx]];\
+    if( !*nnz )\
+        bs_write_vlc( s, x264_coeff0_token[nC] );\
+    else\
+        *nnz = block_residual_write_cavlc(h,s,cat,l,nC);\
  }
  
  static void cavlc_qp_delta( x264_t *h, bs_t *s )
@@ -284,7 +283,7 @@ static inline void x264_macroblock_luma_write_cavlc( x264_t *h, bs_t *s, int i8s
      for( i8 = i8start; i8 <= i8end; i8++ )
          if( h->mb.i_cbp_luma & (1 << i8) )
              for( i4 = 0; i4 < 4; i4++ )
-                block_residual_write_cavlc( h, s, DCT_LUMA_4x4, i4+i8*4, h->dct.luma4x4[i4+i8*4], 16 );
+                block_residual_write_cavlc( h, s, DCT_LUMA_4x4, i4+i8*4, h->dct.luma4x4[i4+i8*4] );
  }
  
  /*****************************************************************************
@@ -590,12 +589,12 @@ void x264_macroblock_write_cavlc( x264_t *h, bs_t *s )
          cavlc_qp_delta( h, s );
  
          /* DC Luma */
-        block_residual_write_cavlc( h, s, DCT_LUMA_DC, 24 , h->dct.luma16x16_dc, 16 );
+        block_residual_write_cavlc( h, s, DCT_LUMA_DC, 24 , h->dct.luma16x16_dc );
  
          /* AC Luma */
          if( h->mb.i_cbp_luma )
              for( i = 0; i < 16; i++ )
-                block_residual_write_cavlc( h, s, DCT_LUMA_AC, i, h->dct.luma4x4[i]+1, 15 );
+                block_residual_write_cavlc( h, s, DCT_LUMA_AC, i, h->dct.luma4x4[i]+1 );
      }
      else if( h->mb.i_cbp_luma | h->mb.i_cbp_chroma )
      {
@@ -605,11 +604,11 @@ void x264_macroblock_write_cavlc( x264_t *h, bs_t *s )
      if( h->mb.i_cbp_chroma )
      {
          /* Chroma DC residual present */
-        block_residual_write_cavlc( h, s, DCT_CHROMA_DC, 25, h->dct.chroma_dc[0], 4 );
-        block_residual_write_cavlc( h, s, DCT_CHROMA_DC, 26, h->dct.chroma_dc[1], 4 );
+        block_residual_write_cavlc( h, s, DCT_CHROMA_DC, 25, h->dct.chroma_dc[0] );
+        block_residual_write_cavlc( h, s, DCT_CHROMA_DC, 26, h->dct.chroma_dc[1] );
          if( h->mb.i_cbp_chroma&0x02 ) /* Chroma AC residual present */
              for( i = 16; i < 24; i++ )
-                block_residual_write_cavlc( h, s, DCT_CHROMA_AC, i, h->dct.luma4x4[i]+1, 15 );
+                block_residual_write_cavlc( h, s, DCT_CHROMA_AC, i, h->dct.luma4x4[i]+1 );
      }
  
  #if !RDO_SKIP_BS
@@ -657,8 +656,8 @@ static int x264_partition_size_cavlc( x264_t *h, int i8, int i_pixel )
      for( j = (i_pixel < PIXEL_8x8); j >= 0; j-- )
      {
          x264_macroblock_luma_write_cavlc( h, &s, i8, i8 );
-        block_residual_write_cavlc( h, &s, DCT_CHROMA_AC, 16+i8, h->dct.luma4x4[16+i8]+1, 15 );
-        block_residual_write_cavlc( h, &s, DCT_CHROMA_AC, 20+i8, h->dct.luma4x4[20+i8]+1, 15 );
+        block_residual_write_cavlc( h, &s, DCT_CHROMA_AC, 16+i8, h->dct.luma4x4[16+i8]+1 );
+        block_residual_write_cavlc( h, &s, DCT_CHROMA_AC, 20+i8, h->dct.luma4x4[20+i8]+1 );
          i8 += x264_pixel_size[i_pixel].h >> 3;
      }
  
@@ -671,11 +670,11 @@ static int x264_subpartition_size_cavlc( x264_t *h, int i4, int i_pixel )
      int b_8x4 = i_pixel == PIXEL_8x4;
      s.i_bits_encoded = 0;
      cavlc_mb_mvd( h, &s, 0, i4, 1+b_8x4 );
-    block_residual_write_cavlc( h, &s, DCT_LUMA_4x4, i4, h->dct.luma4x4[i4], 16 );
+    block_residual_write_cavlc( h, &s, DCT_LUMA_4x4, i4, h->dct.luma4x4[i4] );
      if( i_pixel != PIXEL_4x4 )
      {
          i4 += 2-b_8x4;
-        block_residual_write_cavlc( h, &s, DCT_LUMA_4x4, i4, h->dct.luma4x4[i4], 16 );
+        block_residual_write_cavlc( h, &s, DCT_LUMA_4x4, i4, h->dct.luma4x4[i4] );
      }
  
      return s.i_bits_encoded;
@@ -700,7 +699,7 @@ static int x264_partition_i8x8_size_cavlc( x264_t *h, int i8, int i_mode )
  static int x264_partition_i4x4_size_cavlc( x264_t *h, int i4, int i_mode )
  {
      h->out.bs.i_bits_encoded = cavlc_intra4x4_pred_size( h, i4, i_mode );
-    block_residual_write_cavlc( h, &h->out.bs, DCT_LUMA_4x4, i4, h->dct.luma4x4[i4], 16 );
+    block_residual_write_cavlc( h, &h->out.bs, DCT_LUMA_4x4, i4, h->dct.luma4x4[i4] );
      return h->out.bs.i_bits_encoded;
  }
  
@@ -709,14 +708,14 @@ static int x264_i8x8_chroma_size_cavlc( x264_t *h )
      h->out.bs.i_bits_encoded = bs_size_ue( x264_mb_pred_mode8x8c_fix[ h->mb.i_chroma_pred_mode ] );
      if( h->mb.i_cbp_chroma )
      {
-        block_residual_write_cavlc( h, &h->out.bs, DCT_CHROMA_DC, 25, h->dct.chroma_dc[0], 4 );
-        block_residual_write_cavlc( h, &h->out.bs, DCT_CHROMA_DC, 26, h->dct.chroma_dc[1], 4 );
+        block_residual_write_cavlc( h, &h->out.bs, DCT_CHROMA_DC, 25, h->dct.chroma_dc[0] );
+        block_residual_write_cavlc( h, &h->out.bs, DCT_CHROMA_DC, 26, h->dct.chroma_dc[1] );
  
          if( h->mb.i_cbp_chroma == 2 )
          {
              int i;
              for( i = 16; i < 24; i++ )
-                block_residual_write_cavlc( h, &h->out.bs, DCT_CHROMA_AC, i, h->dct.luma4x4[i]+1, 15 );
+                block_residual_write_cavlc( h, &h->out.bs, DCT_CHROMA_AC, i, h->dct.luma4x4[i]+1 );
          }
      }
      return h->out.bs.i_bits_encoded;
author	Fiona Glaser <fiona@x264.com>
	Mon, 4 May 2009 11:19:28 +0000 (04:19 -0700)
committer	Fiona Glaser <fiona@x264.com>
	Sun, 10 May 2009 08:16:29 +0000 (01:16 -0700)
common/cabac.c		patch \| blob \| history
encoder/cabac.c		patch \| blob \| history
encoder/cavlc.c		patch \| blob \| history