Replace 16x16=>32 mul + pack + add by a simple 16x16=>16 multiply-add.

author Guillaume Poirier <gpoirier@mplayerhq.hu>

Mon, 19 Jan 2009 20:29:27 +0000 (21:29 +0100)

committer Guillaume Poirier <gpoirier@mplayerhq.hu>

Tue, 20 Jan 2009 06:43:11 +0000 (07:43 +0100)
author Guillaume Poirier <gpoirier@mplayerhq.hu>
Mon, 19 Jan 2009 20:29:27 +0000 (21:29 +0100)
committer Guillaume Poirier <gpoirier@mplayerhq.hu>
Tue, 20 Jan 2009 06:43:11 +0000 (07:43 +0100)
diff --git a/common/ppc/predict.c b/common/ppc/predict.c

index 9b38fbb68da7cc2e5897ebe316cd48afde9d92fc..b90cc8a13c7d63f1fa5f42daf9269abf18e74f88 100644 (file)
--- a/common/ppc/predict.c
+++ b/common/ppc/predict.c
@@ -54,10 +54,7 @@ static void predict_8x8c_p_altivec( uint8_t *src )
      c_v = vec_splat(c_u.v, 0);
  
      vec_s16_t induc_v  = (vec_s16_t) CV(0, 1, 2, 3, 4, 5, 6, 7);
-    vec_s32_t mule_b_v = vec_mule(induc_v, b_v);
-    vec_s32_t mulo_b_v = vec_mulo(induc_v, b_v);
-    vec_s16_t mul_b_induc0_v = vec_pack(vec_mergeh(mule_b_v, mulo_b_v), vec_mergel(mule_b_v, mulo_b_v));
-    vec_s16_t add_i0_b_0v = vec_adds(i00_v, mul_b_induc0_v);
+    vec_s16_t add_i0_b_0v = vec_mladd(induc_v, b_v, i00_v);
  
      PREP_STORE8;
  
@@ -107,10 +104,7 @@ static void predict_16x16_p_altivec( uint8_t *src )
      c_v = vec_splat(c_u.v, 0);
      vec_s16_t induc_v  = (vec_s16_t) CV(0,  1,  2,  3,  4,  5,  6,  7);
      vec_s16_t b8_v = vec_sl(b_v, vec_splat_u16(3));
-    vec_s32_t mule_b_v = vec_mule(induc_v, b_v);
-    vec_s32_t mulo_b_v = vec_mulo(induc_v, b_v);
-    vec_s16_t mul_b_induc0_v = vec_pack(vec_mergeh(mule_b_v, mulo_b_v), vec_mergel(mule_b_v, mulo_b_v));
-    vec_s16_t add_i0_b_0v = vec_adds(i00_v, mul_b_induc0_v);
+    vec_s16_t add_i0_b_0v = vec_mladd(induc_v, b_v, i00_v);
      vec_s16_t add_i0_b_8v = vec_adds(b8_v, add_i0_b_0v);
  
      int y;
author	Guillaume Poirier <gpoirier@mplayerhq.hu>
	Mon, 19 Jan 2009 20:29:27 +0000 (21:29 +0100)
committer	Guillaume Poirier <gpoirier@mplayerhq.hu>
	Tue, 20 Jan 2009 06:43:11 +0000 (07:43 +0100)