]> granicus.if.org Git - libvpx/commit
[VSX] Optimize PROCESS16 macro
authorLuc Trudeau <luc@trud.ca>
Wed, 13 Jun 2018 19:24:54 +0000 (15:24 -0400)
committerLuc Trudeau <luc@trud.ca>
Thu, 14 Jun 2018 01:57:05 +0000 (01:57 +0000)
commitf9dc411d89eed99d7def7de1e9dddba782c1212c
tree33508fcc22b758f36e855f8c9b7a4f41d57eb7ea
parente3ce12cfc1c2d2cc245e1a6d49eaf3ff18538547
[VSX] Optimize PROCESS16 macro

The PROCESS16 macro now uses 8-bit lanes instead of 16-bit lanes.

SADTest Speed Test (POWER8 Model 2.1)
16x8  Old VSX time = 16.7 ms, new VSX time = 9.1 ms [1.8x]
16x16 Old VSX time = 15.7 ms, new VSX time = 7.9 ms [2.0x]
16x32 Old VSX time = 14.4 ms, new VSX time = 7.2 ms [2.0x]
32x16 Old VSX time = 14.0 ms, new VSX time = 7.4 ms [1.9x]
32x32 Old VSX time = 13.4 ms, new VSX time = 6.5 ms [2.0x]
32x64 Old VSX time = 12.7 ms, new VSX time = 6.3 ms [2.0x]
64x32 Old VSX time = 12.6 ms, new VSX time = 6.3 ms [2.0x]
64x64 Old VSX time = 12.7 ms, new VSX time = 6.2 ms [2.0x]

Change-Id: I51776f0e428162e78edde8eac47f30ffd2379873
vpx_dsp/ppc/sad_vsx.c