granicus.if.org Git - libvpx/commit

author	levytamar82 <levytamar82@gmail.com>
	Thu, 21 Nov 2013 22:49:29 +0000 (15:49 -0700)
committer	levytamar82 <levytamar82@gmail.com>
	Fri, 14 Feb 2014 22:08:42 +0000 (15:08 -0700)
commit	3068d7d94428d32e0c33a5d3061ba8e362838a41
tree	945a47822c6a8db9123b3db4ab6dcfc7de44a9a8	tree \| snapshot
parent	bb07de7ccea40c145548e8d49752bcccdd08c248	commit \| diff

SSSE3 convolution optimization

Optimizing all SSSE3 assembly for convolution:
1. vp9_filter_block1d4_h8_sse2
2. vp9_filter_block1d8_h8_sse2
3. vp9_filter_block1d16_h8_sse2
4. vp9_filter_block1d4_v8_sse2
5. vp9_filter_block1d8_v8_sse2
6. vp9_filter_block1d16_v8_sse2
my optimization include:
-processing 2x8 elements in one 128 bit register instead of processing
8 elements in one 128 bit register.
-removing unecessary loads.
This optimization gives between 2.4% user level gain for 480p input
and 1.6% user level gain for 720p.
This Optimization is done only for 64 bit

Change-Id: Ic07fce2f9360329b4f2d956efda1480ae958766b

vp9/common/x86/vp9_asm_stubs.c		diff \| blob \| history
vp9/common/x86/vp9_subpixel_8t_intrin_ssse3.c	[new file with mode: 0644]	blob
vp9/vp9_common.mk		diff \| blob \| history