]> granicus.if.org Git - libvpx/commit
Add SSE2 support for 4-tap interpolation filter for width 16.
authorchiyotsai <chiyotsai@google.com>
Wed, 17 Oct 2018 00:50:37 +0000 (17:50 -0700)
committerchiyotsai <chiyotsai@google.com>
Wed, 17 Oct 2018 16:58:30 +0000 (09:58 -0700)
commit272f46212ed96ee8c28056752c8da392229b8e17
tree7eaea547f47cf5d25b7e9fbfe648ab2e843cb26a
parent86db847ab8d17d465f2839c2e5223eb8af1885c8
Add SSE2 support for 4-tap interpolation filter for width 16.

Horizontal filter on 64x64 block: 1.59 times as fast as baseline.
Vertical filter on 64x64 block: 2.5 times as fast as baseline.
2D filter on 64x64 block: 1.96 times as fast as baseline.

Change-Id: I12e46679f3108616d5b3475319dd38b514c6cb3c
test/convolve_test.cc
vpx_dsp/vpx_dsp.mk
vpx_dsp/x86/convolve.h
vpx_dsp/x86/vpx_asm_stubs.c
vpx_dsp/x86/vpx_subpixel_4t_intrin_sse2.c [new file with mode: 0644]
vpx_dsp/x86/vpx_subpixel_8t_intrin_avx2.c
vpx_dsp/x86/vpx_subpixel_8t_intrin_ssse3.c