]> granicus.if.org Git - libvpx/commit
x86 sse2 temporal_filter_apply
authorJohann <johannkoenig@google.com>
Wed, 22 Dec 2010 16:23:51 +0000 (11:23 -0500)
committerJohann <johannkoenig@google.com>
Thu, 6 Jan 2011 19:00:30 +0000 (14:00 -0500)
commit8b0cf5f79d4c3812ae3d23f2ddc124afcf79b070
tree105d296b1c4e4d586246da1a7d260b9d1940c325
parentb095d9df3c7492e9ba031c4491a0a565f668c9e5
x86 sse2 temporal_filter_apply

count can be reduced to short because the max number of filtered frames
is set to 15. the max value for any frame is 32 (modifier = 16,
filter_weight = 2). 15*32 = 480 which requires 9 bits

this function goes from about 7000 us / 1000 iterations for the C code
to < 275 us / 1000 iterations for sse2 for block_size = 16 and from
about 1800 us / 1000 iters to < 100 us / 1000 iters for block_size = 8

Change-Id: I64a32607f58a2d33c39286f468b04ccd457d9e6e
vp8/encoder/temporal_filter.c
vp8/encoder/temporal_filter.h
vp8/encoder/x86/temporal_filter_apply_sse2.asm [new file with mode: 0644]
vp8/encoder/x86/temporal_filter_x86.h [new file with mode: 0644]
vp8/encoder/x86/x86_csystemdependent.c
vp8/vp8cx.mk