]> granicus.if.org Git - libvpx/blob - vp9/common/vp9_rtcd_defs.sh
block error / x86inc mods
[libvpx] / vp9 / common / vp9_rtcd_defs.sh
1 vp9_common_forward_decls() {
2 cat <<EOF
3 /*
4  * VP9
5  */
6
7 #include "vpx/vpx_integer.h"
8 #include "vp9/common/vp9_enums.h"
9
10 struct macroblockd;
11
12 /* Encoder forward decls */
13 struct macroblock;
14 struct vp9_variance_vtable;
15
16 #define DEC_MVCOSTS int *mvjcost, int *mvcost[2]
17 union int_mv;
18 struct yv12_buffer_config;
19 EOF
20 }
21 forward_decls vp9_common_forward_decls
22
23 # x86inc.asm doesn't work if pic is enabled on 32 bit platforms so no assembly.
24 [ "$CONFIG_USE_X86INC" = "yes" ] && mmx_x86inc=mmx && sse2_x86inc=sse2  && ssse3_x86inc=ssse3
25
26 # this variable is for functions that are 64 bit only.
27 [ $arch = "x86_64" ] && mmx_x86_64=mmx && sse2_x86_64=sse2  && ssse3_x86_64=ssse3
28
29 #
30 # Dequant
31 #
32
33 prototype void vp9_idct_add_16x16 "int16_t *input, uint8_t *dest, int stride, int eob"
34 specialize vp9_idct_add_16x16
35
36 prototype void vp9_idct_add_8x8 "int16_t *input, uint8_t *dest, int stride, int eob"
37 specialize vp9_idct_add_8x8
38
39 prototype void vp9_idct_add "int16_t *input, uint8_t *dest, int stride, int eob"
40 specialize vp9_idct_add
41
42 prototype void vp9_idct_add_32x32 "int16_t *q, uint8_t *dst, int stride, int eob"
43 specialize vp9_idct_add_32x32
44
45 #
46 # RECON
47 #
48 prototype void vp9_d27_predictor_4x4 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
49 specialize vp9_d27_predictor_4x4
50
51 prototype void vp9_d45_predictor_4x4 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
52 specialize vp9_d45_predictor_4x4 ssse3
53
54 prototype void vp9_d63_predictor_4x4 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
55 specialize vp9_d63_predictor_4x4
56
57 prototype void vp9_h_predictor_4x4 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
58 specialize vp9_h_predictor_4x4 ssse3
59
60 prototype void vp9_d117_predictor_4x4 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
61 specialize vp9_d117_predictor_4x4
62
63 prototype void vp9_d135_predictor_4x4 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
64 specialize vp9_d135_predictor_4x4
65
66 prototype void vp9_d153_predictor_4x4 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
67 specialize vp9_d153_predictor_4x4
68
69 prototype void vp9_v_predictor_4x4 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
70 specialize vp9_v_predictor_4x4 sse
71
72 prototype void vp9_tm_predictor_4x4 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
73 specialize vp9_tm_predictor_4x4 sse
74
75 prototype void vp9_dc_predictor_4x4 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
76 specialize vp9_dc_predictor_4x4 sse
77
78 prototype void vp9_dc_top_predictor_4x4 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
79 specialize vp9_dc_top_predictor_4x4
80
81 prototype void vp9_dc_left_predictor_4x4 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
82 specialize vp9_dc_left_predictor_4x4
83
84 prototype void vp9_dc_128_predictor_4x4 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
85 specialize vp9_dc_128_predictor_4x4
86
87 prototype void vp9_d27_predictor_8x8 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
88 specialize vp9_d27_predictor_8x8
89
90 prototype void vp9_d45_predictor_8x8 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
91 specialize vp9_d45_predictor_8x8 ssse3
92
93 prototype void vp9_d63_predictor_8x8 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
94 specialize vp9_d63_predictor_8x8
95
96 prototype void vp9_h_predictor_8x8 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
97 specialize vp9_h_predictor_8x8 ssse3
98
99 prototype void vp9_d117_predictor_8x8 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
100 specialize vp9_d117_predictor_8x8
101
102 prototype void vp9_d135_predictor_8x8 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
103 specialize vp9_d135_predictor_8x8
104
105 prototype void vp9_d153_predictor_8x8 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
106 specialize vp9_d153_predictor_8x8
107
108 prototype void vp9_v_predictor_8x8 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
109 specialize vp9_v_predictor_8x8 sse
110
111 prototype void vp9_tm_predictor_8x8 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
112 specialize vp9_tm_predictor_8x8 sse2
113
114 prototype void vp9_dc_predictor_8x8 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
115 specialize vp9_dc_predictor_8x8 sse
116
117 prototype void vp9_dc_top_predictor_8x8 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
118 specialize vp9_dc_top_predictor_8x8
119
120 prototype void vp9_dc_left_predictor_8x8 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
121 specialize vp9_dc_left_predictor_8x8
122
123 prototype void vp9_dc_128_predictor_8x8 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
124 specialize vp9_dc_128_predictor_8x8
125
126 prototype void vp9_d27_predictor_16x16 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
127 specialize vp9_d27_predictor_16x16
128
129 prototype void vp9_d45_predictor_16x16 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
130 specialize vp9_d45_predictor_16x16 ssse3
131
132 prototype void vp9_d63_predictor_16x16 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
133 specialize vp9_d63_predictor_16x16
134
135 prototype void vp9_h_predictor_16x16 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
136 specialize vp9_h_predictor_16x16 ssse3
137
138 prototype void vp9_d117_predictor_16x16 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
139 specialize vp9_d117_predictor_16x16
140
141 prototype void vp9_d135_predictor_16x16 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
142 specialize vp9_d135_predictor_16x16
143
144 prototype void vp9_d153_predictor_16x16 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
145 specialize vp9_d153_predictor_16x16
146
147 prototype void vp9_v_predictor_16x16 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
148 specialize vp9_v_predictor_16x16 sse2
149
150 prototype void vp9_tm_predictor_16x16 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
151 specialize vp9_tm_predictor_16x16 sse2
152
153 prototype void vp9_dc_predictor_16x16 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
154 specialize vp9_dc_predictor_16x16 sse2
155
156 prototype void vp9_dc_top_predictor_16x16 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
157 specialize vp9_dc_top_predictor_16x16
158
159 prototype void vp9_dc_left_predictor_16x16 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
160 specialize vp9_dc_left_predictor_16x16
161
162 prototype void vp9_dc_128_predictor_16x16 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
163 specialize vp9_dc_128_predictor_16x16
164
165 prototype void vp9_d27_predictor_32x32 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
166 specialize vp9_d27_predictor_32x32
167
168 prototype void vp9_d45_predictor_32x32 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
169 specialize vp9_d45_predictor_32x32 ssse3
170
171 prototype void vp9_d63_predictor_32x32 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
172 specialize vp9_d63_predictor_32x32
173
174 prototype void vp9_h_predictor_32x32 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
175 specialize vp9_h_predictor_32x32 ssse3
176
177 prototype void vp9_d117_predictor_32x32 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
178 specialize vp9_d117_predictor_32x32
179
180 prototype void vp9_d135_predictor_32x32 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
181 specialize vp9_d135_predictor_32x32
182
183 prototype void vp9_d153_predictor_32x32 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
184 specialize vp9_d153_predictor_32x32
185
186 prototype void vp9_v_predictor_32x32 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
187 specialize vp9_v_predictor_32x32 sse2
188
189 prototype void vp9_tm_predictor_32x32 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
190 specialize vp9_tm_predictor_32x32 sse2_x86_64
191
192 prototype void vp9_dc_predictor_32x32 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
193 specialize vp9_dc_predictor_32x32 sse2
194
195 prototype void vp9_dc_top_predictor_32x32 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
196 specialize vp9_dc_top_predictor_32x32
197
198 prototype void vp9_dc_left_predictor_32x32 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
199 specialize vp9_dc_left_predictor_32x32
200
201 prototype void vp9_dc_128_predictor_32x32 "uint8_t *ypred_ptr, ptrdiff_t y_stride, uint8_t *yabove_row, uint8_t *yleft_col"
202 specialize vp9_dc_128_predictor_32x32
203
204 if [ "$CONFIG_VP9_DECODER" = "yes" ]; then
205 prototype void vp9_add_constant_residual_8x8 "const int16_t diff, uint8_t *dest, int stride"
206 specialize vp9_add_constant_residual_8x8 sse2 neon
207
208 prototype void vp9_add_constant_residual_16x16 "const int16_t diff, uint8_t *dest, int stride"
209 specialize vp9_add_constant_residual_16x16 sse2 neon
210
211 prototype void vp9_add_constant_residual_32x32 "const int16_t diff, uint8_t *dest, int stride"
212 specialize vp9_add_constant_residual_32x32 sse2 neon
213 fi
214
215 #
216 # Loopfilter
217 #
218 prototype void vp9_mb_lpf_vertical_edge_w "uint8_t *s, int pitch, const uint8_t *blimit, const uint8_t *limit, const uint8_t *thresh"
219 specialize vp9_mb_lpf_vertical_edge_w sse2 neon
220
221 prototype void vp9_mbloop_filter_vertical_edge "uint8_t *s, int pitch, const uint8_t *blimit, const uint8_t *limit, const uint8_t *thresh, int count"
222 specialize vp9_mbloop_filter_vertical_edge sse2 neon
223
224 prototype void vp9_loop_filter_vertical_edge "uint8_t *s, int pitch, const uint8_t *blimit, const uint8_t *limit, const uint8_t *thresh, int count"
225 specialize vp9_loop_filter_vertical_edge mmx neon
226
227 prototype void vp9_mb_lpf_horizontal_edge_w "uint8_t *s, int pitch, const uint8_t *blimit, const uint8_t *limit, const uint8_t *thresh, int count"
228 specialize vp9_mb_lpf_horizontal_edge_w sse2 neon
229
230 prototype void vp9_mbloop_filter_horizontal_edge "uint8_t *s, int pitch, const uint8_t *blimit, const uint8_t *limit, const uint8_t *thresh, int count"
231 specialize vp9_mbloop_filter_horizontal_edge sse2 neon
232
233 prototype void vp9_loop_filter_horizontal_edge "uint8_t *s, int pitch, const uint8_t *blimit, const uint8_t *limit, const uint8_t *thresh, int count"
234 specialize vp9_loop_filter_horizontal_edge mmx neon
235
236 #
237 # post proc
238 #
239 if [ "$CONFIG_POSTPROC" = "yes" ]; then
240 prototype void vp9_mbpost_proc_down "uint8_t *dst, int pitch, int rows, int cols, int flimit"
241 specialize vp9_mbpost_proc_down mmx sse2
242 vp9_mbpost_proc_down_sse2=vp9_mbpost_proc_down_xmm
243
244 prototype void vp9_mbpost_proc_across_ip "uint8_t *src, int pitch, int rows, int cols, int flimit"
245 specialize vp9_mbpost_proc_across_ip sse2
246 vp9_mbpost_proc_across_ip_sse2=vp9_mbpost_proc_across_ip_xmm
247
248 prototype void vp9_post_proc_down_and_across "const uint8_t *src_ptr, uint8_t *dst_ptr, int src_pixels_per_line, int dst_pixels_per_line, int rows, int cols, int flimit"
249 specialize vp9_post_proc_down_and_across mmx sse2
250 vp9_post_proc_down_and_across_sse2=vp9_post_proc_down_and_across_xmm
251
252 prototype void vp9_plane_add_noise "uint8_t *Start, char *noise, char blackclamp[16], char whiteclamp[16], char bothclamp[16], unsigned int Width, unsigned int Height, int Pitch"
253 specialize vp9_plane_add_noise mmx sse2
254 vp9_plane_add_noise_sse2=vp9_plane_add_noise_wmt
255 fi
256
257 prototype void vp9_blend_mb_inner "uint8_t *y, uint8_t *u, uint8_t *v, int y1, int u1, int v1, int alpha, int stride"
258 specialize vp9_blend_mb_inner
259
260 prototype void vp9_blend_mb_outer "uint8_t *y, uint8_t *u, uint8_t *v, int y1, int u1, int v1, int alpha, int stride"
261 specialize vp9_blend_mb_outer
262
263 prototype void vp9_blend_b "uint8_t *y, uint8_t *u, uint8_t *v, int y1, int u1, int v1, int alpha, int stride"
264 specialize vp9_blend_b
265
266 #
267 # Sub Pixel Filters
268 #
269 prototype void vp9_convolve_copy "const uint8_t *src, ptrdiff_t src_stride, uint8_t *dst, ptrdiff_t dst_stride, const int16_t *filter_x, int x_step_q4, const int16_t *filter_y, int y_step_q4, int w, int h"
270 specialize vp9_convolve_copy $sse2_x86inc
271
272 prototype void vp9_convolve_avg "const uint8_t *src, ptrdiff_t src_stride, uint8_t *dst, ptrdiff_t dst_stride, const int16_t *filter_x, int x_step_q4, const int16_t *filter_y, int y_step_q4, int w, int h"
273 specialize vp9_convolve_avg $sse2_x86inc
274
275 prototype void vp9_convolve8 "const uint8_t *src, ptrdiff_t src_stride, uint8_t *dst, ptrdiff_t dst_stride, const int16_t *filter_x, int x_step_q4, const int16_t *filter_y, int y_step_q4, int w, int h"
276 specialize vp9_convolve8 ssse3 neon
277
278 prototype void vp9_convolve8_horiz "const uint8_t *src, ptrdiff_t src_stride, uint8_t *dst, ptrdiff_t dst_stride, const int16_t *filter_x, int x_step_q4, const int16_t *filter_y, int y_step_q4, int w, int h"
279 specialize vp9_convolve8_horiz ssse3 neon
280
281 prototype void vp9_convolve8_vert "const uint8_t *src, ptrdiff_t src_stride, uint8_t *dst, ptrdiff_t dst_stride, const int16_t *filter_x, int x_step_q4, const int16_t *filter_y, int y_step_q4, int w, int h"
282 specialize vp9_convolve8_vert ssse3 neon
283
284 prototype void vp9_convolve8_avg "const uint8_t *src, ptrdiff_t src_stride, uint8_t *dst, ptrdiff_t dst_stride, const int16_t *filter_x, int x_step_q4, const int16_t *filter_y, int y_step_q4, int w, int h"
285 specialize vp9_convolve8_avg ssse3 neon
286
287 prototype void vp9_convolve8_avg_horiz "const uint8_t *src, ptrdiff_t src_stride, uint8_t *dst, ptrdiff_t dst_stride, const int16_t *filter_x, int x_step_q4, const int16_t *filter_y, int y_step_q4, int w, int h"
288 specialize vp9_convolve8_avg_horiz ssse3 neon
289
290 prototype void vp9_convolve8_avg_vert "const uint8_t *src, ptrdiff_t src_stride, uint8_t *dst, ptrdiff_t dst_stride, const int16_t *filter_x, int x_step_q4, const int16_t *filter_y, int y_step_q4, int w, int h"
291 specialize vp9_convolve8_avg_vert ssse3 neon
292
293 #
294 # dct
295 #
296 prototype void vp9_short_idct4x4_1_add "int16_t *input, uint8_t *dest, int dest_stride"
297 specialize vp9_short_idct4x4_1_add sse2
298
299 prototype void vp9_short_idct4x4_add "int16_t *input, uint8_t *dest, int dest_stride"
300 specialize vp9_short_idct4x4_add sse2
301
302 prototype void vp9_short_idct8x8_1_add "int16_t *input, uint8_t *dest, int dest_stride"
303 specialize vp9_short_idct8x8_1_add sse2
304
305 prototype void vp9_short_idct8x8_add "int16_t *input, uint8_t *dest, int dest_stride"
306 specialize vp9_short_idct8x8_add sse2 neon
307
308 prototype void vp9_short_idct10_8x8_add "int16_t *input, uint8_t *dest, int dest_stride"
309 specialize vp9_short_idct10_8x8_add sse2
310
311 prototype void vp9_short_idct16x16_1_add "int16_t *input, uint8_t *dest, int dest_stride"
312 specialize vp9_short_idct16x16_1_add sse2
313
314 prototype void vp9_short_idct16x16_add "int16_t *input, uint8_t *dest, int dest_stride"
315 specialize vp9_short_idct16x16_add sse2
316
317 prototype void vp9_short_idct10_16x16_add "int16_t *input, uint8_t *dest, int dest_stride"
318 specialize vp9_short_idct10_16x16_add sse2
319
320 prototype void vp9_short_idct32x32_add "int16_t *input, uint8_t *dest, int dest_stride"
321 specialize vp9_short_idct32x32_add sse2
322
323 prototype void vp9_short_idct1_32x32 "int16_t *input, int16_t *output"
324 specialize vp9_short_idct1_32x32
325
326 prototype void vp9_short_iht4x4_add "int16_t *input, uint8_t *dest, int dest_stride, int tx_type"
327 specialize vp9_short_iht4x4_add sse2
328
329 prototype void vp9_short_iht8x8_add "int16_t *input, uint8_t *dest, int dest_stride, int tx_type"
330 specialize vp9_short_iht8x8_add sse2
331
332 prototype void vp9_short_iht16x16_add "int16_t *input, uint8_t *output, int pitch, int tx_type"
333 specialize vp9_short_iht16x16_add sse2
334
335 prototype void vp9_idct4_1d "int16_t *input, int16_t *output"
336 specialize vp9_idct4_1d sse2
337 # dct and add
338
339 prototype void vp9_short_iwalsh4x4_1_add "int16_t *input, uint8_t *dest, int dest_stride"
340 specialize vp9_short_iwalsh4x4_1_add
341
342 prototype void vp9_short_iwalsh4x4_add "int16_t *input, uint8_t *dest, int dest_stride"
343 specialize vp9_short_iwalsh4x4_add
344
345 prototype unsigned int vp9_sad32x3 "const uint8_t *src_ptr, int  src_stride, const uint8_t *ref_ptr, int ref_stride, int max_sad"
346 specialize vp9_sad32x3
347
348 prototype unsigned int vp9_sad3x32 "const uint8_t *src_ptr, int  src_stride, const uint8_t *ref_ptr, int ref_stride, int max_sad"
349 specialize vp9_sad3x32
350
351 #
352 # Encoder functions below this point.
353 #
354 if [ "$CONFIG_VP9_ENCODER" = "yes" ]; then
355
356
357 # variance
358 prototype unsigned int vp9_variance32x16 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
359 specialize vp9_variance32x16 sse2
360
361 prototype unsigned int vp9_variance16x32 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
362 specialize vp9_variance16x32 sse2
363
364 prototype unsigned int vp9_variance64x32 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
365 specialize vp9_variance64x32 sse2
366
367 prototype unsigned int vp9_variance32x64 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
368 specialize vp9_variance32x64 sse2
369
370 prototype unsigned int vp9_variance32x32 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
371 specialize vp9_variance32x32 sse2
372
373 prototype unsigned int vp9_variance64x64 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
374 specialize vp9_variance64x64 sse2
375
376 prototype unsigned int vp9_variance16x16 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
377 specialize vp9_variance16x16 mmx sse2
378
379 prototype unsigned int vp9_variance16x8 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
380 specialize vp9_variance16x8 mmx sse2
381
382 prototype unsigned int vp9_variance8x16 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
383 specialize vp9_variance8x16 mmx sse2
384
385 prototype unsigned int vp9_variance8x8 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
386 specialize vp9_variance8x8 mmx sse2
387
388 prototype void vp9_get_sse_sum_8x8 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse, int *sum"
389 specialize vp9_get_sse_sum_8x8 sse2
390 vp9_get_sse_sum_8x8_sse2=vp9_get8x8var_sse2
391
392 prototype unsigned int vp9_variance8x4 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
393 specialize vp9_variance8x4 sse2
394
395 prototype unsigned int vp9_variance4x8 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
396 specialize vp9_variance4x8 sse2
397
398 prototype unsigned int vp9_variance4x4 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
399 specialize vp9_variance4x4 mmx sse2
400
401 prototype unsigned int vp9_sub_pixel_variance64x64 "const uint8_t *src_ptr, int source_stride, int xoffset, int  yoffset, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
402 specialize vp9_sub_pixel_variance64x64 sse2 ssse3
403
404 prototype unsigned int vp9_sub_pixel_avg_variance64x64 "const uint8_t *src_ptr, int source_stride, int xoffset, int  yoffset, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse, const uint8_t *second_pred"
405 specialize vp9_sub_pixel_avg_variance64x64 sse2 ssse3
406
407 prototype unsigned int vp9_sub_pixel_variance32x64 "const uint8_t *src_ptr, int source_stride, int xoffset, int  yoffset, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
408 specialize vp9_sub_pixel_variance32x64 sse2 ssse3
409
410 prototype unsigned int vp9_sub_pixel_avg_variance32x64 "const uint8_t *src_ptr, int source_stride, int xoffset, int  yoffset, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse, const uint8_t *second_pred"
411 specialize vp9_sub_pixel_avg_variance32x64 sse2 ssse3
412
413 prototype unsigned int vp9_sub_pixel_variance64x32 "const uint8_t *src_ptr, int source_stride, int xoffset, int  yoffset, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
414 specialize vp9_sub_pixel_variance64x32 sse2 ssse3
415
416 prototype unsigned int vp9_sub_pixel_avg_variance64x32 "const uint8_t *src_ptr, int source_stride, int xoffset, int  yoffset, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse, const uint8_t *second_pred"
417 specialize vp9_sub_pixel_avg_variance64x32 sse2 ssse3
418
419 prototype unsigned int vp9_sub_pixel_variance32x16 "const uint8_t *src_ptr, int source_stride, int xoffset, int  yoffset, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
420 specialize vp9_sub_pixel_variance32x16 sse2 ssse3
421
422 prototype unsigned int vp9_sub_pixel_avg_variance32x16 "const uint8_t *src_ptr, int source_stride, int xoffset, int  yoffset, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse, const uint8_t *second_pred"
423 specialize vp9_sub_pixel_avg_variance32x16 sse2 ssse3
424
425 prototype unsigned int vp9_sub_pixel_variance16x32 "const uint8_t *src_ptr, int source_stride, int xoffset, int  yoffset, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
426 specialize vp9_sub_pixel_variance16x32 sse2 ssse3
427
428 prototype unsigned int vp9_sub_pixel_avg_variance16x32 "const uint8_t *src_ptr, int source_stride, int xoffset, int  yoffset, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse, const uint8_t *second_pred"
429 specialize vp9_sub_pixel_avg_variance16x32 sse2 ssse3
430
431 prototype unsigned int vp9_sub_pixel_variance32x32 "const uint8_t *src_ptr, int source_stride, int xoffset, int  yoffset, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
432 specialize vp9_sub_pixel_variance32x32 sse2 ssse3
433
434 prototype unsigned int vp9_sub_pixel_avg_variance32x32 "const uint8_t *src_ptr, int source_stride, int xoffset, int  yoffset, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse, const uint8_t *second_pred"
435 specialize vp9_sub_pixel_avg_variance32x32 sse2 ssse3
436
437 prototype unsigned int vp9_sub_pixel_variance16x16 "const uint8_t *src_ptr, int source_stride, int xoffset, int  yoffset, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
438 specialize vp9_sub_pixel_variance16x16 sse2 ssse3
439
440 prototype unsigned int vp9_sub_pixel_avg_variance16x16 "const uint8_t *src_ptr, int source_stride, int xoffset, int  yoffset, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse, const uint8_t *second_pred"
441 specialize vp9_sub_pixel_avg_variance16x16 sse2 ssse3
442
443 prototype unsigned int vp9_sub_pixel_variance8x16 "const uint8_t *src_ptr, int source_stride, int xoffset, int  yoffset, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
444 specialize vp9_sub_pixel_variance8x16 sse2 ssse3
445
446 prototype unsigned int vp9_sub_pixel_avg_variance8x16 "const uint8_t *src_ptr, int source_stride, int xoffset, int  yoffset, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse, const uint8_t *second_pred"
447 specialize vp9_sub_pixel_avg_variance8x16 sse2 ssse3
448
449 prototype unsigned int vp9_sub_pixel_variance16x8 "const uint8_t *src_ptr, int source_stride, int xoffset, int  yoffset, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
450 specialize vp9_sub_pixel_variance16x8 sse2 ssse3
451
452 prototype unsigned int vp9_sub_pixel_avg_variance16x8 "const uint8_t *src_ptr, int source_stride, int xoffset, int  yoffset, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse, const uint8_t *second_pred"
453 specialize vp9_sub_pixel_avg_variance16x8 sse2 ssse3
454
455 prototype unsigned int vp9_sub_pixel_variance8x8 "const uint8_t *src_ptr, int source_stride, int xoffset, int  yoffset, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
456 specialize vp9_sub_pixel_variance8x8 sse2 ssse3
457
458 prototype unsigned int vp9_sub_pixel_avg_variance8x8 "const uint8_t *src_ptr, int source_stride, int xoffset, int  yoffset, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse, const uint8_t *second_pred"
459 specialize vp9_sub_pixel_avg_variance8x8 sse2 ssse3
460
461 # TODO(jingning): need to convert 8x4/4x8 functions into mmx/sse form
462 prototype unsigned int vp9_sub_pixel_variance8x4 "const uint8_t *src_ptr, int source_stride, int xoffset, int yoffset, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
463 specialize vp9_sub_pixel_variance8x4 sse2 ssse3
464
465 prototype unsigned int vp9_sub_pixel_avg_variance8x4 "const uint8_t *src_ptr, int source_stride, int xoffset, int yoffset, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse, const uint8_t *second_pred"
466 specialize vp9_sub_pixel_avg_variance8x4 sse2 ssse3
467
468 prototype unsigned int vp9_sub_pixel_variance4x8 "const uint8_t *src_ptr, int source_stride, int xoffset, int yoffset, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
469 specialize vp9_sub_pixel_variance4x8 sse ssse3
470
471 prototype unsigned int vp9_sub_pixel_avg_variance4x8 "const uint8_t *src_ptr, int source_stride, int xoffset, int yoffset, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse, const uint8_t *second_pred"
472 specialize vp9_sub_pixel_avg_variance4x8 sse ssse3
473
474 prototype unsigned int vp9_sub_pixel_variance4x4 "const uint8_t *src_ptr, int source_stride, int xoffset, int  yoffset, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
475 specialize vp9_sub_pixel_variance4x4 sse ssse3
476 #vp9_sub_pixel_variance4x4_sse2=vp9_sub_pixel_variance4x4_wmt
477
478 prototype unsigned int vp9_sub_pixel_avg_variance4x4 "const uint8_t *src_ptr, int source_stride, int xoffset, int  yoffset, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse, const uint8_t *second_pred"
479 specialize vp9_sub_pixel_avg_variance4x4 sse ssse3
480
481 prototype unsigned int vp9_sad64x64 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int  ref_stride, unsigned int max_sad"
482 specialize vp9_sad64x64 sse2
483
484 prototype unsigned int vp9_sad32x64 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, unsigned int max_sad"
485 specialize vp9_sad32x64 sse2
486
487 prototype unsigned int vp9_sad64x32 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, unsigned int max_sad"
488 specialize vp9_sad64x32 sse2
489
490 prototype unsigned int vp9_sad32x16 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, unsigned int max_sad"
491 specialize vp9_sad32x16 sse2
492
493 prototype unsigned int vp9_sad16x32 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, unsigned int max_sad"
494 specialize vp9_sad16x32 sse2
495
496 prototype unsigned int vp9_sad32x32 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int  ref_stride, unsigned int max_sad"
497 specialize vp9_sad32x32 sse2
498
499 prototype unsigned int vp9_sad16x16 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int  ref_stride, unsigned int max_sad"
500 specialize vp9_sad16x16 mmx sse2
501
502 prototype unsigned int vp9_sad16x8 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int  ref_stride, unsigned int max_sad"
503 specialize vp9_sad16x8 mmx sse2
504
505 prototype unsigned int vp9_sad8x16 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int  ref_stride, unsigned int max_sad"
506 specialize vp9_sad8x16 mmx sse2
507
508 prototype unsigned int vp9_sad8x8 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int  ref_stride, unsigned int max_sad"
509 specialize vp9_sad8x8 mmx sse2
510
511 prototype unsigned int vp9_sad8x4 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, unsigned int max_sad"
512 specialize vp9_sad8x4 sse2
513
514 prototype unsigned int vp9_sad4x8 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, unsigned int max_sad"
515 specialize vp9_sad4x8 sse
516
517 prototype unsigned int vp9_sad4x4 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int  ref_stride, unsigned int max_sad"
518 specialize vp9_sad4x4 mmx sse
519
520 prototype unsigned int vp9_sad64x64_avg "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int  ref_stride, const uint8_t *second_pred, unsigned int max_sad"
521 specialize vp9_sad64x64_avg sse2
522
523 prototype unsigned int vp9_sad32x64_avg "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, const uint8_t *second_pred, unsigned int max_sad"
524 specialize vp9_sad32x64_avg sse2
525
526 prototype unsigned int vp9_sad64x32_avg "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, const uint8_t *second_pred, unsigned int max_sad"
527 specialize vp9_sad64x32_avg sse2
528
529 prototype unsigned int vp9_sad32x16_avg "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, const uint8_t *second_pred, unsigned int max_sad"
530 specialize vp9_sad32x16_avg sse2
531
532 prototype unsigned int vp9_sad16x32_avg "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, const uint8_t *second_pred, unsigned int max_sad"
533 specialize vp9_sad16x32_avg sse2
534
535 prototype unsigned int vp9_sad32x32_avg "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int  ref_stride, const uint8_t *second_pred, unsigned int max_sad"
536 specialize vp9_sad32x32_avg sse2
537
538 prototype unsigned int vp9_sad16x16_avg "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int  ref_stride, const uint8_t *second_pred, unsigned int max_sad"
539 specialize vp9_sad16x16_avg sse2
540
541 prototype unsigned int vp9_sad16x8_avg "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int  ref_stride, const uint8_t *second_pred, unsigned int max_sad"
542 specialize vp9_sad16x8_avg sse2
543
544 prototype unsigned int vp9_sad8x16_avg "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int  ref_stride, const uint8_t *second_pred, unsigned int max_sad"
545 specialize vp9_sad8x16_avg sse2
546
547 prototype unsigned int vp9_sad8x8_avg "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int  ref_stride, const uint8_t *second_pred, unsigned int max_sad"
548 specialize vp9_sad8x8_avg sse2
549
550 prototype unsigned int vp9_sad8x4_avg "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, const uint8_t *second_pred, unsigned int max_sad"
551 specialize vp9_sad8x4_avg sse2
552
553 prototype unsigned int vp9_sad4x8_avg "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, const uint8_t *second_pred, unsigned int max_sad"
554 specialize vp9_sad4x8_avg sse
555
556 prototype unsigned int vp9_sad4x4_avg "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int  ref_stride, const uint8_t *second_pred, unsigned int max_sad"
557 specialize vp9_sad4x4_avg sse
558
559 prototype unsigned int vp9_variance_halfpixvar16x16_h "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
560 specialize vp9_variance_halfpixvar16x16_h sse2
561 vp9_variance_halfpixvar16x16_h_sse2=vp9_variance_halfpixvar16x16_h_wmt
562
563 prototype unsigned int vp9_variance_halfpixvar16x16_v "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
564 specialize vp9_variance_halfpixvar16x16_v sse2
565 vp9_variance_halfpixvar16x16_v_sse2=vp9_variance_halfpixvar16x16_v_wmt
566
567 prototype unsigned int vp9_variance_halfpixvar16x16_hv "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
568 specialize vp9_variance_halfpixvar16x16_hv sse2
569 vp9_variance_halfpixvar16x16_hv_sse2=vp9_variance_halfpixvar16x16_hv_wmt
570
571 prototype unsigned int vp9_variance_halfpixvar64x64_h "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
572 specialize vp9_variance_halfpixvar64x64_h
573
574 prototype unsigned int vp9_variance_halfpixvar64x64_v "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
575 specialize vp9_variance_halfpixvar64x64_v
576
577 prototype unsigned int vp9_variance_halfpixvar64x64_hv "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
578 specialize vp9_variance_halfpixvar64x64_hv
579
580 prototype unsigned int vp9_variance_halfpixvar32x32_h "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
581 specialize vp9_variance_halfpixvar32x32_h
582
583 prototype unsigned int vp9_variance_halfpixvar32x32_v "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
584 specialize vp9_variance_halfpixvar32x32_v
585
586 prototype unsigned int vp9_variance_halfpixvar32x32_hv "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
587 specialize vp9_variance_halfpixvar32x32_hv
588
589 prototype void vp9_sad64x64x3 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int  ref_stride, unsigned int *sad_array"
590 specialize vp9_sad64x64x3
591
592 prototype void vp9_sad32x32x3 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int  ref_stride, unsigned int *sad_array"
593 specialize vp9_sad32x32x3
594
595 prototype void vp9_sad16x16x3 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int  ref_stride, unsigned int *sad_array"
596 specialize vp9_sad16x16x3 sse3 ssse3
597
598 prototype void vp9_sad16x8x3 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int  ref_stride, unsigned int *sad_array"
599 specialize vp9_sad16x8x3 sse3 ssse3
600
601 prototype void vp9_sad8x16x3 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int  ref_stride, unsigned int *sad_array"
602 specialize vp9_sad8x16x3 sse3
603
604 prototype void vp9_sad8x8x3 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int  ref_stride, unsigned int *sad_array"
605 specialize vp9_sad8x8x3 sse3
606
607 prototype void vp9_sad4x4x3 "const uint8_t *src_ptr, int source_stride, const uint8_t *ref_ptr, int  ref_stride, unsigned int *sad_array"
608 specialize vp9_sad4x4x3 sse3
609
610 prototype void vp9_sad64x64x8 "const uint8_t *src_ptr, int  src_stride, const uint8_t *ref_ptr, int  ref_stride, uint32_t *sad_array"
611 specialize vp9_sad64x64x8
612
613 prototype void vp9_sad32x32x8 "const uint8_t *src_ptr, int  src_stride, const uint8_t *ref_ptr, int  ref_stride, uint32_t *sad_array"
614 specialize vp9_sad32x32x8
615
616 prototype void vp9_sad16x16x8 "const uint8_t *src_ptr, int  src_stride, const uint8_t *ref_ptr, int  ref_stride, uint32_t *sad_array"
617 specialize vp9_sad16x16x8 sse4
618
619 prototype void vp9_sad16x8x8 "const uint8_t *src_ptr, int  src_stride, const uint8_t *ref_ptr, int  ref_stride, uint32_t *sad_array"
620 specialize vp9_sad16x8x8 sse4
621
622 prototype void vp9_sad8x16x8 "const uint8_t *src_ptr, int  src_stride, const uint8_t *ref_ptr, int  ref_stride, uint32_t *sad_array"
623 specialize vp9_sad8x16x8 sse4
624
625 prototype void vp9_sad8x8x8 "const uint8_t *src_ptr, int  src_stride, const uint8_t *ref_ptr, int  ref_stride, uint32_t *sad_array"
626 specialize vp9_sad8x8x8 sse4
627
628 prototype void vp9_sad8x4x8 "const uint8_t *src_ptr, int src_stride, const uint8_t *ref_ptr, int ref_stride, uint32_t *sad_array"
629 specialize vp9_sad8x4x8
630
631 prototype void vp9_sad4x8x8 "const uint8_t *src_ptr, int src_stride, const uint8_t *ref_ptr, int ref_stride, uint32_t *sad_array"
632 specialize vp9_sad4x8x8
633
634 prototype void vp9_sad4x4x8 "const uint8_t *src_ptr, int  src_stride, const uint8_t *ref_ptr, int  ref_stride, uint32_t *sad_array"
635 specialize vp9_sad4x4x8 sse4
636
637 prototype void vp9_sad64x64x4d "const uint8_t *src_ptr, int  src_stride, const uint8_t* const ref_ptr[], int  ref_stride, unsigned int *sad_array"
638 specialize vp9_sad64x64x4d sse2
639
640 prototype void vp9_sad32x64x4d "const uint8_t *src_ptr, int  src_stride, const uint8_t* const ref_ptr[], int  ref_stride, unsigned int *sad_array"
641 specialize vp9_sad32x64x4d sse2
642
643 prototype void vp9_sad64x32x4d "const uint8_t *src_ptr, int  src_stride, const uint8_t* const ref_ptr[], int  ref_stride, unsigned int *sad_array"
644 specialize vp9_sad64x32x4d sse2
645
646 prototype void vp9_sad32x16x4d "const uint8_t *src_ptr, int  src_stride, const uint8_t* const ref_ptr[], int  ref_stride, unsigned int *sad_array"
647 specialize vp9_sad32x16x4d sse2
648
649 prototype void vp9_sad16x32x4d "const uint8_t *src_ptr, int  src_stride, const uint8_t* const ref_ptr[], int  ref_stride, unsigned int *sad_array"
650 specialize vp9_sad16x32x4d sse2
651
652 prototype void vp9_sad32x32x4d "const uint8_t *src_ptr, int  src_stride, const uint8_t* const ref_ptr[], int  ref_stride, unsigned int *sad_array"
653 specialize vp9_sad32x32x4d sse2
654
655 prototype void vp9_sad16x16x4d "const uint8_t *src_ptr, int  src_stride, const uint8_t* const ref_ptr[], int  ref_stride, unsigned int *sad_array"
656 specialize vp9_sad16x16x4d sse2
657
658 prototype void vp9_sad16x8x4d "const uint8_t *src_ptr, int  src_stride, const uint8_t* const ref_ptr[], int  ref_stride, unsigned int *sad_array"
659 specialize vp9_sad16x8x4d sse2
660
661 prototype void vp9_sad8x16x4d "const uint8_t *src_ptr, int  src_stride, const uint8_t* const ref_ptr[], int  ref_stride, unsigned int *sad_array"
662 specialize vp9_sad8x16x4d sse2
663
664 prototype void vp9_sad8x8x4d "const uint8_t *src_ptr, int  src_stride, const uint8_t* const ref_ptr[], int  ref_stride, unsigned int *sad_array"
665 specialize vp9_sad8x8x4d sse2
666
667 # TODO(jingning): need to convert these 4x8/8x4 functions into sse2 form
668 prototype void vp9_sad8x4x4d "const uint8_t *src_ptr, int src_stride, const uint8_t* const ref_ptr[], int ref_stride, unsigned int *sad_array"
669 specialize vp9_sad8x4x4d sse2
670
671 prototype void vp9_sad4x8x4d "const uint8_t *src_ptr, int src_stride, const uint8_t* const ref_ptr[], int ref_stride, unsigned int *sad_array"
672 specialize vp9_sad4x8x4d sse
673
674 prototype void vp9_sad4x4x4d "const uint8_t *src_ptr, int  src_stride, const uint8_t* const ref_ptr[], int  ref_stride, unsigned int *sad_array"
675 specialize vp9_sad4x4x4d sse
676
677 #prototype unsigned int vp9_sub_pixel_mse16x16 "const uint8_t *src_ptr, int  src_pixels_per_line, int  xoffset, int  yoffset, const uint8_t *dst_ptr, int dst_pixels_per_line, unsigned int *sse"
678 #specialize vp9_sub_pixel_mse16x16 sse2 mmx
679
680 prototype unsigned int vp9_mse16x16 "const uint8_t *src_ptr, int  source_stride, const uint8_t *ref_ptr, int  recon_stride, unsigned int *sse"
681 specialize vp9_mse16x16 mmx sse2
682 vp9_mse16x16_sse2=vp9_mse16x16_wmt
683
684 prototype unsigned int vp9_mse8x16 "const uint8_t *src_ptr, int  source_stride, const uint8_t *ref_ptr, int  recon_stride, unsigned int *sse"
685 specialize vp9_mse8x16
686
687 prototype unsigned int vp9_mse16x8 "const uint8_t *src_ptr, int  source_stride, const uint8_t *ref_ptr, int  recon_stride, unsigned int *sse"
688 specialize vp9_mse16x8
689
690 prototype unsigned int vp9_mse8x8 "const uint8_t *src_ptr, int  source_stride, const uint8_t *ref_ptr, int  recon_stride, unsigned int *sse"
691 specialize vp9_mse8x8
692
693 prototype unsigned int vp9_sub_pixel_mse64x64 "const uint8_t *src_ptr, int  source_stride, int  xoffset, int  yoffset, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
694 specialize vp9_sub_pixel_mse64x64
695
696 prototype unsigned int vp9_sub_pixel_mse32x32 "const uint8_t *src_ptr, int  source_stride, int  xoffset, int  yoffset, const uint8_t *ref_ptr, int ref_stride, unsigned int *sse"
697 specialize vp9_sub_pixel_mse32x32
698
699 prototype unsigned int vp9_get_mb_ss "const int16_t *"
700 specialize vp9_get_mb_ss mmx sse2
701 # ENCODEMB INVOKE
702
703 prototype int64_t vp9_block_error "int16_t *coeff, int16_t *dqcoeff, intptr_t block_size, int64_t *ssz"
704 specialize vp9_block_error $sse2_x86inc
705
706 prototype void vp9_subtract_block "int rows, int cols, int16_t *diff_ptr, ptrdiff_t diff_stride, const uint8_t *src_ptr, ptrdiff_t src_stride, const uint8_t *pred_ptr, ptrdiff_t pred_stride"
707 specialize vp9_subtract_block $sse2_x86inc
708
709 prototype void vp9_quantize_b "int16_t *coeff_ptr, intptr_t n_coeffs, int skip_block, int16_t *zbin_ptr, int16_t *round_ptr, int16_t *quant_ptr, int16_t *quant_shift_ptr, int16_t *qcoeff_ptr, int16_t *dqcoeff_ptr, int16_t *dequant_ptr, int zbin_oq_value, uint16_t *eob_ptr, const int16_t *scan, const int16_t *iscan"
710 specialize vp9_quantize_b $ssse3_x86_64
711
712 prototype void vp9_quantize_b_32x32 "int16_t *coeff_ptr, intptr_t n_coeffs, int skip_block, int16_t *zbin_ptr, int16_t *round_ptr, int16_t *quant_ptr, int16_t *quant_shift_ptr, int16_t *qcoeff_ptr, int16_t *dqcoeff_ptr, int16_t *dequant_ptr, int zbin_oq_value, uint16_t *eob_ptr, const int16_t *scan, const int16_t *iscan"
713 specialize vp9_quantize_b_32x32 $ssse3_x86_64
714
715 #
716 # Structured Similarity (SSIM)
717 #
718 if [ "$CONFIG_INTERNAL_STATS" = "yes" ]; then
719     prototype void vp9_ssim_parms_8x8 "uint8_t *s, int sp, uint8_t *r, int rp, unsigned long *sum_s, unsigned long *sum_r, unsigned long *sum_sq_s, unsigned long *sum_sq_r, unsigned long *sum_sxr"
720     specialize vp9_ssim_parms_8x8 $sse2_x86_64
721
722     prototype void vp9_ssim_parms_16x16 "uint8_t *s, int sp, uint8_t *r, int rp, unsigned long *sum_s, unsigned long *sum_r, unsigned long *sum_sq_s, unsigned long *sum_sq_r, unsigned long *sum_sxr"
723     specialize vp9_ssim_parms_16x16 $sse2_x86_64
724 fi
725
726 # fdct functions
727 prototype void vp9_short_fht4x4 "int16_t *InputData, int16_t *OutputData, int pitch, int tx_type"
728 specialize vp9_short_fht4x4 sse2
729
730 prototype void vp9_short_fht8x8 "int16_t *InputData, int16_t *OutputData, int pitch, int tx_type"
731 specialize vp9_short_fht8x8 sse2
732
733 prototype void vp9_short_fht16x16 "int16_t *InputData, int16_t *OutputData, int pitch, int tx_type"
734 specialize vp9_short_fht16x16 sse2
735
736 prototype void vp9_short_fdct8x8 "int16_t *InputData, int16_t *OutputData, int pitch"
737 specialize vp9_short_fdct8x8 sse2
738
739 prototype void vp9_short_fdct4x4 "int16_t *InputData, int16_t *OutputData, int pitch"
740 specialize vp9_short_fdct4x4 sse2
741
742 prototype void vp9_short_fdct8x4 "int16_t *InputData, int16_t *OutputData, int pitch"
743 specialize vp9_short_fdct8x4 sse2
744
745 prototype void vp9_short_fdct32x32 "int16_t *InputData, int16_t *OutputData, int pitch"
746 specialize vp9_short_fdct32x32
747
748 prototype void vp9_short_fdct32x32_rd "int16_t *InputData, int16_t *OutputData, int pitch"
749 specialize vp9_short_fdct32x32_rd sse2
750
751 prototype void vp9_short_fdct16x16 "int16_t *InputData, int16_t *OutputData, int pitch"
752 specialize vp9_short_fdct16x16 sse2
753
754 prototype void vp9_short_walsh4x4 "int16_t *InputData, int16_t *OutputData, int pitch"
755 specialize vp9_short_walsh4x4
756
757 prototype void vp9_short_walsh8x4 "int16_t *InputData, int16_t *OutputData, int pitch"
758 specialize vp9_short_walsh8x4
759
760 #
761 # Motion search
762 #
763 prototype int vp9_full_search_sad "struct macroblock *x, union int_mv *ref_mv, int sad_per_bit, int distance, struct vp9_variance_vtable *fn_ptr, DEC_MVCOSTS, union int_mv *center_mv, int n"
764 specialize vp9_full_search_sad sse3 sse4_1
765 vp9_full_search_sad_sse3=vp9_full_search_sadx3
766 vp9_full_search_sad_sse4_1=vp9_full_search_sadx8
767
768 prototype int vp9_refining_search_sad "struct macroblock *x, union int_mv *ref_mv, int sad_per_bit, int distance, struct vp9_variance_vtable *fn_ptr, DEC_MVCOSTS, union int_mv *center_mv"
769 specialize vp9_refining_search_sad sse3
770 vp9_refining_search_sad_sse3=vp9_refining_search_sadx4
771
772 prototype int vp9_diamond_search_sad "struct macroblock *x, union int_mv *ref_mv, union int_mv *best_mv, int search_param, int sad_per_bit, int *num00, struct vp9_variance_vtable *fn_ptr, DEC_MVCOSTS, union int_mv *center_mv"
773 specialize vp9_diamond_search_sad sse3
774 vp9_diamond_search_sad_sse3=vp9_diamond_search_sadx4
775
776 prototype void vp9_temporal_filter_apply "uint8_t *frame1, unsigned int stride, uint8_t *frame2, unsigned int block_size, int strength, int filter_weight, unsigned int *accumulator, uint16_t *count"
777 specialize vp9_temporal_filter_apply sse2
778
779 prototype void vp9_yv12_copy_partial_frame "struct yv12_buffer_config *src_ybc, struct yv12_buffer_config *dst_ybc, int fraction"
780 specialize vp9_yv12_copy_partial_frame
781
782
783 fi
784 # end encoder functions