]> granicus.if.org Git - libvpx/blob - vpx_dsp/vpx_dsp.mk
Merge "Add vpx_highbd_idct16x16_10_add_neon()"
[libvpx] / vpx_dsp / vpx_dsp.mk
1 ##
2 ## Copyright (c) 2015 The WebM project authors. All Rights Reserved.
3 ##
4 ##  Use of this source code is governed by a BSD-style license
5 ##  that can be found in the LICENSE file in the root of the source
6 ##  tree. An additional intellectual property rights grant can be found
7 ##  in the file PATENTS.  All contributing project authors may
8 ##  be found in the AUTHORS file in the root of the source tree.
9 ##
10
11 DSP_SRCS-yes += vpx_dsp.mk
12 DSP_SRCS-yes += vpx_dsp_common.h
13
14 DSP_SRCS-$(HAVE_MSA)    += mips/macros_msa.h
15
16 DSP_SRCS-$(HAVE_AVX2)   += x86/bitdepth_conversion_avx2.h
17 DSP_SRCS-$(HAVE_SSE2)   += x86/bitdepth_conversion_sse2.h
18 # This file is included in libs.mk. Including it here would cause it to be
19 # compiled into an object. Even as an empty file, this would create an
20 # executable section on the stack.
21 #DSP_SRCS-$(HAVE_SSE2)   += x86/bitdepth_conversion_sse2$(ASM)
22
23 # bit reader
24 DSP_SRCS-yes += prob.h
25 DSP_SRCS-yes += prob.c
26
27 ifeq ($(CONFIG_ENCODERS),yes)
28 DSP_SRCS-yes += bitwriter.h
29 DSP_SRCS-yes += bitwriter.c
30 DSP_SRCS-yes += bitwriter_buffer.c
31 DSP_SRCS-yes += bitwriter_buffer.h
32 DSP_SRCS-yes += psnr.c
33 DSP_SRCS-yes += psnr.h
34 DSP_SRCS-$(CONFIG_INTERNAL_STATS) += ssim.c
35 DSP_SRCS-$(CONFIG_INTERNAL_STATS) += ssim.h
36 DSP_SRCS-$(CONFIG_INTERNAL_STATS) += psnrhvs.c
37 DSP_SRCS-$(CONFIG_INTERNAL_STATS) += fastssim.c
38 endif
39
40 ifeq ($(CONFIG_DECODERS),yes)
41 DSP_SRCS-yes += bitreader.h
42 DSP_SRCS-yes += bitreader.c
43 DSP_SRCS-yes += bitreader_buffer.c
44 DSP_SRCS-yes += bitreader_buffer.h
45 endif
46
47 # intra predictions
48 DSP_SRCS-yes += intrapred.c
49
50 DSP_SRCS-$(HAVE_SSE) += x86/intrapred_sse2.asm
51 DSP_SRCS-$(HAVE_SSE2) += x86/intrapred_sse2.asm
52 DSP_SRCS-$(HAVE_SSSE3) += x86/intrapred_ssse3.asm
53 DSP_SRCS-$(HAVE_SSSE3) += x86/vpx_subpixel_8t_ssse3.asm
54
55 ifeq ($(CONFIG_VP9_HIGHBITDEPTH),yes)
56 DSP_SRCS-$(HAVE_SSE)  += x86/highbd_intrapred_sse2.asm
57 DSP_SRCS-$(HAVE_SSE2) += x86/highbd_intrapred_sse2.asm
58 DSP_SRCS-$(HAVE_NEON) += arm/highbd_intrapred_neon.c
59 endif  # CONFIG_VP9_HIGHBITDEPTH
60
61 ifneq ($(filter yes,$(CONFIG_POSTPROC) $(CONFIG_VP9_POSTPROC)),)
62 DSP_SRCS-yes += add_noise.c
63 DSP_SRCS-yes += deblock.c
64 DSP_SRCS-yes += postproc.h
65 DSP_SRCS-$(HAVE_MSA) += mips/add_noise_msa.c
66 DSP_SRCS-$(HAVE_MSA) += mips/deblock_msa.c
67 DSP_SRCS-$(HAVE_NEON) += arm/deblock_neon.c
68 DSP_SRCS-$(HAVE_SSE2) += x86/add_noise_sse2.asm
69 DSP_SRCS-$(HAVE_SSE2) += x86/deblock_sse2.asm
70 endif # CONFIG_POSTPROC
71
72 DSP_SRCS-$(HAVE_NEON_ASM) += arm/intrapred_neon_asm$(ASM)
73 DSP_SRCS-$(HAVE_NEON) += arm/intrapred_neon.c
74 DSP_SRCS-$(HAVE_MSA) += mips/intrapred_msa.c
75 DSP_SRCS-$(HAVE_DSPR2)  += mips/intrapred4_dspr2.c
76 DSP_SRCS-$(HAVE_DSPR2)  += mips/intrapred8_dspr2.c
77 DSP_SRCS-$(HAVE_DSPR2)  += mips/intrapred16_dspr2.c
78
79 DSP_SRCS-$(HAVE_DSPR2)  += mips/common_dspr2.h
80 DSP_SRCS-$(HAVE_DSPR2)  += mips/common_dspr2.c
81
82 # interpolation filters
83 DSP_SRCS-yes += vpx_convolve.c
84 DSP_SRCS-yes += vpx_convolve.h
85 DSP_SRCS-yes += vpx_filter.h
86
87 DSP_SRCS-$(ARCH_X86)$(ARCH_X86_64) += x86/convolve.h
88 DSP_SRCS-$(ARCH_X86)$(ARCH_X86_64) += x86/vpx_asm_stubs.c
89 DSP_SRCS-$(HAVE_SSE2)  += x86/vpx_subpixel_8t_sse2.asm
90 DSP_SRCS-$(HAVE_SSE2)  += x86/vpx_subpixel_bilinear_sse2.asm
91 DSP_SRCS-$(HAVE_SSSE3) += x86/vpx_subpixel_8t_ssse3.asm
92 DSP_SRCS-$(HAVE_SSSE3) += x86/vpx_subpixel_bilinear_ssse3.asm
93 DSP_SRCS-$(HAVE_AVX2)  += x86/vpx_subpixel_8t_intrin_avx2.c
94 DSP_SRCS-$(HAVE_SSSE3) += x86/vpx_subpixel_8t_intrin_ssse3.c
95 ifeq ($(CONFIG_VP9_HIGHBITDEPTH),yes)
96 DSP_SRCS-$(HAVE_SSE2)  += x86/vpx_high_subpixel_8t_sse2.asm
97 DSP_SRCS-$(HAVE_SSE2)  += x86/vpx_high_subpixel_bilinear_sse2.asm
98 DSP_SRCS-$(HAVE_NEON)  += arm/highbd_vpx_convolve_copy_neon.c
99 DSP_SRCS-$(HAVE_NEON)  += arm/highbd_vpx_convolve_avg_neon.c
100 DSP_SRCS-$(HAVE_NEON)  += arm/highbd_vpx_convolve8_neon.c
101 DSP_SRCS-$(HAVE_NEON)  += arm/highbd_vpx_convolve_neon.c
102 endif
103
104 DSP_SRCS-$(HAVE_SSE2)  += x86/vpx_convolve_copy_sse2.asm
105
106 ifeq ($(HAVE_NEON_ASM),yes)
107 DSP_SRCS-yes += arm/vpx_convolve_copy_neon_asm$(ASM)
108 DSP_SRCS-yes += arm/vpx_convolve8_avg_neon_asm$(ASM)
109 DSP_SRCS-yes += arm/vpx_convolve8_neon_asm$(ASM)
110 DSP_SRCS-yes += arm/vpx_convolve_avg_neon_asm$(ASM)
111 DSP_SRCS-yes += arm/vpx_convolve_neon.c
112 else
113 ifeq ($(HAVE_NEON),yes)
114 DSP_SRCS-yes += arm/vpx_convolve_copy_neon.c
115 DSP_SRCS-yes += arm/vpx_convolve8_neon.c
116 DSP_SRCS-yes += arm/vpx_convolve_avg_neon.c
117 DSP_SRCS-yes += arm/vpx_convolve_neon.c
118 endif  # HAVE_NEON
119 endif  # HAVE_NEON_ASM
120
121 # common (msa)
122 DSP_SRCS-$(HAVE_MSA) += mips/vpx_convolve8_avg_horiz_msa.c
123 DSP_SRCS-$(HAVE_MSA) += mips/vpx_convolve8_avg_msa.c
124 DSP_SRCS-$(HAVE_MSA) += mips/vpx_convolve8_avg_vert_msa.c
125 DSP_SRCS-$(HAVE_MSA) += mips/vpx_convolve8_horiz_msa.c
126 DSP_SRCS-$(HAVE_MSA) += mips/vpx_convolve8_msa.c
127 DSP_SRCS-$(HAVE_MSA) += mips/vpx_convolve8_vert_msa.c
128 DSP_SRCS-$(HAVE_MSA) += mips/vpx_convolve_avg_msa.c
129 DSP_SRCS-$(HAVE_MSA) += mips/vpx_convolve_copy_msa.c
130 DSP_SRCS-$(HAVE_MSA) += mips/vpx_convolve_msa.h
131
132 # common (dspr2)
133 DSP_SRCS-$(HAVE_DSPR2)  += mips/convolve_common_dspr2.h
134 DSP_SRCS-$(HAVE_DSPR2)  += mips/convolve2_avg_dspr2.c
135 DSP_SRCS-$(HAVE_DSPR2)  += mips/convolve2_avg_horiz_dspr2.c
136 DSP_SRCS-$(HAVE_DSPR2)  += mips/convolve2_dspr2.c
137 DSP_SRCS-$(HAVE_DSPR2)  += mips/convolve2_horiz_dspr2.c
138 DSP_SRCS-$(HAVE_DSPR2)  += mips/convolve2_vert_dspr2.c
139 DSP_SRCS-$(HAVE_DSPR2)  += mips/convolve8_avg_dspr2.c
140 DSP_SRCS-$(HAVE_DSPR2)  += mips/convolve8_avg_horiz_dspr2.c
141 DSP_SRCS-$(HAVE_DSPR2)  += mips/convolve8_dspr2.c
142 DSP_SRCS-$(HAVE_DSPR2)  += mips/convolve8_horiz_dspr2.c
143 DSP_SRCS-$(HAVE_DSPR2)  += mips/convolve8_vert_dspr2.c
144
145 # loop filters
146 DSP_SRCS-yes += loopfilter.c
147
148 DSP_SRCS-$(ARCH_X86)$(ARCH_X86_64)   += x86/loopfilter_sse2.c
149 DSP_SRCS-$(HAVE_AVX2)                += x86/loopfilter_avx2.c
150
151 ifeq ($(HAVE_NEON_ASM),yes)
152 DSP_SRCS-yes  += arm/loopfilter_16_neon$(ASM)
153 DSP_SRCS-yes  += arm/loopfilter_8_neon$(ASM)
154 DSP_SRCS-yes  += arm/loopfilter_4_neon$(ASM)
155 else
156 DSP_SRCS-$(HAVE_NEON)   += arm/loopfilter_neon.c
157 endif  # HAVE_NEON_ASM
158
159 DSP_SRCS-$(HAVE_MSA)    += mips/loopfilter_msa.h
160 DSP_SRCS-$(HAVE_MSA)    += mips/loopfilter_16_msa.c
161 DSP_SRCS-$(HAVE_MSA)    += mips/loopfilter_8_msa.c
162 DSP_SRCS-$(HAVE_MSA)    += mips/loopfilter_4_msa.c
163 DSP_SRCS-$(HAVE_DSPR2)  += mips/loopfilter_filters_dspr2.h
164 DSP_SRCS-$(HAVE_DSPR2)  += mips/loopfilter_filters_dspr2.c
165 DSP_SRCS-$(HAVE_DSPR2)  += mips/loopfilter_macros_dspr2.h
166 DSP_SRCS-$(HAVE_DSPR2)  += mips/loopfilter_masks_dspr2.h
167 DSP_SRCS-$(HAVE_DSPR2)  += mips/loopfilter_mb_dspr2.c
168 DSP_SRCS-$(HAVE_DSPR2)  += mips/loopfilter_mb_horiz_dspr2.c
169 DSP_SRCS-$(HAVE_DSPR2)  += mips/loopfilter_mb_vert_dspr2.c
170
171 ifeq ($(CONFIG_VP9_HIGHBITDEPTH),yes)
172 DSP_SRCS-$(HAVE_NEON)   += arm/highbd_loopfilter_neon.c
173 DSP_SRCS-$(HAVE_SSE2)   += x86/highbd_loopfilter_sse2.c
174 endif  # CONFIG_VP9_HIGHBITDEPTH
175
176 DSP_SRCS-yes            += txfm_common.h
177 DSP_SRCS-$(HAVE_SSE2)   += x86/txfm_common_sse2.h
178 DSP_SRCS-$(HAVE_MSA)    += mips/txfm_macros_msa.h
179 # forward transform
180 ifeq ($(CONFIG_VP9_ENCODER),yes)
181 DSP_SRCS-yes            += fwd_txfm.c
182 DSP_SRCS-yes            += fwd_txfm.h
183 DSP_SRCS-$(HAVE_SSE2)   += x86/fwd_txfm_sse2.h
184 DSP_SRCS-$(HAVE_SSE2)   += x86/fwd_txfm_sse2.c
185 DSP_SRCS-$(HAVE_SSE2)   += x86/fwd_txfm_impl_sse2.h
186 DSP_SRCS-$(HAVE_SSE2)   += x86/fwd_dct32x32_impl_sse2.h
187 ifeq ($(ARCH_X86_64),yes)
188 DSP_SRCS-$(HAVE_SSSE3)  += x86/fwd_txfm_ssse3_x86_64.asm
189 endif
190 DSP_SRCS-$(HAVE_AVX2)   += x86/fwd_txfm_avx2.c
191 DSP_SRCS-$(HAVE_AVX2)   += x86/fwd_dct32x32_impl_avx2.h
192 DSP_SRCS-$(HAVE_NEON)   += arm/fwd_txfm_neon.c
193 DSP_SRCS-$(HAVE_MSA)    += mips/fwd_txfm_msa.h
194 DSP_SRCS-$(HAVE_MSA)    += mips/fwd_txfm_msa.c
195 DSP_SRCS-$(HAVE_MSA)    += mips/fwd_dct32x32_msa.c
196 endif  # CONFIG_VP9_ENCODER
197
198 # inverse transform
199 ifeq ($(CONFIG_VP9),yes)
200 DSP_SRCS-yes            += inv_txfm.h
201 DSP_SRCS-yes            += inv_txfm.c
202 DSP_SRCS-$(HAVE_SSE2)   += x86/inv_txfm_sse2.h
203 DSP_SRCS-$(HAVE_SSE2)   += x86/inv_txfm_sse2.c
204 DSP_SRCS-$(HAVE_SSE2)   += x86/inv_wht_sse2.asm
205 DSP_SRCS-$(HAVE_SSSE3)  += x86/inv_txfm_ssse3.c
206
207 DSP_SRCS-$(HAVE_NEON_ASM) += arm/save_reg_neon$(ASM)
208
209 ifneq ($(CONFIG_VP9_HIGHBITDEPTH),yes)
210 DSP_SRCS-$(HAVE_MSA)   += mips/inv_txfm_msa.h
211 DSP_SRCS-$(HAVE_MSA)   += mips/idct4x4_msa.c
212 DSP_SRCS-$(HAVE_MSA)   += mips/idct8x8_msa.c
213 DSP_SRCS-$(HAVE_MSA)   += mips/idct16x16_msa.c
214 DSP_SRCS-$(HAVE_MSA)   += mips/idct32x32_msa.c
215
216 DSP_SRCS-$(HAVE_DSPR2) += mips/inv_txfm_dspr2.h
217 DSP_SRCS-$(HAVE_DSPR2) += mips/itrans4_dspr2.c
218 DSP_SRCS-$(HAVE_DSPR2) += mips/itrans8_dspr2.c
219 DSP_SRCS-$(HAVE_DSPR2) += mips/itrans16_dspr2.c
220 DSP_SRCS-$(HAVE_DSPR2) += mips/itrans32_dspr2.c
221 DSP_SRCS-$(HAVE_DSPR2) += mips/itrans32_cols_dspr2.c
222 else  # CONFIG_VP9_HIGHBITDEPTH
223 DSP_SRCS-$(HAVE_NEON)  += arm/highbd_idct4x4_add_neon.c
224 DSP_SRCS-$(HAVE_NEON)  += arm/highbd_idct8x8_add_neon.c
225 DSP_SRCS-$(HAVE_NEON)  += arm/highbd_idct16x16_add_neon.c
226 DSP_SRCS-$(HAVE_NEON)  += arm/highbd_idct32x32_add_neon.c
227 endif  # !CONFIG_VP9_HIGHBITDEPTH
228
229 ifeq ($(HAVE_NEON_ASM),yes)
230 DSP_SRCS-yes += arm/idct_neon$(ASM)
231 DSP_SRCS-yes += arm/idct4x4_1_add_neon$(ASM)
232 DSP_SRCS-yes += arm/idct4x4_add_neon$(ASM)
233 else
234 DSP_SRCS-$(HAVE_NEON) += arm/idct4x4_1_add_neon.c
235 DSP_SRCS-$(HAVE_NEON) += arm/idct4x4_add_neon.c
236 endif  # HAVE_NEON_ASM
237 DSP_SRCS-$(HAVE_NEON) += arm/idct_neon.h
238 DSP_SRCS-$(HAVE_NEON) += arm/idct8x8_1_add_neon.c
239 DSP_SRCS-$(HAVE_NEON) += arm/idct8x8_add_neon.c
240 DSP_SRCS-$(HAVE_NEON) += arm/idct16x16_1_add_neon.c
241 DSP_SRCS-$(HAVE_NEON) += arm/idct16x16_add_neon.c
242 DSP_SRCS-$(HAVE_NEON) += arm/idct32x32_1_add_neon.c
243 DSP_SRCS-$(HAVE_NEON) += arm/idct32x32_34_add_neon.c
244 DSP_SRCS-$(HAVE_NEON) += arm/idct32x32_135_add_neon.c
245 DSP_SRCS-$(HAVE_NEON) += arm/idct32x32_add_neon.c
246
247 endif  # CONFIG_VP9
248
249 # quantization
250 ifeq ($(CONFIG_VP9_ENCODER),yes)
251 DSP_SRCS-yes            += quantize.c
252 DSP_SRCS-yes            += quantize.h
253
254 DSP_SRCS-$(HAVE_SSE2)   += x86/quantize_sse2.c
255 ifeq ($(CONFIG_VP9_HIGHBITDEPTH),yes)
256 DSP_SRCS-$(HAVE_SSE2)   += x86/highbd_quantize_intrin_sse2.c
257 endif
258 ifeq ($(ARCH_X86_64),yes)
259 DSP_SRCS-$(HAVE_SSSE3)  += x86/quantize_ssse3_x86_64.asm
260 DSP_SRCS-$(HAVE_AVX)    += x86/quantize_avx_x86_64.asm
261 endif
262
263 # avg
264 DSP_SRCS-yes           += avg.c
265 DSP_SRCS-$(HAVE_SSE2)  += x86/avg_intrin_sse2.c
266 DSP_SRCS-$(HAVE_NEON)  += arm/avg_neon.c
267 DSP_SRCS-$(HAVE_MSA)   += mips/avg_msa.c
268 DSP_SRCS-$(HAVE_NEON)  += arm/hadamard_neon.c
269 ifeq ($(ARCH_X86_64),yes)
270 DSP_SRCS-$(HAVE_SSSE3) += x86/avg_ssse3_x86_64.asm
271 endif
272
273 endif  # CONFIG_VP9_ENCODER
274
275 ifeq ($(CONFIG_ENCODERS),yes)
276 DSP_SRCS-yes            += sad.c
277 DSP_SRCS-yes            += subtract.c
278 DSP_SRCS-yes            += sum_squares.c
279 DSP_SRCS-$(HAVE_SSE2)   += x86/sum_squares_sse2.c
280 DSP_SRCS-$(HAVE_MSA)    += mips/sum_squares_msa.c
281
282 DSP_SRCS-$(HAVE_NEON)   += arm/sad4d_neon.c
283 DSP_SRCS-$(HAVE_NEON)   += arm/sad_neon.c
284 DSP_SRCS-$(HAVE_NEON)   += arm/subtract_neon.c
285
286 DSP_SRCS-$(HAVE_MSA)    += mips/sad_msa.c
287 DSP_SRCS-$(HAVE_MSA)    += mips/subtract_msa.c
288
289 DSP_SRCS-$(HAVE_SSE3)   += x86/sad_sse3.asm
290 DSP_SRCS-$(HAVE_SSSE3)  += x86/sad_ssse3.asm
291 DSP_SRCS-$(HAVE_SSE4_1) += x86/sad_sse4.asm
292 DSP_SRCS-$(HAVE_AVX2)   += x86/sad4d_avx2.c
293 DSP_SRCS-$(HAVE_AVX2)   += x86/sad_avx2.c
294
295 DSP_SRCS-$(HAVE_SSE)    += x86/sad4d_sse2.asm
296 DSP_SRCS-$(HAVE_SSE)    += x86/sad_sse2.asm
297 DSP_SRCS-$(HAVE_SSE2)   += x86/sad4d_sse2.asm
298 DSP_SRCS-$(HAVE_SSE2)   += x86/sad_sse2.asm
299 DSP_SRCS-$(HAVE_SSE2)   += x86/subtract_sse2.asm
300
301 ifeq ($(CONFIG_VP9_HIGHBITDEPTH),yes)
302 DSP_SRCS-$(HAVE_SSE2) += x86/highbd_sad4d_sse2.asm
303 DSP_SRCS-$(HAVE_SSE2) += x86/highbd_sad_sse2.asm
304 endif  # CONFIG_VP9_HIGHBITDEPTH
305
306 endif  # CONFIG_ENCODERS
307
308 ifneq ($(filter yes,$(CONFIG_ENCODERS) $(CONFIG_POSTPROC) $(CONFIG_VP9_POSTPROC)),)
309 DSP_SRCS-yes            += variance.c
310 DSP_SRCS-yes            += variance.h
311
312 DSP_SRCS-$(HAVE_NEON)   += arm/subpel_variance_neon.c
313 DSP_SRCS-$(HAVE_NEON)   += arm/variance_neon.c
314
315 DSP_SRCS-$(HAVE_MSA)    += mips/variance_msa.c
316 DSP_SRCS-$(HAVE_MSA)    += mips/sub_pixel_variance_msa.c
317
318 DSP_SRCS-$(HAVE_SSE)    += x86/variance_sse2.c
319 DSP_SRCS-$(HAVE_SSE2)   += x86/variance_sse2.c  # Contains SSE2 and SSSE3
320 DSP_SRCS-$(HAVE_AVX2)   += x86/variance_avx2.c
321 DSP_SRCS-$(HAVE_AVX2)   += x86/variance_impl_avx2.c
322
323 ifeq ($(ARCH_X86_64),yes)
324 DSP_SRCS-$(HAVE_SSE2)   += x86/ssim_opt_x86_64.asm
325 endif  # ARCH_X86_64
326
327 DSP_SRCS-$(HAVE_SSE)    += x86/subpel_variance_sse2.asm
328 DSP_SRCS-$(HAVE_SSE2)   += x86/subpel_variance_sse2.asm  # Contains SSE2 and SSSE3
329
330 ifeq ($(CONFIG_VP9_HIGHBITDEPTH),yes)
331 DSP_SRCS-$(HAVE_SSE2)   += x86/highbd_variance_sse2.c
332 DSP_SRCS-$(HAVE_SSE2)   += x86/highbd_variance_impl_sse2.asm
333 DSP_SRCS-$(HAVE_SSE2)   += x86/highbd_subpel_variance_impl_sse2.asm
334 endif  # CONFIG_VP9_HIGHBITDEPTH
335 endif  # CONFIG_ENCODERS || CONFIG_POSTPROC || CONFIG_VP9_POSTPROC
336
337 # Neon utilities
338 DSP_SRCS-$(HAVE_NEON) += arm/transpose_neon.h
339
340 DSP_SRCS-no += $(DSP_SRCS_REMOVE-yes)
341
342 DSP_SRCS-yes += vpx_dsp_rtcd.c
343 DSP_SRCS-yes += vpx_dsp_rtcd_defs.pl
344
345 $(eval $(call rtcd_h_template,vpx_dsp_rtcd,vpx_dsp/vpx_dsp_rtcd_defs.pl))