]> granicus.if.org Git - libvpx/blob - vpx_dsp/vpx_dsp.mk
Merge "Add SSSE3 intrinsic 8x8 inverse 2D-DCT"
[libvpx] / vpx_dsp / vpx_dsp.mk
1 ##
2 ## Copyright (c) 2015 The WebM project authors. All Rights Reserved.
3 ##
4 ##  Use of this source code is governed by a BSD-style license
5 ##  that can be found in the LICENSE file in the root of the source
6 ##  tree. An additional intellectual property rights grant can be found
7 ##  in the file PATENTS.  All contributing project authors may
8 ##  be found in the AUTHORS file in the root of the source tree.
9 ##
10
11 DSP_SRCS-yes += vpx_dsp.mk
12 DSP_SRCS-yes += vpx_dsp_common.h
13
14 DSP_SRCS-$(HAVE_MSA)    += mips/macros_msa.h
15
16 # bit reader
17 DSP_SRCS-yes += prob.h
18 DSP_SRCS-yes += prob.c
19
20 ifeq ($(CONFIG_ENCODERS),yes)
21 DSP_SRCS-yes += bitwriter.h
22 DSP_SRCS-yes += bitwriter.c
23 DSP_SRCS-yes += bitwriter_buffer.c
24 DSP_SRCS-yes += bitwriter_buffer.h
25 DSP_SRCS-yes += psnr.c
26 DSP_SRCS-yes += psnr.h
27 DSP_SRCS-$(CONFIG_INTERNAL_STATS) += ssim.c
28 DSP_SRCS-$(CONFIG_INTERNAL_STATS) += ssim.h
29 DSP_SRCS-$(CONFIG_INTERNAL_STATS) += psnrhvs.c
30 DSP_SRCS-$(CONFIG_INTERNAL_STATS) += fastssim.c
31 endif
32
33 ifeq ($(CONFIG_DECODERS),yes)
34 DSP_SRCS-yes += bitreader.h
35 DSP_SRCS-yes += bitreader.c
36 DSP_SRCS-yes += bitreader_buffer.c
37 DSP_SRCS-yes += bitreader_buffer.h
38 endif
39
40 # intra predictions
41 DSP_SRCS-yes += intrapred.c
42
43 DSP_SRCS-$(HAVE_SSE) += x86/intrapred_sse2.asm
44 DSP_SRCS-$(HAVE_SSE2) += x86/intrapred_sse2.asm
45 DSP_SRCS-$(HAVE_SSSE3) += x86/intrapred_ssse3.asm
46 DSP_SRCS-$(HAVE_SSSE3) += x86/vpx_subpixel_8t_ssse3.asm
47
48 ifeq ($(CONFIG_VP9_HIGHBITDEPTH),yes)
49 DSP_SRCS-$(HAVE_SSE)  += x86/highbd_intrapred_sse2.asm
50 DSP_SRCS-$(HAVE_SSE2) += x86/highbd_intrapred_sse2.asm
51 DSP_SRCS-$(HAVE_NEON) += arm/highbd_intrapred_neon.c
52 endif  # CONFIG_VP9_HIGHBITDEPTH
53
54 ifneq ($(filter yes,$(CONFIG_POSTPROC) $(CONFIG_VP9_POSTPROC)),)
55 DSP_SRCS-yes += add_noise.c
56 DSP_SRCS-yes += deblock.c
57 DSP_SRCS-yes += postproc.h
58 DSP_SRCS-$(HAVE_MSA) += mips/add_noise_msa.c
59 DSP_SRCS-$(HAVE_MSA) += mips/deblock_msa.c
60 DSP_SRCS-$(HAVE_NEON) += arm/deblock_neon.c
61 DSP_SRCS-$(HAVE_SSE2) += x86/add_noise_sse2.asm
62 DSP_SRCS-$(HAVE_SSE2) += x86/deblock_sse2.asm
63 endif # CONFIG_POSTPROC
64
65 DSP_SRCS-$(HAVE_NEON_ASM) += arm/intrapred_neon_asm$(ASM)
66 DSP_SRCS-$(HAVE_NEON) += arm/intrapred_neon.c
67 DSP_SRCS-$(HAVE_MSA) += mips/intrapred_msa.c
68 DSP_SRCS-$(HAVE_DSPR2)  += mips/intrapred4_dspr2.c
69 DSP_SRCS-$(HAVE_DSPR2)  += mips/intrapred8_dspr2.c
70 DSP_SRCS-$(HAVE_DSPR2)  += mips/intrapred16_dspr2.c
71
72 DSP_SRCS-$(HAVE_DSPR2)  += mips/common_dspr2.h
73 DSP_SRCS-$(HAVE_DSPR2)  += mips/common_dspr2.c
74
75 # interpolation filters
76 DSP_SRCS-yes += vpx_convolve.c
77 DSP_SRCS-yes += vpx_convolve.h
78 DSP_SRCS-yes += vpx_filter.h
79
80 DSP_SRCS-$(ARCH_X86)$(ARCH_X86_64) += x86/convolve.h
81 DSP_SRCS-$(ARCH_X86)$(ARCH_X86_64) += x86/vpx_asm_stubs.c
82 DSP_SRCS-$(HAVE_SSE2)  += x86/vpx_subpixel_8t_sse2.asm
83 DSP_SRCS-$(HAVE_SSE2)  += x86/vpx_subpixel_bilinear_sse2.asm
84 DSP_SRCS-$(HAVE_SSSE3) += x86/vpx_subpixel_8t_ssse3.asm
85 DSP_SRCS-$(HAVE_SSSE3) += x86/vpx_subpixel_bilinear_ssse3.asm
86 DSP_SRCS-$(HAVE_AVX2)  += x86/vpx_subpixel_8t_intrin_avx2.c
87 DSP_SRCS-$(HAVE_SSSE3) += x86/vpx_subpixel_8t_intrin_ssse3.c
88 ifeq ($(CONFIG_VP9_HIGHBITDEPTH),yes)
89 DSP_SRCS-$(HAVE_SSE2)  += x86/vpx_high_subpixel_8t_sse2.asm
90 DSP_SRCS-$(HAVE_SSE2)  += x86/vpx_high_subpixel_bilinear_sse2.asm
91 DSP_SRCS-$(HAVE_NEON)  += arm/highbd_vpx_convolve_copy_neon.c
92 DSP_SRCS-$(HAVE_NEON)  += arm/highbd_vpx_convolve_avg_neon.c
93 DSP_SRCS-$(HAVE_NEON)  += arm/highbd_vpx_convolve8_neon.c
94 DSP_SRCS-$(HAVE_NEON)  += arm/highbd_vpx_convolve_neon.c
95 endif
96
97 DSP_SRCS-$(HAVE_SSE2)  += x86/vpx_convolve_copy_sse2.asm
98
99 ifeq ($(HAVE_NEON_ASM),yes)
100 DSP_SRCS-yes += arm/vpx_convolve_copy_neon_asm$(ASM)
101 DSP_SRCS-yes += arm/vpx_convolve8_avg_neon_asm$(ASM)
102 DSP_SRCS-yes += arm/vpx_convolve8_neon_asm$(ASM)
103 DSP_SRCS-yes += arm/vpx_convolve_avg_neon_asm$(ASM)
104 DSP_SRCS-yes += arm/vpx_convolve_neon.c
105 else
106 ifeq ($(HAVE_NEON),yes)
107 DSP_SRCS-yes += arm/vpx_convolve_copy_neon.c
108 DSP_SRCS-yes += arm/vpx_convolve8_neon.c
109 DSP_SRCS-yes += arm/vpx_convolve_avg_neon.c
110 DSP_SRCS-yes += arm/vpx_convolve_neon.c
111 endif  # HAVE_NEON
112 endif  # HAVE_NEON_ASM
113
114 # common (msa)
115 DSP_SRCS-$(HAVE_MSA) += mips/vpx_convolve8_avg_horiz_msa.c
116 DSP_SRCS-$(HAVE_MSA) += mips/vpx_convolve8_avg_msa.c
117 DSP_SRCS-$(HAVE_MSA) += mips/vpx_convolve8_avg_vert_msa.c
118 DSP_SRCS-$(HAVE_MSA) += mips/vpx_convolve8_horiz_msa.c
119 DSP_SRCS-$(HAVE_MSA) += mips/vpx_convolve8_msa.c
120 DSP_SRCS-$(HAVE_MSA) += mips/vpx_convolve8_vert_msa.c
121 DSP_SRCS-$(HAVE_MSA) += mips/vpx_convolve_avg_msa.c
122 DSP_SRCS-$(HAVE_MSA) += mips/vpx_convolve_copy_msa.c
123 DSP_SRCS-$(HAVE_MSA) += mips/vpx_convolve_msa.h
124
125 # common (dspr2)
126 DSP_SRCS-$(HAVE_DSPR2)  += mips/convolve_common_dspr2.h
127 DSP_SRCS-$(HAVE_DSPR2)  += mips/convolve2_avg_dspr2.c
128 DSP_SRCS-$(HAVE_DSPR2)  += mips/convolve2_avg_horiz_dspr2.c
129 DSP_SRCS-$(HAVE_DSPR2)  += mips/convolve2_dspr2.c
130 DSP_SRCS-$(HAVE_DSPR2)  += mips/convolve2_horiz_dspr2.c
131 DSP_SRCS-$(HAVE_DSPR2)  += mips/convolve2_vert_dspr2.c
132 DSP_SRCS-$(HAVE_DSPR2)  += mips/convolve8_avg_dspr2.c
133 DSP_SRCS-$(HAVE_DSPR2)  += mips/convolve8_avg_horiz_dspr2.c
134 DSP_SRCS-$(HAVE_DSPR2)  += mips/convolve8_dspr2.c
135 DSP_SRCS-$(HAVE_DSPR2)  += mips/convolve8_horiz_dspr2.c
136 DSP_SRCS-$(HAVE_DSPR2)  += mips/convolve8_vert_dspr2.c
137
138 # loop filters
139 DSP_SRCS-yes += loopfilter.c
140
141 DSP_SRCS-$(ARCH_X86)$(ARCH_X86_64)   += x86/loopfilter_sse2.c
142 DSP_SRCS-$(HAVE_AVX2)                += x86/loopfilter_avx2.c
143
144 ifeq ($(HAVE_NEON_ASM),yes)
145 DSP_SRCS-yes  += arm/loopfilter_16_neon$(ASM)
146 DSP_SRCS-yes  += arm/loopfilter_8_neon$(ASM)
147 DSP_SRCS-yes  += arm/loopfilter_4_neon$(ASM)
148 else
149 DSP_SRCS-$(HAVE_NEON)   += arm/loopfilter_neon.c
150 endif  # HAVE_NEON_ASM
151
152 DSP_SRCS-$(HAVE_MSA)    += mips/loopfilter_msa.h
153 DSP_SRCS-$(HAVE_MSA)    += mips/loopfilter_16_msa.c
154 DSP_SRCS-$(HAVE_MSA)    += mips/loopfilter_8_msa.c
155 DSP_SRCS-$(HAVE_MSA)    += mips/loopfilter_4_msa.c
156 DSP_SRCS-$(HAVE_DSPR2)  += mips/loopfilter_filters_dspr2.h
157 DSP_SRCS-$(HAVE_DSPR2)  += mips/loopfilter_filters_dspr2.c
158 DSP_SRCS-$(HAVE_DSPR2)  += mips/loopfilter_macros_dspr2.h
159 DSP_SRCS-$(HAVE_DSPR2)  += mips/loopfilter_masks_dspr2.h
160 DSP_SRCS-$(HAVE_DSPR2)  += mips/loopfilter_mb_dspr2.c
161 DSP_SRCS-$(HAVE_DSPR2)  += mips/loopfilter_mb_horiz_dspr2.c
162 DSP_SRCS-$(HAVE_DSPR2)  += mips/loopfilter_mb_vert_dspr2.c
163
164 ifeq ($(CONFIG_VP9_HIGHBITDEPTH),yes)
165 DSP_SRCS-$(HAVE_NEON)   += arm/highbd_loopfilter_neon.c
166 DSP_SRCS-$(HAVE_SSE2)   += x86/highbd_loopfilter_sse2.c
167 endif  # CONFIG_VP9_HIGHBITDEPTH
168
169 DSP_SRCS-yes            += txfm_common.h
170 DSP_SRCS-$(HAVE_SSE2)   += x86/txfm_common_sse2.h
171 DSP_SRCS-$(HAVE_MSA)    += mips/txfm_macros_msa.h
172 # forward transform
173 ifeq ($(CONFIG_VP9_ENCODER),yes)
174 DSP_SRCS-yes            += fwd_txfm.c
175 DSP_SRCS-yes            += fwd_txfm.h
176 DSP_SRCS-$(HAVE_SSE2)   += x86/fwd_txfm_sse2.h
177 DSP_SRCS-$(HAVE_SSE2)   += x86/fwd_txfm_sse2.c
178 DSP_SRCS-$(HAVE_SSE2)   += x86/fwd_txfm_impl_sse2.h
179 DSP_SRCS-$(HAVE_SSE2)   += x86/fwd_dct32x32_impl_sse2.h
180 ifeq ($(ARCH_X86_64),yes)
181 DSP_SRCS-$(HAVE_SSSE3)  += x86/fwd_txfm_ssse3_x86_64.asm
182 endif
183 DSP_SRCS-$(HAVE_AVX2)   += x86/fwd_txfm_avx2.c
184 DSP_SRCS-$(HAVE_AVX2)   += x86/fwd_dct32x32_impl_avx2.h
185 DSP_SRCS-$(HAVE_NEON)   += arm/fwd_txfm_neon.c
186 DSP_SRCS-$(HAVE_MSA)    += mips/fwd_txfm_msa.h
187 DSP_SRCS-$(HAVE_MSA)    += mips/fwd_txfm_msa.c
188 DSP_SRCS-$(HAVE_MSA)    += mips/fwd_dct32x32_msa.c
189 endif  # CONFIG_VP9_ENCODER
190
191 # inverse transform
192 ifeq ($(CONFIG_VP9),yes)
193 DSP_SRCS-yes            += inv_txfm.h
194 DSP_SRCS-yes            += inv_txfm.c
195 DSP_SRCS-$(HAVE_SSE2)   += x86/inv_txfm_sse2.h
196 DSP_SRCS-$(HAVE_SSE2)   += x86/inv_txfm_sse2.c
197 DSP_SRCS-$(HAVE_SSE2)   += x86/inv_wht_sse2.asm
198 DSP_SRCS-$(HAVE_SSSE3)  += x86/inv_txfm_ssse3.c
199 ifeq ($(ARCH_X86_64),yes)
200 DSP_SRCS-$(HAVE_SSSE3)  += x86/inv_txfm_ssse3_x86_64.asm
201 endif  # ARCH_X86_64
202
203 DSP_SRCS-$(HAVE_NEON_ASM) += arm/save_reg_neon$(ASM)
204
205 ifneq ($(CONFIG_VP9_HIGHBITDEPTH),yes)
206 DSP_SRCS-$(HAVE_MSA)   += mips/inv_txfm_msa.h
207 DSP_SRCS-$(HAVE_MSA)   += mips/idct4x4_msa.c
208 DSP_SRCS-$(HAVE_MSA)   += mips/idct8x8_msa.c
209 DSP_SRCS-$(HAVE_MSA)   += mips/idct16x16_msa.c
210 DSP_SRCS-$(HAVE_MSA)   += mips/idct32x32_msa.c
211
212 DSP_SRCS-$(HAVE_DSPR2) += mips/inv_txfm_dspr2.h
213 DSP_SRCS-$(HAVE_DSPR2) += mips/itrans4_dspr2.c
214 DSP_SRCS-$(HAVE_DSPR2) += mips/itrans8_dspr2.c
215 DSP_SRCS-$(HAVE_DSPR2) += mips/itrans16_dspr2.c
216 DSP_SRCS-$(HAVE_DSPR2) += mips/itrans32_dspr2.c
217 DSP_SRCS-$(HAVE_DSPR2) += mips/itrans32_cols_dspr2.c
218 else  # CONFIG_VP9_HIGHBITDEPTH
219 DSP_SRCS-$(HAVE_NEON)  += arm/highbd_idct4x4_add_neon.c
220 DSP_SRCS-$(HAVE_NEON)  += arm/highbd_idct8x8_add_neon.c
221 endif  # !CONFIG_VP9_HIGHBITDEPTH
222
223 ifeq ($(HAVE_NEON_ASM),yes)
224 DSP_SRCS-yes += arm/idct_neon$(ASM)
225 DSP_SRCS-yes += arm/idct4x4_1_add_neon$(ASM)
226 DSP_SRCS-yes += arm/idct4x4_add_neon$(ASM)
227 else
228 DSP_SRCS-$(HAVE_NEON) += arm/idct4x4_1_add_neon.c
229 DSP_SRCS-$(HAVE_NEON) += arm/idct4x4_add_neon.c
230 endif  # HAVE_NEON_ASM
231 DSP_SRCS-$(HAVE_NEON) += arm/idct_neon.h
232 DSP_SRCS-$(HAVE_NEON) += arm/idct8x8_1_add_neon.c
233 DSP_SRCS-$(HAVE_NEON) += arm/idct8x8_add_neon.c
234 DSP_SRCS-$(HAVE_NEON) += arm/idct16x16_1_add_neon.c
235 DSP_SRCS-$(HAVE_NEON) += arm/idct16x16_add_neon.c
236 DSP_SRCS-$(HAVE_NEON) += arm/idct32x32_1_add_neon.c
237 DSP_SRCS-$(HAVE_NEON) += arm/idct32x32_34_add_neon.c
238 DSP_SRCS-$(HAVE_NEON) += arm/idct32x32_135_add_neon.c
239 DSP_SRCS-$(HAVE_NEON) += arm/idct32x32_add_neon.c
240
241 endif  # CONFIG_VP9
242
243 # quantization
244 ifeq ($(CONFIG_VP9_ENCODER),yes)
245 DSP_SRCS-yes            += quantize.c
246 DSP_SRCS-yes            += quantize.h
247
248 DSP_SRCS-$(HAVE_SSE2)   += x86/fdct.h
249 DSP_SRCS-$(HAVE_SSE2)   += x86/quantize_sse2.c
250 ifeq ($(CONFIG_VP9_HIGHBITDEPTH),yes)
251 DSP_SRCS-$(HAVE_SSE2)   += x86/highbd_quantize_intrin_sse2.c
252 endif
253 ifeq ($(ARCH_X86_64),yes)
254 DSP_SRCS-$(HAVE_SSSE3)  += x86/quantize_ssse3_x86_64.asm
255 DSP_SRCS-$(HAVE_AVX)    += x86/quantize_avx_x86_64.asm
256 endif
257
258 # avg
259 DSP_SRCS-yes           += avg.c
260 DSP_SRCS-$(HAVE_SSE2)  += x86/avg_intrin_sse2.c
261 DSP_SRCS-$(HAVE_NEON)  += arm/avg_neon.c
262 DSP_SRCS-$(HAVE_MSA)   += mips/avg_msa.c
263 DSP_SRCS-$(HAVE_NEON)  += arm/hadamard_neon.c
264 ifeq ($(ARCH_X86_64),yes)
265 DSP_SRCS-$(HAVE_SSSE3) += x86/avg_ssse3_x86_64.asm
266 endif
267
268 endif  # CONFIG_VP9_ENCODER
269
270 ifeq ($(CONFIG_ENCODERS),yes)
271 DSP_SRCS-yes            += sad.c
272 DSP_SRCS-yes            += subtract.c
273 DSP_SRCS-yes            += sum_squares.c
274 DSP_SRCS-$(HAVE_SSE2)   += x86/sum_squares_sse2.c
275 DSP_SRCS-$(HAVE_MSA)    += mips/sum_squares_msa.c
276
277 DSP_SRCS-$(HAVE_NEON)   += arm/sad4d_neon.c
278 DSP_SRCS-$(HAVE_NEON)   += arm/sad_neon.c
279 DSP_SRCS-$(HAVE_NEON)   += arm/subtract_neon.c
280
281 DSP_SRCS-$(HAVE_MSA)    += mips/sad_msa.c
282 DSP_SRCS-$(HAVE_MSA)    += mips/subtract_msa.c
283
284 DSP_SRCS-$(HAVE_SSE3)   += x86/sad_sse3.asm
285 DSP_SRCS-$(HAVE_SSSE3)  += x86/sad_ssse3.asm
286 DSP_SRCS-$(HAVE_SSE4_1) += x86/sad_sse4.asm
287 DSP_SRCS-$(HAVE_AVX2)   += x86/sad4d_avx2.c
288 DSP_SRCS-$(HAVE_AVX2)   += x86/sad_avx2.c
289
290 DSP_SRCS-$(HAVE_SSE)    += x86/sad4d_sse2.asm
291 DSP_SRCS-$(HAVE_SSE)    += x86/sad_sse2.asm
292 DSP_SRCS-$(HAVE_SSE2)   += x86/sad4d_sse2.asm
293 DSP_SRCS-$(HAVE_SSE2)   += x86/sad_sse2.asm
294 DSP_SRCS-$(HAVE_SSE2)   += x86/subtract_sse2.asm
295
296 ifeq ($(CONFIG_VP9_HIGHBITDEPTH),yes)
297 DSP_SRCS-$(HAVE_SSE2) += x86/highbd_sad4d_sse2.asm
298 DSP_SRCS-$(HAVE_SSE2) += x86/highbd_sad_sse2.asm
299 endif  # CONFIG_VP9_HIGHBITDEPTH
300
301 endif  # CONFIG_ENCODERS
302
303 ifneq ($(filter yes,$(CONFIG_ENCODERS) $(CONFIG_POSTPROC) $(CONFIG_VP9_POSTPROC)),)
304 DSP_SRCS-yes            += variance.c
305 DSP_SRCS-yes            += variance.h
306
307 DSP_SRCS-$(HAVE_NEON)   += arm/subpel_variance_neon.c
308 DSP_SRCS-$(HAVE_NEON)   += arm/variance_neon.c
309
310 DSP_SRCS-$(HAVE_MSA)    += mips/variance_msa.c
311 DSP_SRCS-$(HAVE_MSA)    += mips/sub_pixel_variance_msa.c
312
313 DSP_SRCS-$(HAVE_SSE)    += x86/variance_sse2.c
314 DSP_SRCS-$(HAVE_SSE2)   += x86/variance_sse2.c  # Contains SSE2 and SSSE3
315 DSP_SRCS-$(HAVE_AVX2)   += x86/variance_avx2.c
316 DSP_SRCS-$(HAVE_AVX2)   += x86/variance_impl_avx2.c
317
318 ifeq ($(ARCH_X86_64),yes)
319 DSP_SRCS-$(HAVE_SSE2)   += x86/ssim_opt_x86_64.asm
320 endif  # ARCH_X86_64
321
322 DSP_SRCS-$(HAVE_SSE)    += x86/subpel_variance_sse2.asm
323 DSP_SRCS-$(HAVE_SSE2)   += x86/subpel_variance_sse2.asm  # Contains SSE2 and SSSE3
324
325 ifeq ($(CONFIG_VP9_HIGHBITDEPTH),yes)
326 DSP_SRCS-$(HAVE_SSE2)   += x86/highbd_variance_sse2.c
327 DSP_SRCS-$(HAVE_SSE2)   += x86/highbd_variance_impl_sse2.asm
328 DSP_SRCS-$(HAVE_SSE2)   += x86/highbd_subpel_variance_impl_sse2.asm
329 endif  # CONFIG_VP9_HIGHBITDEPTH
330 endif  # CONFIG_ENCODERS || CONFIG_POSTPROC || CONFIG_VP9_POSTPROC
331
332 # Neon utilities
333 DSP_SRCS-$(HAVE_NEON) += arm/transpose_neon.h
334
335 DSP_SRCS-no += $(DSP_SRCS_REMOVE-yes)
336
337 DSP_SRCS-yes += vpx_dsp_rtcd.c
338 DSP_SRCS-yes += vpx_dsp_rtcd_defs.pl
339
340 $(eval $(call rtcd_h_template,vpx_dsp_rtcd,vpx_dsp/vpx_dsp_rtcd_defs.pl))