]> granicus.if.org Git - libx264/commitdiff
x86inc: Make REP_RET identical to RET in SSSE3+ functions
authorHenrik Gramner <henrik@gramner.com>
Thu, 20 Apr 2017 17:16:51 +0000 (19:16 +0200)
committerHenrik Gramner <henrik@gramner.com>
Fri, 19 May 2017 14:12:15 +0000 (16:12 +0200)
There's no point in emitting a rep prefix before ret on modern CPUs.

common/x86/x86inc.asm

index 6c2edf9a7ec575a29f10d500fb97a3bbace2f2af..7c146e543dd80550de75b3eb6635425f4a7e7ef0 100644 (file)
@@ -624,7 +624,7 @@ DECLARE_ARG 7, 8, 9, 10, 11, 12, 13, 14
 ; We can automatically detect "follows a branch", but not a branch target.
 ; (SSSE3 is a sufficient condition to know that your cpu doesn't have this problem.)
 %macro REP_RET 0
-    %if has_epilogue
+    %if has_epilogue || cpuflag(ssse3)
         RET
     %else
         rep ret