]> granicus.if.org Git - llvm/commitdiff
[MCA] Show aggregate over Average Wait times for the whole snippet (PR43219)
authorRoman Lebedev <lebedev.ri@gmail.com>
Thu, 10 Oct 2019 14:46:21 +0000 (14:46 +0000)
committerRoman Lebedev <lebedev.ri@gmail.com>
Thu, 10 Oct 2019 14:46:21 +0000 (14:46 +0000)
Summary:
As disscused in https://bugs.llvm.org/show_bug.cgi?id=43219,
i believe it may be somewhat useful to show //some// aggregates
over all the sea of statistics provided.

Example:
```
Average Wait times (based on the timeline view):
[0]: Executions
[1]: Average time spent waiting in a scheduler's queue
[2]: Average time spent waiting in a scheduler's queue while ready
[3]: Average time elapsed from WB until retire stage

      [0]    [1]    [2]    [3]
0.     3     1.0    1.0    4.7       vmulps     %xmm0, %xmm1, %xmm2
1.     3     2.7    0.0    2.3       vhaddps    %xmm2, %xmm2, %xmm3
2.     3     6.0    0.0    0.0       vhaddps    %xmm3, %xmm3, %xmm4
       3     3.2    0.3    2.3       <total>
```
I.e. we average the averages.

Reviewers: andreadb, mattd, RKSimon

Reviewed By: andreadb

Subscribers: gbedwell, arphaman, llvm-commits

Tags: #llvm

Differential Revision: https://reviews.llvm.org/D68714

git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@374361 91177308-0d34-0410-b5e6-96231b3b80d8

153 files changed:
docs/CommandGuide/llvm-mca.rst
test/tools/llvm-mca/ARM/memcpy-ldm-stm.s
test/tools/llvm-mca/ARM/vld1-index-update.s
test/tools/llvm-mca/SystemZ/stm-lm.s
test/tools/llvm-mca/X86/Barcelona/clear-super-register-1.s
test/tools/llvm-mca/X86/Barcelona/clear-super-register-2.s
test/tools/llvm-mca/X86/Barcelona/dependency-breaking-cmp.s
test/tools/llvm-mca/X86/Barcelona/dependency-breaking-pcmpeq.s
test/tools/llvm-mca/X86/Barcelona/dependency-breaking-pcmpgt.s
test/tools/llvm-mca/X86/Barcelona/dependency-breaking-sbb-1.s
test/tools/llvm-mca/X86/Barcelona/dependency-breaking-sbb-2.s
test/tools/llvm-mca/X86/Barcelona/int-to-fpu-forwarding-3.s
test/tools/llvm-mca/X86/Barcelona/load-store-throughput.s
test/tools/llvm-mca/X86/Barcelona/load-throughput.s
test/tools/llvm-mca/X86/Barcelona/one-idioms.s
test/tools/llvm-mca/X86/Barcelona/partial-reg-update-2.s
test/tools/llvm-mca/X86/Barcelona/partial-reg-update-3.s
test/tools/llvm-mca/X86/Barcelona/partial-reg-update-4.s
test/tools/llvm-mca/X86/Barcelona/partial-reg-update-6.s
test/tools/llvm-mca/X86/Barcelona/partial-reg-update-7.s
test/tools/llvm-mca/X86/Barcelona/partial-reg-update.s
test/tools/llvm-mca/X86/Barcelona/read-advance-1.s
test/tools/llvm-mca/X86/Barcelona/read-advance-2.s
test/tools/llvm-mca/X86/Barcelona/read-advance-3.s
test/tools/llvm-mca/X86/Barcelona/reg-move-elimination-1.s
test/tools/llvm-mca/X86/Barcelona/reg-move-elimination-2.s
test/tools/llvm-mca/X86/Barcelona/reg-move-elimination-3.s
test/tools/llvm-mca/X86/Barcelona/reg-move-elimination-4.s
test/tools/llvm-mca/X86/Barcelona/reg-move-elimination-5.s
test/tools/llvm-mca/X86/Barcelona/reg-move-elimination-6.s
test/tools/llvm-mca/X86/Barcelona/store-throughput.s
test/tools/llvm-mca/X86/Barcelona/zero-idioms.s
test/tools/llvm-mca/X86/BdVer2/add-sequence.s
test/tools/llvm-mca/X86/BdVer2/clear-super-register-1.s
test/tools/llvm-mca/X86/BdVer2/clear-super-register-2.s
test/tools/llvm-mca/X86/BdVer2/clear-super-register-3.s
test/tools/llvm-mca/X86/BdVer2/dependency-breaking-cmp.s
test/tools/llvm-mca/X86/BdVer2/dependency-breaking-pcmpeq.s
test/tools/llvm-mca/X86/BdVer2/dependency-breaking-pcmpgt.s
test/tools/llvm-mca/X86/BdVer2/dependency-breaking-sbb-1.s
test/tools/llvm-mca/X86/BdVer2/dependency-breaking-sbb-2.s
test/tools/llvm-mca/X86/BdVer2/dependent-pmuld-paddd.s
test/tools/llvm-mca/X86/BdVer2/dot-product.s
test/tools/llvm-mca/X86/BdVer2/hadd-read-after-ld-1.s
test/tools/llvm-mca/X86/BdVer2/hadd-read-after-ld-2.s
test/tools/llvm-mca/X86/BdVer2/int-to-fpu-forwarding-3.s
test/tools/llvm-mca/X86/BdVer2/load-store-alias.s
test/tools/llvm-mca/X86/BdVer2/load-store-throughput.s
test/tools/llvm-mca/X86/BdVer2/load-throughput.s
test/tools/llvm-mca/X86/BdVer2/memcpy-like-test.s
test/tools/llvm-mca/X86/BdVer2/one-idioms.s
test/tools/llvm-mca/X86/BdVer2/partial-reg-update-2.s
test/tools/llvm-mca/X86/BdVer2/partial-reg-update-3.s
test/tools/llvm-mca/X86/BdVer2/partial-reg-update-4.s
test/tools/llvm-mca/X86/BdVer2/partial-reg-update-6.s
test/tools/llvm-mca/X86/BdVer2/partial-reg-update.s
test/tools/llvm-mca/X86/BdVer2/pipes-fpu.s
test/tools/llvm-mca/X86/BdVer2/pr37790.s
test/tools/llvm-mca/X86/BdVer2/rank.s
test/tools/llvm-mca/X86/BdVer2/read-advance-1.s
test/tools/llvm-mca/X86/BdVer2/read-advance-2.s
test/tools/llvm-mca/X86/BdVer2/read-advance-3.s
test/tools/llvm-mca/X86/BdVer2/reg-move-elimination-1.s
test/tools/llvm-mca/X86/BdVer2/reg-move-elimination-2.s
test/tools/llvm-mca/X86/BdVer2/reg-move-elimination-3.s
test/tools/llvm-mca/X86/BdVer2/reg-move-elimination-4.s
test/tools/llvm-mca/X86/BdVer2/reg-move-elimination-5.s
test/tools/llvm-mca/X86/BdVer2/register-files-1.s
test/tools/llvm-mca/X86/BdVer2/register-files-2.s
test/tools/llvm-mca/X86/BdVer2/register-files-5.s
test/tools/llvm-mca/X86/BdVer2/store-throughput.s
test/tools/llvm-mca/X86/BdVer2/vbroadcast-operand-latency.s
test/tools/llvm-mca/X86/BdVer2/vec-logic-read-after-ld-1.s
test/tools/llvm-mca/X86/BdVer2/vec-logic-read-after-ld-2.s
test/tools/llvm-mca/X86/BdVer2/xop-super-registers-1.s
test/tools/llvm-mca/X86/BdVer2/xop-super-registers-2.s
test/tools/llvm-mca/X86/BdVer2/zero-idioms-avx-256.s
test/tools/llvm-mca/X86/BdVer2/zero-idioms.s
test/tools/llvm-mca/X86/Broadwell/zero-idioms.s
test/tools/llvm-mca/X86/BtVer2/add-sequence.s
test/tools/llvm-mca/X86/BtVer2/bottleneck-hints-1.s
test/tools/llvm-mca/X86/BtVer2/bottleneck-hints-3.s
test/tools/llvm-mca/X86/BtVer2/clear-super-register-1.s
test/tools/llvm-mca/X86/BtVer2/clear-super-register-2.s
test/tools/llvm-mca/X86/BtVer2/cmpxchg-read-advance.s
test/tools/llvm-mca/X86/BtVer2/dependency-breaking-cmp.s
test/tools/llvm-mca/X86/BtVer2/dependency-breaking-pcmpeq.s
test/tools/llvm-mca/X86/BtVer2/dependency-breaking-pcmpgt.s
test/tools/llvm-mca/X86/BtVer2/dependency-breaking-sbb-1.s
test/tools/llvm-mca/X86/BtVer2/dependency-breaking-sbb-2.s
test/tools/llvm-mca/X86/BtVer2/dependent-pmuld-paddd.s
test/tools/llvm-mca/X86/BtVer2/dot-product.s
test/tools/llvm-mca/X86/BtVer2/hadd-read-after-ld-1.s
test/tools/llvm-mca/X86/BtVer2/hadd-read-after-ld-2.s
test/tools/llvm-mca/X86/BtVer2/int-to-fpu-forwarding-3.s
test/tools/llvm-mca/X86/BtVer2/load-store-alias.s
test/tools/llvm-mca/X86/BtVer2/memcpy-like-test.s
test/tools/llvm-mca/X86/BtVer2/one-idioms.s
test/tools/llvm-mca/X86/BtVer2/partial-reg-update-2.s
test/tools/llvm-mca/X86/BtVer2/partial-reg-update-3.s
test/tools/llvm-mca/X86/BtVer2/partial-reg-update-4.s
test/tools/llvm-mca/X86/BtVer2/partial-reg-update-6.s
test/tools/llvm-mca/X86/BtVer2/partial-reg-update-7.s
test/tools/llvm-mca/X86/BtVer2/partial-reg-update.s
test/tools/llvm-mca/X86/BtVer2/pipes-fpu.s
test/tools/llvm-mca/X86/BtVer2/pr37790.s
test/tools/llvm-mca/X86/BtVer2/rank.s
test/tools/llvm-mca/X86/BtVer2/read-advance-1.s
test/tools/llvm-mca/X86/BtVer2/read-advance-2.s
test/tools/llvm-mca/X86/BtVer2/read-advance-3.s
test/tools/llvm-mca/X86/BtVer2/reg-move-elimination-1.s
test/tools/llvm-mca/X86/BtVer2/reg-move-elimination-2.s
test/tools/llvm-mca/X86/BtVer2/reg-move-elimination-3.s
test/tools/llvm-mca/X86/BtVer2/reg-move-elimination-4.s
test/tools/llvm-mca/X86/BtVer2/reg-move-elimination-5.s
test/tools/llvm-mca/X86/BtVer2/reg-move-elimination-6.s
test/tools/llvm-mca/X86/BtVer2/register-files-1.s
test/tools/llvm-mca/X86/BtVer2/register-files-2.s
test/tools/llvm-mca/X86/BtVer2/register-files-5.s
test/tools/llvm-mca/X86/BtVer2/vbroadcast-operand-latency.s
test/tools/llvm-mca/X86/BtVer2/vec-logic-read-after-ld-1.s
test/tools/llvm-mca/X86/BtVer2/vec-logic-read-after-ld-2.s
test/tools/llvm-mca/X86/BtVer2/xadd.s
test/tools/llvm-mca/X86/BtVer2/xchg.s
test/tools/llvm-mca/X86/BtVer2/zero-idioms-avx-256.s
test/tools/llvm-mca/X86/BtVer2/zero-idioms.s
test/tools/llvm-mca/X86/Generic/avx512-super-registers-1.s
test/tools/llvm-mca/X86/Generic/avx512-super-registers-2.s
test/tools/llvm-mca/X86/Generic/avx512-super-registers-3.s
test/tools/llvm-mca/X86/Generic/xop-super-registers-1.s
test/tools/llvm-mca/X86/Generic/xop-super-registers-2.s
test/tools/llvm-mca/X86/Haswell/zero-idioms.s
test/tools/llvm-mca/X86/SandyBridge/zero-idioms.s
test/tools/llvm-mca/X86/SkylakeClient/zero-idioms.s
test/tools/llvm-mca/X86/SkylakeServer/zero-idioms.s
test/tools/llvm-mca/X86/Znver1/partial-reg-update-2.s
test/tools/llvm-mca/X86/Znver1/partial-reg-update-3.s
test/tools/llvm-mca/X86/Znver1/partial-reg-update-4.s
test/tools/llvm-mca/X86/Znver1/partial-reg-update-6.s
test/tools/llvm-mca/X86/Znver1/partial-reg-update-7.s
test/tools/llvm-mca/X86/Znver1/partial-reg-update.s
test/tools/llvm-mca/X86/bextr-read-after-ld.s
test/tools/llvm-mca/X86/bzhi-read-after-ld.s
test/tools/llvm-mca/X86/fma3-read-after-ld-1.s
test/tools/llvm-mca/X86/fma3-read-after-ld-2.s
test/tools/llvm-mca/X86/read-after-ld-1.s
test/tools/llvm-mca/X86/read-after-ld-2.s
test/tools/llvm-mca/X86/read-after-ld-3.s
test/tools/llvm-mca/X86/sqrt-rsqrt-rcp-memop.s
test/tools/llvm-mca/X86/variable-blend-read-after-ld-1.s
test/tools/llvm-mca/X86/variable-blend-read-after-ld-2.s
tools/llvm-mca/Views/TimelineView.cpp
tools/llvm-mca/Views/TimelineView.h

index 4f8704ad9a96d7a29c6a0e3cae64bc5c5ea3e5fc..efe29c4da4b56d704360db9b7b3283d72ede8579 100644 (file)
@@ -523,6 +523,7 @@ Below is the timeline view for a subset of the dot-product example located in
   0.     3     1.0    1.0    3.3       vmulps  %xmm0, %xmm1, %xmm2
   1.     3     3.3    0.7    1.0       vhaddps %xmm2, %xmm2, %xmm3
   2.     3     5.7    0.0    0.0       vhaddps %xmm3, %xmm3, %xmm4
+         3     3.3    0.5    1.4       <total>
 
 The timeline view is interesting because it shows instruction state changes
 during execution.  It also gives an idea of how the tool processes instructions
@@ -574,7 +575,8 @@ and therefore consuming physical registers).
 
 Table *Average Wait times* helps diagnose performance issues that are caused by
 the presence of long latency instructions and potentially long data dependencies
-which may limit the ILP.  Note that :program:`llvm-mca`, by default, assumes at
+which may limit the ILP. Last row, ``<total>``, shows a global average over all
+instructions measured. Note that :program:`llvm-mca`, by default, assumes at
 least 1cy between the dispatch event and the issue event.
 
 When the performance is limited by data dependencies and/or long latency
index 634a6aa966ab921eb6fcf7b7411d46ad452835fc..865aa7455125b6644692ada479518362a7467886 100644 (file)
@@ -63,3 +63,4 @@
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     3     1.0    1.0    0.0       ldm r2!, {r3, r4, r5, r6, r12, lr}
 # CHECK-NEXT: 1.     3     18.3   0.3    0.0       stm r0!, {r3, r4, r5, r6, r12, lr}
+# CHECK-NEXT:        3     9.7    0.7    0.0       <total>
index 3bb02fcbcb4d11fdb72ce5d6c0783b40378e4b41..776466cd600772846225e2b6e68ea055e2e9a9e1 100644 (file)
@@ -70,3 +70,4 @@ vld1.32       {d16, d17}, [r1]!
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     5     3.0    0.2    1.6       add r1, r1, r12
 # CHECK-NEXT: 1.     5     4.0    0.0    0.0       vld1.32     {d16, d17}, [r1]!
+# CHECK-NEXT:        5     3.5    0.1    0.8       <total>
index db2d79663d4aec5cfecf38db7d43c20849f89815..a4b5190c32ec7f59f31b094f1fa545233be5a15b 100644 (file)
@@ -70,3 +70,4 @@ lmg   %r6, %r15, 48(%r15)
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     3     9.7    0.3    0.0       stmg        %r6, %r15, 48(%r15)
 # CHECK-NEXT: 1.     3     9.0    0.3    0.0       lmg %r6, %r15, 48(%r15)
+# CHECK-NEXT:        3     9.3    0.3    0.0       <total>
index c8e18731a3e182732944f2042ef4e25a85cc5936..99b9e0ce6e46a3c08aa0d2343c7134f60a45fe96 100644 (file)
@@ -61,3 +61,4 @@ bsf   %rax, %rcx
 # CHECK-NEXT: 1.     2     5.5    1.5    0.0       lzcntl      %ecx, %eax
 # CHECK-NEXT: 2.     2     8.5    0.0    0.0       andq        %rcx, %rax
 # CHECK-NEXT: 3.     2     9.5    0.0    0.0       bsfq        %rax, %rcx
+# CHECK-NEXT:        2     7.0    0.5    0.0       <total>
index c2e79baea676043fb7407a306237a80d0ab16b48..da943dc3f1bba2a81c60167cd1ca1d98ebdcf7ba 100644 (file)
@@ -66,6 +66,7 @@ addps  %xmm0, %xmm0
 # CHECK-NEXT: 0.     3     14.7   8.0    0.0       sqrtss      %xmm0, %xmm0
 # CHECK-NEXT: 1.     3     1.0    1.0    21.3      movss       (%eax), %xmm0
 # CHECK-NEXT: 2.     3     7.0    0.3    18.0      addps       %xmm0, %xmm0
+# CHECK-NEXT:        3     7.6    3.1    13.1      <total>
 
 # CHECK:      [1] Code Region
 
@@ -116,3 +117,4 @@ addps  %xmm0, %xmm0
 # CHECK-NEXT: 0.     3     21.7   15.0   0.0       sqrtsd      %xmm0, %xmm0
 # CHECK-NEXT: 1.     3     1.0    1.0    35.3      movsd       (%eax), %xmm0
 # CHECK-NEXT: 2.     3     7.0    0.3    32.0      addps       %xmm0, %xmm0
+# CHECK-NEXT:        3     9.9    5.4    22.4      <total>
index 9c02249ba6bf3be8f34c0f20260e2dc4779e16d1..d42a49b4b862d6726d600e8d44981f9f18c6a8bc 100644 (file)
@@ -68,3 +68,4 @@ cmovae %ebx, %eax
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     3     3.7    0.3    0.0       cmpl        %eax, %eax
 # CHECK-NEXT: 1.     3     4.0    0.0    0.0       cmovael     %ebx, %eax
+# CHECK-NEXT:        3     3.8    0.2    0.0       <total>
index 6f10c76d77abc20cfa54e910a01db947c4446e22..94ed93a94e7e36e5484c20592d02f327252afb37 100644 (file)
@@ -105,3 +105,4 @@ pcmpeqw %xmm0, %xmm0
 # CHECK-NEXT: 4.     3     3.7    0.0    12.0      pcmpeqd     %xmm0, %xmm0
 # CHECK-NEXT: 5.     3     4.3    0.0    11.0      pcmpeqq     %xmm0, %xmm0
 # CHECK-NEXT: 6.     3     5.0    0.0    10.0      pcmpeqw     %xmm0, %xmm0
+# CHECK-NEXT:        3     7.1    0.1    6.6       <total>
index ceb8c52e3ad801381d2c0f906701d69c9c1b16fd..1e387719a10ab800e757c13c0f17edb08871560e 100644 (file)
@@ -106,3 +106,4 @@ pcmpgtw %xmm0, %xmm0
 # CHECK-NEXT: 4.     3     0.0    0.0    16.7      pcmpgtd     %xmm0, %xmm0
 # CHECK-NEXT: 5.     3     0.0    0.0    16.3      pcmpgtq     %xmm0, %xmm0
 # CHECK-NEXT: 6.     3     0.0    0.0    16.0      pcmpgtw     %xmm0, %xmm0
+# CHECK-NEXT:        3     4.9    0.0    9.4       <total>
index 38aeb813b11293188cc41452dd89dbbeb83cbff5..b685814b88159ec160900ff7751cdf8aea0d3aed 100644 (file)
@@ -69,3 +69,4 @@ sbb %eax, %eax
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     3     4.0    0.3    0.0       sbbl        %edx, %edx
 # CHECK-NEXT: 1.     3     6.0    0.0    0.0       sbbl        %eax, %eax
+# CHECK-NEXT:        3     5.0    0.2    0.0       <total>
index bae6f563421085053802fd95d4651dbbd93a95c4..6df5e68f0bd2158d05ccbf81fdcb146c0e8ee499 100644 (file)
@@ -76,3 +76,4 @@ sbb %eax, %eax
 # CHECK-NEXT: 0.     3     5.0    0.3    0.0       imull       %edx, %eax
 # CHECK-NEXT: 1.     3     1.0    0.3    6.0       addl        %edx, %edx
 # CHECK-NEXT: 2.     3     8.0    0.0    0.0       sbbl        %eax, %eax
+# CHECK-NEXT:        3     4.7    0.2    2.0       <total>
index 5cf5ca1cc8715200328f5a05cf84dda98cbc7a7b..ccdf431ddc7a2d7371d05f8a192b843698a556d7 100644 (file)
@@ -72,3 +72,4 @@ pinsrw $1, %eax, %xmm0
 # CHECK-NEXT: 0.     3     1.0    0.7    2.7       addl        %eax, %eax
 # CHECK-NEXT: 1.     3     4.3    0.0    0.0       pinsrw      $0, %eax, %xmm0
 # CHECK-NEXT: 2.     3     5.7    0.0    0.0       pinsrw      $1, %eax, %xmm0
+# CHECK-NEXT:        3     3.7    0.2    0.9       <total>
index 27d207990297e8cfa098ed0aa36dad9ad1241895..adf6c10d7493629f7dee1f1fa18076675ca9d510 100644 (file)
@@ -138,6 +138,7 @@ movaps %xmm3, (%rbx)
 # CHECK-NEXT: 1.     1     1.0    1.0    0.0       movb        (%rcx), %bpl
 # CHECK-NEXT: 2.     1     2.0    2.0    0.0       movb        (%rdx), %sil
 # CHECK-NEXT: 3.     1     7.0    0.0    0.0       movb        %dil, (%rbx)
+# CHECK-NEXT:        1     2.8    1.0    0.0       <total>
 
 # CHECK:      [1] Code Region
 
@@ -234,6 +235,7 @@ movaps %xmm3, (%rbx)
 # CHECK-NEXT: 1.     1     1.0    1.0    0.0       movw        (%rcx), %bp
 # CHECK-NEXT: 2.     1     2.0    2.0    0.0       movw        (%rdx), %si
 # CHECK-NEXT: 3.     1     7.0    0.0    0.0       movw        %di, (%rbx)
+# CHECK-NEXT:        1     2.8    1.0    0.0       <total>
 
 # CHECK:      [2] Code Region
 
@@ -330,6 +332,7 @@ movaps %xmm3, (%rbx)
 # CHECK-NEXT: 1.     1     1.0    1.0    0.0       movl        (%rcx), %ebp
 # CHECK-NEXT: 2.     1     2.0    2.0    0.0       movl        (%rdx), %esi
 # CHECK-NEXT: 3.     1     7.0    0.0    0.0       movl        %edi, (%rbx)
+# CHECK-NEXT:        1     2.8    1.0    0.0       <total>
 
 # CHECK:      [3] Code Region
 
@@ -426,6 +429,7 @@ movaps %xmm3, (%rbx)
 # CHECK-NEXT: 1.     1     1.0    1.0    0.0       movq        (%rcx), %rbp
 # CHECK-NEXT: 2.     1     2.0    2.0    0.0       movq        (%rdx), %rsi
 # CHECK-NEXT: 3.     1     7.0    0.0    0.0       movq        %rdi, (%rbx)
+# CHECK-NEXT:        1     2.8    1.0    0.0       <total>
 
 # CHECK:      [4] Code Region
 
@@ -522,6 +526,7 @@ movaps %xmm3, (%rbx)
 # CHECK-NEXT: 1.     1     1.0    1.0    0.0       movd        (%rcx), %mm1
 # CHECK-NEXT: 2.     1     2.0    2.0    0.0       movd        (%rdx), %mm2
 # CHECK-NEXT: 3.     1     7.0    0.0    0.0       movd        %mm3, (%rbx)
+# CHECK-NEXT:        1     2.8    1.0    0.0       <total>
 
 # CHECK:      [5] Code Region
 
@@ -619,3 +624,4 @@ movaps %xmm3, (%rbx)
 # CHECK-NEXT: 1.     1     1.0    1.0    0.0       movaps      (%rcx), %xmm1
 # CHECK-NEXT: 2.     1     2.0    2.0    0.0       movaps      (%rdx), %xmm2
 # CHECK-NEXT: 3.     1     8.0    0.0    0.0       movaps      %xmm3, (%rbx)
+# CHECK-NEXT:        1     3.0    1.0    0.0       <total>
index bd9ff550b7a73025cb385c4a9ce9b839d841b373..558e91d43973861572f8fc301bf6025c1e7486bd 100644 (file)
@@ -137,6 +137,7 @@ movaps (%rbx), %xmm3
 # CHECK-NEXT: 1.     1     1.0    1.0    0.0       movb        (%rcx), %bpl
 # CHECK-NEXT: 2.     1     2.0    2.0    0.0       movb        (%rdx), %sil
 # CHECK-NEXT: 3.     1     2.0    2.0    0.0       movb        (%rbx), %dil
+# CHECK-NEXT:        1     1.5    1.5    0.0       <total>
 
 # CHECK:      [1] Code Region
 
@@ -232,6 +233,7 @@ movaps (%rbx), %xmm3
 # CHECK-NEXT: 1.     1     1.0    1.0    0.0       movw        (%rcx), %bp
 # CHECK-NEXT: 2.     1     2.0    2.0    0.0       movw        (%rdx), %si
 # CHECK-NEXT: 3.     1     2.0    2.0    0.0       movw        (%rbx), %di
+# CHECK-NEXT:        1     1.5    1.5    0.0       <total>
 
 # CHECK:      [2] Code Region
 
@@ -327,6 +329,7 @@ movaps (%rbx), %xmm3
 # CHECK-NEXT: 1.     1     1.0    1.0    0.0       movl        (%rcx), %ebp
 # CHECK-NEXT: 2.     1     2.0    2.0    0.0       movl        (%rdx), %esi
 # CHECK-NEXT: 3.     1     2.0    2.0    0.0       movl        (%rbx), %edi
+# CHECK-NEXT:        1     1.5    1.5    0.0       <total>
 
 # CHECK:      [3] Code Region
 
@@ -422,6 +425,7 @@ movaps (%rbx), %xmm3
 # CHECK-NEXT: 1.     1     1.0    1.0    0.0       movq        (%rcx), %rbp
 # CHECK-NEXT: 2.     1     2.0    2.0    0.0       movq        (%rdx), %rsi
 # CHECK-NEXT: 3.     1     2.0    2.0    0.0       movq        (%rbx), %rdi
+# CHECK-NEXT:        1     1.5    1.5    0.0       <total>
 
 # CHECK:      [4] Code Region
 
@@ -517,6 +521,7 @@ movaps (%rbx), %xmm3
 # CHECK-NEXT: 1.     1     1.0    1.0    0.0       movd        (%rcx), %mm1
 # CHECK-NEXT: 2.     1     2.0    2.0    0.0       movd        (%rdx), %mm2
 # CHECK-NEXT: 3.     1     2.0    2.0    0.0       movd        (%rbx), %mm3
+# CHECK-NEXT:        1     1.5    1.5    0.0       <total>
 
 # CHECK:      [5] Code Region
 
@@ -612,3 +617,4 @@ movaps (%rbx), %xmm3
 # CHECK-NEXT: 1.     1     1.0    1.0    0.0       movaps      (%rcx), %xmm1
 # CHECK-NEXT: 2.     1     2.0    2.0    0.0       movaps      (%rdx), %xmm2
 # CHECK-NEXT: 3.     1     2.0    2.0    0.0       movaps      (%rbx), %xmm3
+# CHECK-NEXT:        1     1.5    1.5    0.0       <total>
index 5fc423132fab0209fa2482b7b531b2ed38d07a90..202186341626043628d3b7782fa92aa03e45c4d1 100644 (file)
@@ -94,3 +94,4 @@ pcmpeqw %xmm2, %xmm2
 # CHECK-NEXT: 4.     1     1.0    0.0    7.0       pcmpeqd     %xmm2, %xmm2
 # CHECK-NEXT: 5.     1     2.0    0.0    6.0       pcmpeqq     %xmm2, %xmm2
 # CHECK-NEXT: 6.     1     3.0    0.0    5.0       pcmpeqw     %xmm2, %xmm2
+# CHECK-NEXT:        1     2.7    0.3    3.7       <total>
index 91ecc93c880916aa721d2f1770b5b86a97d8bfbf..54128218942969caac3fe71707598b3faa7479df 100644 (file)
@@ -45,3 +45,4 @@ add    %ecx, %ebx
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       imulq       %rax, %rbx
 # CHECK-NEXT: 1.     1     2.0    2.0    0.0       lzcntw      %ax, %bx
 # CHECK-NEXT: 2.     1     5.0    0.0    0.0       addl        %ecx, %ebx
+# CHECK-NEXT:        1     2.7    1.0    0.0       <total>
index 32e143e920d47af78a58c8cbfd7c134926e574a5..6cf7d93cb748ea44f9c5371d339e353d023b420e 100644 (file)
@@ -74,3 +74,4 @@ xor %bx, %dx
 # CHECK-NEXT: 0.     3     2.3    0.3    0.0       addw        %cx, %dx
 # CHECK-NEXT: 1.     3     1.0    1.0    1.0       movw        %ax, %dx
 # CHECK-NEXT: 2.     3     1.7    0.0    0.3       xorw        %bx, %dx
+# CHECK-NEXT:        3     1.7    0.4    0.4       <total>
index 3a9bd92d023f13028d157f9f4d5054a24e86db83..f349c3e0e61eecd1289325e96f491ccfe81c1bb5 100644 (file)
@@ -75,3 +75,4 @@ add %cx, %bx
 # CHECK-NEXT: 0.     3     4.3    0.3    0.0       imulw       %ax, %bx
 # CHECK-NEXT: 1.     3     2.3    2.3    2.0       lzcntw      %ax, %bx
 # CHECK-NEXT: 2.     3     5.0    0.0    1.3       addw        %cx, %bx
+# CHECK-NEXT:        3     3.9    0.9    1.1       <total>
index 18d1f5a215e8f4ab0268b8ef1e0705f3de0676d7..cb7cbda3d82f2aee4c950a273b58ca6b49d846c0 100644 (file)
@@ -77,3 +77,4 @@ lzcnt 2(%rsp), %cx
 # CHECK-NEXT: 0.     3     7.3    0.3    0.0       imull       %edx, %ecx
 # CHECK-NEXT: 1.     3     2.3    2.3    1.7       lzcntw      (%rsp), %cx
 # CHECK-NEXT: 2.     3     2.7    2.7    1.0       lzcntw      2(%rsp), %cx
+# CHECK-NEXT:        3     4.1    1.8    0.9       <total>
index b7634f890cd22aa399d9c0f6870243202308b2d4..58981f9a3a914fdf58280f0ff4158684e2347cf1 100644 (file)
@@ -96,3 +96,4 @@ cmpl $1025, %eax
 # CHECK-NEXT: 2.     5     9.4    0.0    0.0       shll        $2, %eax
 # CHECK-NEXT: 3.     5     10.2   0.0    0.0       imull       %ecx, %eax
 # CHECK-NEXT: 4.     5     12.8   0.0    0.0       cmpl        $1025, %eax
+# CHECK-NEXT:        5     10.1   0.1    0.2       <total>
index 995bb35d3ac32331e2d377506950b4b73f465f0f..e5cc4bc0f2c40fbc0833b5c78240f73cc6cb9011 100644 (file)
@@ -45,3 +45,4 @@ add  %ecx, %ebx
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       imulw       %ax, %cx
 # CHECK-NEXT: 1.     1     4.0    0.0    0.0       addb        %al, %cl
 # CHECK-NEXT: 2.     1     5.0    0.0    0.0       addl        %ecx, %ebx
+# CHECK-NEXT:        1     3.3    0.3    0.0       <total>
index df66a44224a34c063471ca27503ebae1d90758e9..deb69273d7c3172ec683e55d1c6d0ced09a8a2cf 100644 (file)
@@ -46,3 +46,4 @@ mulps  (%rdi), %xmm1
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       addps       %xmm0, %xmm1
 # CHECK-NEXT: 1.     1     1.0    0.0    0.0       mulps       (%rdi), %xmm1
+# CHECK-NEXT:        1     1.0    0.5    0.0       <total>
index 6f04df6e13b559b347f4242d51b9b9eb6c20ec88..d57e9fb4a79879b4e390d6b1a9ca409c20e2b8fd 100644 (file)
@@ -45,3 +45,4 @@ imull  (%rdi)
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       imull       %esi
 # CHECK-NEXT: 1.     1     1.0    1.0    0.0       imull       (%rdi)
+# CHECK-NEXT:        1     1.0    1.0    0.0       <total>
index 1b39f8bcdd6ddc90c882e0ed4764af944366ec06..071207df27e7788fc3a41f713ea31569442a0bc7 100644 (file)
@@ -45,3 +45,4 @@ add %rdx, %r8
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       addq        %rdi, %rsi
 # CHECK-NEXT: 1.     1     1.0    0.0    0.0       addq        (%rsp), %rsi
 # CHECK-NEXT: 2.     1     1.0    1.0    4.0       addq        %rdx, %r8
+# CHECK-NEXT:        1     1.0    0.7    1.3       <total>
index 1e4d26ae0208c9d2d8545ea2d0ffda714998871d..9e8de6266cc398c89aaec13634b12fa3d8547e31 100644 (file)
@@ -78,3 +78,4 @@ addps %xmm1, %xmm1
 # CHECK-NEXT: 0.     3     0.0    0.0    3.3       xorps       %xmm0, %xmm0
 # CHECK-NEXT: 1.     3     1.3    1.3    1.3       movaps      %xmm0, %xmm1
 # CHECK-NEXT: 2.     3     2.0    0.0    0.0       addps       %xmm1, %xmm1
+# CHECK-NEXT:        3     1.1    0.4    1.6       <total>
index 6f22cdc0b7e5c04081049aadade8c1ffecd3b2a8..a20fb0ce4adc06438e31c87375bca3a597cc8efd 100644 (file)
@@ -119,3 +119,4 @@ movdqu %xmm5, %xmm0
 # CHECK-NEXT: 6.     3     7.7    0.0    0.0       movupd      %xmm3, %xmm4
 # CHECK-NEXT: 7.     3     8.3    0.0    0.0       movdqa      %xmm4, %xmm5
 # CHECK-NEXT: 8.     3     9.0    0.0    0.0       movdqu      %xmm5, %xmm0
+# CHECK-NEXT:        3     5.7    0.2    0.9       <total>
index e85ce5254bcea00048241e1e5b8736d781db4537..30f2e7d8a20b6979504996b5976f97c7cb9debb6 100644 (file)
@@ -104,3 +104,4 @@ movdqu %xmm5, %xmm0
 # CHECK-NEXT: 4.     3     7.7    0.0    0.0       movupd      %xmm3, %xmm4
 # CHECK-NEXT: 5.     3     8.3    0.0    0.0       movdqa      %xmm4, %xmm5
 # CHECK-NEXT: 6.     3     9.0    0.0    0.0       movdqu      %xmm5, %xmm0
+# CHECK-NEXT:        3     7.0    0.0    0.0       <total>
index 339ec06bcc8d13a9b82df1b816001f8515d9400a..390dee10ed10c1a29323d58c404c0c0e6b6a7c20 100644 (file)
@@ -90,3 +90,4 @@ mov %edx, %eax
 # CHECK-NEXT: 2.     3     4.7    0.0    0.0       movl        %ebx, %ecx
 # CHECK-NEXT: 3.     3     5.3    0.0    0.0       movl        %ecx, %edx
 # CHECK-NEXT: 4.     3     6.0    0.0    0.0       movl        %edx, %eax
+# CHECK-NEXT:        3     4.7    0.1    0.0       <total>
index 66ce02cb0fcc802ca9091c45d0eaa98ce1e989ef..2408e794fcdf311f5ea9de3bd9deec27046a7ca5 100644 (file)
@@ -90,3 +90,4 @@ mov %rdx, %rax
 # CHECK-NEXT: 2.     3     4.7    0.0    0.0       movq        %rbx, %rcx
 # CHECK-NEXT: 3.     3     5.3    0.0    0.0       movq        %rcx, %rdx
 # CHECK-NEXT: 4.     3     6.0    0.0    0.0       movq        %rdx, %rax
+# CHECK-NEXT:        3     4.7    0.1    0.0       <total>
index 70bd65681feb25864621feb101042b45a453a9e4..7380eb2300660288acce019bd543790401066008 100644 (file)
@@ -96,3 +96,4 @@ mov %esi, %ecx
 # CHECK-NEXT: 3.     3     3.0    0.0    0.0       addq        %rcx, %rcx
 # CHECK-NEXT: 4.     3     3.3    0.0    0.0       addq        %rcx, %rcx
 # CHECK-NEXT: 5.     3     1.0    1.0    2.3       movl        %esi, %ecx
+# CHECK-NEXT:        3     1.8    0.2    1.1       <total>
index d9db803083234a9c40efd9ba6d82153def863e7d..08a9c47302267da424f3210963824edfa28776ac 100644 (file)
@@ -138,6 +138,7 @@ movaps %xmm3, (%rbx)
 # CHECK-NEXT: 1.     1     2.0    0.0    0.0       movb        %bpl, (%rcx)
 # CHECK-NEXT: 2.     1     3.0    0.0    0.0       movb        %sil, (%rdx)
 # CHECK-NEXT: 3.     1     4.0    0.0    0.0       movb        %dil, (%rbx)
+# CHECK-NEXT:        1     2.5    0.3    0.0       <total>
 
 # CHECK:      [1] Code Region
 
@@ -234,6 +235,7 @@ movaps %xmm3, (%rbx)
 # CHECK-NEXT: 1.     1     2.0    0.0    0.0       movw        %bp, (%rcx)
 # CHECK-NEXT: 2.     1     3.0    0.0    0.0       movw        %si, (%rdx)
 # CHECK-NEXT: 3.     1     4.0    0.0    0.0       movw        %di, (%rbx)
+# CHECK-NEXT:        1     2.5    0.3    0.0       <total>
 
 # CHECK:      [2] Code Region
 
@@ -330,6 +332,7 @@ movaps %xmm3, (%rbx)
 # CHECK-NEXT: 1.     1     2.0    0.0    0.0       movl        %ebp, (%rcx)
 # CHECK-NEXT: 2.     1     3.0    0.0    0.0       movl        %esi, (%rdx)
 # CHECK-NEXT: 3.     1     4.0    0.0    0.0       movl        %edi, (%rbx)
+# CHECK-NEXT:        1     2.5    0.3    0.0       <total>
 
 # CHECK:      [3] Code Region
 
@@ -426,6 +429,7 @@ movaps %xmm3, (%rbx)
 # CHECK-NEXT: 1.     1     2.0    0.0    0.0       movq        %rbp, (%rcx)
 # CHECK-NEXT: 2.     1     3.0    0.0    0.0       movq        %rsi, (%rdx)
 # CHECK-NEXT: 3.     1     4.0    0.0    0.0       movq        %rdi, (%rbx)
+# CHECK-NEXT:        1     2.5    0.3    0.0       <total>
 
 # CHECK:      [4] Code Region
 
@@ -522,6 +526,7 @@ movaps %xmm3, (%rbx)
 # CHECK-NEXT: 1.     1     2.0    0.0    0.0       movd        %mm1, (%rcx)
 # CHECK-NEXT: 2.     1     3.0    0.0    0.0       movd        %mm2, (%rdx)
 # CHECK-NEXT: 3.     1     4.0    0.0    0.0       movd        %mm3, (%rbx)
+# CHECK-NEXT:        1     2.5    0.3    0.0       <total>
 
 # CHECK:      [5] Code Region
 
@@ -618,3 +623,4 @@ movaps %xmm3, (%rbx)
 # CHECK-NEXT: 1.     1     2.0    0.0    0.0       movaps      %xmm1, (%rcx)
 # CHECK-NEXT: 2.     1     3.0    0.0    0.0       movaps      %xmm2, (%rdx)
 # CHECK-NEXT: 3.     1     4.0    0.0    0.0       movaps      %xmm3, (%rbx)
+# CHECK-NEXT:        1     2.5    0.3    0.0       <total>
index 3a14fbc66bee0e0edf0908d2af73c2abaed58ea3..62ff7b54cb6c863aa5e4126ad797b7ca3cc4e372 100644 (file)
@@ -240,3 +240,4 @@ pxor   %xmm2, %xmm2
 # CHECK-NEXT: 32.    1     3.0    0.0    25.0      xorpd       %xmm1, %xmm1
 # CHECK-NEXT: 33.    1     28.0   0.0    0.0       pxor        %mm2, %mm2
 # CHECK-NEXT: 34.    1     3.0    0.0    26.0      pxor        %xmm2, %xmm2
+# CHECK-NEXT:        1     6.7    0.2    10.3      <total>
index c377640a02d56049ee814f7a76ba2d58cf0257e8..918fb1d1d3a41cd4dfef9c98547eb5b1f173a903 100644 (file)
@@ -108,3 +108,4 @@ add %eax, %edx
 # CHECK-NEXT: 0.     10    12.0   2.0    0.0       addl        %eax, %ecx
 # CHECK-NEXT: 1.     10    10.7   1.8    1.0       addl        %esi, %eax
 # CHECK-NEXT: 2.     10    12.5   1.0    0.0       addl        %eax, %edx
+# CHECK-NEXT:        10    11.7   1.6    0.3       <total>
index 647ce9830922dde0149a126f94f6e1042a6e3def..bc0aa4e6e3344137c6dbf07afd7fe6b4ad2d9343 100644 (file)
@@ -61,3 +61,4 @@ bsf   %rax, %rcx
 # CHECK-NEXT: 1.     2     4.0    2.0    2.5       lzcntl      %ecx, %eax
 # CHECK-NEXT: 2.     2     6.0    0.0    1.5       andq        %rcx, %rax
 # CHECK-NEXT: 3.     2     6.0    0.0    0.0       bsfq        %rax, %rcx
+# CHECK-NEXT:        2     4.8    0.6    1.0       <total>
index e4ff3efe90cf342982d422eb12580b7986f431fb..7587291e0a1de52e7660c9805d6081727edbd86b 100644 (file)
@@ -135,3 +135,4 @@ vandps %xmm4, %xmm1, %xmm0
 # CHECK-NEXT: 15.    2     29.5   18.5   0.0       vaddps      %ymm3, %ymm1, %ymm4
 # CHECK-NEXT: 16.    2     29.5   19.0   0.0       vaddps      %ymm3, %ymm1, %ymm4
 # CHECK-NEXT: 17.    2     34.5   0.0    0.0       vandps      %xmm4, %xmm1, %xmm0
+# CHECK-NEXT:        2     24.0   9.6    0.2       <total>
index 1b6731298a17d899afe9b66d1a4570d4bf49f176..32a440966f876ed3fbcd922f30ff8905c60e1038 100644 (file)
@@ -63,6 +63,7 @@ addps  %xmm0, %xmm0
 # CHECK-NEXT: 0.     2     7.0    1.0    0.0       sqrtss      %xmm0, %xmm0
 # CHECK-NEXT: 1.     2     2.0    2.0    8.5       movss       (%eax), %xmm0
 # CHECK-NEXT: 2.     2     8.5    1.5    2.5       addps       %xmm0, %xmm0
+# CHECK-NEXT:        2     5.8    1.5    3.7       <total>
 
 # CHECK:      [1] Code Region
 
@@ -110,3 +111,4 @@ addps  %xmm0, %xmm0
 # CHECK-NEXT: 0.     2     7.0    1.0    0.0       sqrtsd      %xmm0, %xmm0
 # CHECK-NEXT: 1.     2     2.0    2.0    8.5       movsd       (%eax), %xmm0
 # CHECK-NEXT: 2.     2     8.5    1.5    2.5       addps       %xmm0, %xmm0
+# CHECK-NEXT:        2     5.8    1.5    3.7       <total>
index ebed6faf9454e696b6f232c3d7dfc1df9ce74e9d..fbf47e4d83ef877923030018aa73fb5d5a0100e6 100644 (file)
@@ -84,3 +84,4 @@ cmovae %ebx, %eax
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     3     1.3    1.3    1.0       cmpl        %eax, %eax
 # CHECK-NEXT: 1.     3     3.7    0.3    0.0       cmovael     %ebx, %eax
+# CHECK-NEXT:        3     2.5    0.8    0.5       <total>
index d39aa7c776f66e0105e73d1ba151bbf2a355a684..fa82b29a39755b50ca7b7e40dace9b647e45af6f 100644 (file)
@@ -100,3 +100,4 @@ vpcmpeqq %xmm3, %xmm3, %xmm0
 # CHECK-NEXT: 1.     3     6.0    6.0    0.0       vpcmpeqw    %xmm1, %xmm1, %xmm2
 # CHECK-NEXT: 2.     3     4.0    4.0    2.0       vpcmpeqd    %xmm2, %xmm2, %xmm3
 # CHECK-NEXT: 3.     3     6.0    0.0    0.0       vpcmpeqq    %xmm3, %xmm3, %xmm0
+# CHECK-NEXT:        3     5.0    3.5    0.5       <total>
index 85135db464227e2450e97bd134e7418b209a0c2d..47c4de4ee4ed615d8f8a9eb4392fd07c0288fabb 100644 (file)
@@ -100,3 +100,4 @@ vpcmpgtq %xmm3, %xmm3, %xmm0
 # CHECK-NEXT: 1.     3     0.0    0.0    1.3       vpcmpgtw    %xmm1, %xmm1, %xmm2
 # CHECK-NEXT: 2.     3     0.0    0.0    1.3       vpcmpgtd    %xmm2, %xmm2, %xmm3
 # CHECK-NEXT: 3.     3     1.0    1.0    0.0       vpcmpgtq    %xmm3, %xmm3, %xmm0
+# CHECK-NEXT:        3     0.3    0.3    1.0       <total>
index be0bf9d7dd4bee32362ba48916b4c11fe61fff6f..233586223ad9a897f6303fb7deeca3eff416f30c 100644 (file)
@@ -85,3 +85,4 @@ sbb %eax, %eax
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     3     2.7    0.3    0.0       sbbl        %edx, %edx
 # CHECK-NEXT: 1.     3     3.7    0.0    0.0       sbbl        %eax, %eax
+# CHECK-NEXT:        3     3.2    0.2    0.0       <total>
index 35fd91b2602b3f749d52f03895795c63c08103a0..0b48eb597fc14fcba3f3783f811910a88bf04edc 100644 (file)
@@ -93,3 +93,4 @@ sbb %eax, %eax
 # CHECK-NEXT: 0.     3     5.7    2.0    0.0       imull       %edx, %eax
 # CHECK-NEXT: 1.     3     1.7    0.7    6.7       addl        %edx, %edx
 # CHECK-NEXT: 2.     3     5.0    2.7    3.0       sbbl        %eax, %eax
+# CHECK-NEXT:        3     4.1    1.8    3.2       <total>
index 01c5760bedb04e9e496d009980440f45acea17ff..bf49f18c3a81cb46573be66299ce202ee81a7953 100644 (file)
@@ -108,3 +108,4 @@ vpaddd %xmm0, %xmm0, %xmm3
 # CHECK-NEXT: 0.     10    25.0   0.1    0.0       vpmuldq     %xmm0, %xmm0, %xmm1
 # CHECK-NEXT: 1.     10    28.7   0.0    0.0       vpaddd      %xmm1, %xmm1, %xmm0
 # CHECK-NEXT: 2.     10    30.5   0.0    0.0       vpaddd      %xmm0, %xmm0, %xmm3
+# CHECK-NEXT:        10    28.1   0.0    0.0       <total>
index 98cda18047050b3fa101012e19fda171e71ed482..15c12903c94b6d5fb76b906f8ffbfda8eb28b68a 100644 (file)
@@ -87,3 +87,4 @@ vhaddps  %xmm3, %xmm3, %xmm4
 # CHECK-NEXT: 0.     3     1.0    1.0    13.7      vmulps      %xmm0, %xmm1, %xmm2
 # CHECK-NEXT: 1.     3     6.0    0.7    5.7       vhaddps     %xmm2, %xmm2, %xmm3
 # CHECK-NEXT: 2.     3     16.0   0.0    0.0       vhaddps     %xmm3, %xmm3, %xmm4
+# CHECK-NEXT:        3     7.7    0.6    6.4       <total>
index 90969c10d88efe8596385164b61b38a4a5ca8abd..3a94cf970c7d6f81592c9b3abf3988d3c3193abb 100644 (file)
@@ -42,3 +42,4 @@ vhaddps (%rdi), %xmm1, %xmm2
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       vshufps     $0, %xmm0, %xmm1, %xmm1
 # CHECK-NEXT: 1.     1     1.0    1.0    0.0       vhaddps     (%rdi), %xmm1, %xmm2
+# CHECK-NEXT:        1     1.0    1.0    0.0       <total>
index 792ecc6d75fa645e177b462ebb50ba3657404fe2..cd05a43407a875aa683af064cf1cc58ad83636aa 100644 (file)
@@ -42,3 +42,4 @@ vhaddps (%rdi), %ymm1, %ymm2
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       vshufps     $0, %xmm0, %xmm1, %xmm1
 # CHECK-NEXT: 1.     1     1.0    1.0    0.0       vhaddps     (%rdi), %ymm1, %ymm2
+# CHECK-NEXT:        1     1.0    1.0    0.0       <total>
index 632452f9b599a36f0c59bc1018dfca82250ceed1..1df029fdcb24e95c9448b44351961dd081a1c63f 100644 (file)
@@ -87,3 +87,4 @@ vpinsrb $1, %eax, %xmm0, %xmm0
 # CHECK-NEXT: 0.     3     1.0    0.7    9.3       addl        %eax, %eax
 # CHECK-NEXT: 1.     3     14.3   0.0    0.0       vpinsrb     $0, %eax, %xmm0, %xmm0
 # CHECK-NEXT: 2.     3     15.7   0.0    0.0       vpinsrb     $1, %eax, %xmm0, %xmm0
+# CHECK-NEXT:        3     10.3   0.2    3.1       <total>
index 13e7e7ad07b57d9282d8dedb8b2198eaf57d1f80..54c07d70e2a74ae214be280a4563028134ba7198 100644 (file)
@@ -106,3 +106,4 @@ vmovaps %xmm0, 48(%rdi)
 # CHECK-NEXT: 5.     1     17.0   0.0    0.0       vmovaps     %xmm0, 32(%rdi)
 # CHECK-NEXT: 6.     1     18.0   0.0    0.0       vmovaps     48(%rsi), %xmm0
 # CHECK-NEXT: 7.     1     23.0   0.0    0.0       vmovaps     %xmm0, 48(%rdi)
+# CHECK-NEXT:        1     12.0   0.1    0.0       <total>
index 4f53cce27e235b60f8f4edcfa4ecf212ae5e0062..f326028e12ab554b1b53b9a23ecb8e8475bab8d2 100644 (file)
@@ -157,6 +157,7 @@ movaps %xmm3, (%rbx)
 # CHECK-NEXT: 1.     1     1.0    1.0    0.0       movb        (%rcx), %bpl
 # CHECK-NEXT: 2.     1     2.0    2.0    0.0       movb        (%rdx), %sil
 # CHECK-NEXT: 3.     1     7.0    0.0    0.0       movb        %dil, (%rbx)
+# CHECK-NEXT:        1     2.8    1.0    0.0       <total>
 
 # CHECK:      [1] Code Region
 
@@ -272,6 +273,7 @@ movaps %xmm3, (%rbx)
 # CHECK-NEXT: 1.     1     1.0    1.0    0.0       movw        (%rcx), %bp
 # CHECK-NEXT: 2.     1     2.0    2.0    0.0       movw        (%rdx), %si
 # CHECK-NEXT: 3.     1     7.0    0.0    0.0       movw        %di, (%rbx)
+# CHECK-NEXT:        1     2.8    1.0    0.0       <total>
 
 # CHECK:      [2] Code Region
 
@@ -387,6 +389,7 @@ movaps %xmm3, (%rbx)
 # CHECK-NEXT: 1.     1     1.0    1.0    0.0       movl        (%rcx), %ebp
 # CHECK-NEXT: 2.     1     2.0    2.0    0.0       movl        (%rdx), %esi
 # CHECK-NEXT: 3.     1     7.0    0.0    0.0       movl        %edi, (%rbx)
+# CHECK-NEXT:        1     2.8    1.0    0.0       <total>
 
 # CHECK:      [3] Code Region
 
@@ -502,6 +505,7 @@ movaps %xmm3, (%rbx)
 # CHECK-NEXT: 1.     1     1.0    1.0    0.0       movq        (%rcx), %rbp
 # CHECK-NEXT: 2.     1     2.0    2.0    0.0       movq        (%rdx), %rsi
 # CHECK-NEXT: 3.     1     7.0    0.0    0.0       movq        %rdi, (%rbx)
+# CHECK-NEXT:        1     2.8    1.0    0.0       <total>
 
 # CHECK:      [4] Code Region
 
@@ -619,6 +623,7 @@ movaps %xmm3, (%rbx)
 # CHECK-NEXT: 1.     1     1.0    1.0    0.0       movd        (%rcx), %mm1
 # CHECK-NEXT: 2.     1     2.0    2.0    0.0       movd        (%rdx), %mm2
 # CHECK-NEXT: 3.     1     7.0    0.0    0.0       movd        %mm3, (%rbx)
+# CHECK-NEXT:        1     2.8    1.0    0.0       <total>
 
 # CHECK:      [5] Code Region
 
@@ -734,3 +739,4 @@ movaps %xmm3, (%rbx)
 # CHECK-NEXT: 1.     1     1.0    1.0    0.0       movaps      (%rcx), %xmm1
 # CHECK-NEXT: 2.     1     2.0    2.0    0.0       movaps      (%rdx), %xmm2
 # CHECK-NEXT: 3.     1     7.0    0.0    0.0       movaps      %xmm3, (%rbx)
+# CHECK-NEXT:        1     2.8    1.0    0.0       <total>
index dfb45af19f3bc74e508e8f78485a8804a5cf7b3d..49560697379b9a67de99bdda09613e2933a6e753 100644 (file)
@@ -162,6 +162,7 @@ vmovaps (%rbx), %ymm3
 # CHECK-NEXT: 1.     1     1.0    1.0    0.0       movb        (%rcx), %bpl
 # CHECK-NEXT: 2.     1     3.0    3.0    0.0       movb        (%rdx), %sil
 # CHECK-NEXT: 3.     1     3.0    3.0    0.0       movb        (%rbx), %dil
+# CHECK-NEXT:        1     2.0    2.0    0.0       <total>
 
 # CHECK:      [1] Code Region
 
@@ -275,6 +276,7 @@ vmovaps (%rbx), %ymm3
 # CHECK-NEXT: 1.     1     1.0    1.0    0.0       movw        (%rcx), %bp
 # CHECK-NEXT: 2.     1     3.0    3.0    0.0       movw        (%rdx), %si
 # CHECK-NEXT: 3.     1     3.0    3.0    0.0       movw        (%rbx), %di
+# CHECK-NEXT:        1     2.0    2.0    0.0       <total>
 
 # CHECK:      [2] Code Region
 
@@ -388,6 +390,7 @@ vmovaps (%rbx), %ymm3
 # CHECK-NEXT: 1.     1     1.0    1.0    0.0       movl        (%rcx), %ebp
 # CHECK-NEXT: 2.     1     3.0    3.0    0.0       movl        (%rdx), %esi
 # CHECK-NEXT: 3.     1     3.0    3.0    0.0       movl        (%rbx), %edi
+# CHECK-NEXT:        1     2.0    2.0    0.0       <total>
 
 # CHECK:      [3] Code Region
 
@@ -501,6 +504,7 @@ vmovaps (%rbx), %ymm3
 # CHECK-NEXT: 1.     1     1.0    1.0    0.0       movq        (%rcx), %rbp
 # CHECK-NEXT: 2.     1     3.0    3.0    0.0       movq        (%rdx), %rsi
 # CHECK-NEXT: 3.     1     3.0    3.0    0.0       movq        (%rbx), %rdi
+# CHECK-NEXT:        1     2.0    2.0    0.0       <total>
 
 # CHECK:      [4] Code Region
 
@@ -615,6 +619,7 @@ vmovaps (%rbx), %ymm3
 # CHECK-NEXT: 1.     1     1.0    1.0    0.0       movd        (%rcx), %mm1
 # CHECK-NEXT: 2.     1     4.0    4.0    0.0       movd        (%rdx), %mm2
 # CHECK-NEXT: 3.     1     4.0    4.0    0.0       movd        (%rbx), %mm3
+# CHECK-NEXT:        1     2.5    2.5    0.0       <total>
 
 # CHECK:      [5] Code Region
 
@@ -729,6 +734,7 @@ vmovaps (%rbx), %ymm3
 # CHECK-NEXT: 1.     1     1.0    1.0    0.0       movaps      (%rcx), %xmm1
 # CHECK-NEXT: 2.     1     4.0    4.0    0.0       movaps      (%rdx), %xmm2
 # CHECK-NEXT: 3.     1     4.0    4.0    0.0       movaps      (%rbx), %xmm3
+# CHECK-NEXT:        1     2.5    2.5    0.0       <total>
 
 # CHECK:      [6] Code Region
 
@@ -842,3 +848,4 @@ vmovaps (%rbx), %ymm3
 # CHECK-NEXT: 1.     1     1.0    1.0    0.0       vmovaps     (%rcx), %ymm1
 # CHECK-NEXT: 2.     1     3.0    3.0    0.0       vmovaps     (%rdx), %ymm2
 # CHECK-NEXT: 3.     1     3.0    3.0    0.0       vmovaps     (%rbx), %ymm3
+# CHECK-NEXT:        1     2.0    2.0    0.0       <total>
index 6e215f2420f2334a0afb30f461298c2fcd6238ea..fb96ce5d75610710968e1ea1eb1f717a777f84c8 100644 (file)
@@ -106,3 +106,4 @@ vmovaps %xmm0, 48(%rdi)
 # CHECK-NEXT: 5.     1     9.0    1.0    0.0       vmovaps     %xmm0, 32(%rdi)
 # CHECK-NEXT: 6.     1     3.0    3.0    2.0       vmovaps     48(%rsi), %xmm0
 # CHECK-NEXT: 7.     1     10.0   0.0    0.0       vmovaps     %xmm0, 48(%rdi)
+# CHECK-NEXT:        1     5.3    1.3    0.5       <total>
index 7c2966796a1dddbc9af477a93a7d54c5a720dc06..d3a81e4da48acc93487729b855121f5abf7fe779 100644 (file)
@@ -165,3 +165,4 @@ vpcmpeqw  %xmm3, %xmm3, %xmm5
 # CHECK-NEXT: 12.    1     8.0    8.0    0.0       vpcmpeqd    %xmm3, %xmm3, %xmm5
 # CHECK-NEXT: 13.    1     9.0    2.0    0.0       vpcmpeqq    %xmm3, %xmm3, %xmm5
 # CHECK-NEXT: 14.    1     10.0   10.0   0.0       vpcmpeqw    %xmm3, %xmm3, %xmm5
+# CHECK-NEXT:        1     4.9    3.8    0.2       <total>
index fe8b159edcca7e749e0ac31bceb237f725bc5f44..fed8508572a12b9f331dbb311fa6cf459ac0aa3a 100644 (file)
@@ -46,3 +46,4 @@ add    %ecx, %ebx
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       imulq       %rax, %rbx
 # CHECK-NEXT: 1.     1     6.0    0.0    0.0       lzcntw      %ax, %bx
 # CHECK-NEXT: 2.     1     8.0    0.0    0.0       addl        %ecx, %ebx
+# CHECK-NEXT:        1     5.0    0.3    0.0       <total>
index 20da1ba38291cd1fca4e5fe32bacbe59e340c08a..14e191f5641195fe1503eb45faa7cf96bcf37079 100644 (file)
@@ -92,3 +92,4 @@ xor %bx, %dx
 # CHECK-NEXT: 0.     3     3.7    0.3    0.0       addw        %cx, %dx
 # CHECK-NEXT: 1.     3     4.3    0.0    0.0       movw        %ax, %dx
 # CHECK-NEXT: 2.     3     5.0    0.0    0.0       xorw        %bx, %dx
+# CHECK-NEXT:        3     4.3    0.1    0.0       <total>
index a8a3958fafd31e9bc09ac0137b01b9dea7f84234..5fa4e5ea9639306b73ce3226887b902d7be97093 100644 (file)
@@ -92,3 +92,4 @@ add %cx, %bx
 # CHECK-NEXT: 0.     3     6.7    0.7    0.0       imulw       %ax, %bx
 # CHECK-NEXT: 1.     3     9.7    0.0    0.0       lzcntw      %ax, %bx
 # CHECK-NEXT: 2.     3     11.7   0.0    0.0       addw        %cx, %bx
+# CHECK-NEXT:        3     9.3    0.2    0.0       <total>
index 82afe0a80bbc2d282d6838c3d63fc8d8def2376e..03ad95df5492509b9ac82a952b50192a24e3f8ed 100644 (file)
@@ -93,3 +93,4 @@ lzcnt 2(%rsp), %cx
 # CHECK-NEXT: 0.     3     7.7    0.3    0.0       imull       %edx, %ecx
 # CHECK-NEXT: 1.     3     7.3    0.0    0.0       lzcntw      (%rsp), %cx
 # CHECK-NEXT: 2.     3     8.7    1.0    0.0       lzcntw      2(%rsp), %cx
+# CHECK-NEXT:        3     7.9    0.4    0.0       <total>
index bde293115a6423a27c585e7a12a5cb94a17a08f5..3c0c38d7cc05ffa1a4db4257e213dd9e7f560ea8 100644 (file)
@@ -45,3 +45,4 @@ add  %ecx, %ebx
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       imulw       %ax, %cx
 # CHECK-NEXT: 1.     1     5.0    0.0    0.0       addb        %al, %cl
 # CHECK-NEXT: 2.     1     6.0    0.0    0.0       addl        %ecx, %ebx
+# CHECK-NEXT:        1     4.0    0.3    0.0       <total>
index e6b70c751d6501d0e50831e68144687536489cfb..b1a82c6ad0b4fbf8212a1b49167c7137583c827b 100644 (file)
@@ -121,3 +121,4 @@ vsqrtps     %ymm0, %ymm2
 # CHECK-NEXT: 5.     2     3.5    3.5    12.0      vsqrtps     %xmm0, %xmm2
 # CHECK-NEXT: 6.     2     19.5   19.5   0.0       vaddps      %ymm0, %ymm1, %ymm2
 # CHECK-NEXT: 7.     2     7.5    7.5    8.0       vsqrtps     %ymm0, %ymm2
+# CHECK-NEXT:        2     7.9    7.9    6.1       <total>
index c773cc96e0f050c327c0a3cb92ca0de883612e3e..7490f71e5fa5db1c34f0906808bd9ae33b5f3c51 100644 (file)
@@ -42,3 +42,4 @@ stmxcsr (%rsp)
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     2     51.5   0.5    0.0       int3
 # CHECK-NEXT: 1.     2     151.0  0.0    0.0       stmxcsr     (%rsp)
+# CHECK-NEXT:        2     101.3  0.3    0.0       <total>
index 66b842c870015c00925b1ac2b96a4f4487c7e6cb..c929b8bae3b14a45d4ffc608a9f6aaabcff595d2 100644 (file)
@@ -122,3 +122,4 @@ add %ebx, %eax
 # CHECK-NEXT: 5.     3     10.7   1.0    0.0       addl        %edx, %esi
 # CHECK-NEXT: 6.     3     12.0   1.0    0.0       addl        %ebx, %eax
 # CHECK-NEXT: 7.     3     13.0   0.0    0.0       addl        %ebx, %eax
+# CHECK-NEXT:        3     9.9    1.1    0.3       <total>
index b5be13873da593576766b1e48f1e218665958852..e62f816acb074b68f07756cf8459d78e82a5a641 100644 (file)
@@ -46,3 +46,4 @@ vmulps  (%rdi), %xmm1, %xmm2
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       vaddps      %xmm0, %xmm0, %xmm1
 # CHECK-NEXT: 1.     1     1.0    0.0    0.0       vmulps      (%rdi), %xmm1, %xmm2
+# CHECK-NEXT:        1     1.0    0.5    0.0       <total>
index ce33d9d50b9a8317b64d65a5b211327b4894c4ea..be28b7af9dafd79c6e7b783da5a5ffc541946ae1 100644 (file)
@@ -45,3 +45,4 @@
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       imull       %esi
 # CHECK-NEXT: 1.     1     5.0    4.0    0.0       imull       (%rdi)
+# CHECK-NEXT:        1     3.0    2.5    0.0       <total>
index 838ac4d7880fe7f4c3c3d51a06c8cc487d42d044..e5e02b264e508a4074296e19f92a9ea187511a2e 100644 (file)
@@ -45,3 +45,4 @@
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       addq        %rdi, %rsi
 # CHECK-NEXT: 1.     1     1.0    0.0    0.0       addq        (%rsp), %rsi
 # CHECK-NEXT: 2.     1     3.0    3.0    2.0       addq        %rdx, %r8
+# CHECK-NEXT:        1     1.7    1.3    0.7       <total>
index fc9e5c0f0cc627f463de43b70606c84cb14165f0..7bfb210abf9cebb4b52b771f0379dd8329066315 100644 (file)
@@ -104,3 +104,4 @@ vaddps %xmm1, %xmm1, %xmm2
 # CHECK-NEXT: 0.     3     0.0    0.0    5.3       vxorps      %xmm0, %xmm0, %xmm0
 # CHECK-NEXT: 1.     3     1.7    1.7    3.0       vmovaps     %xmm0, %xmm1
 # CHECK-NEXT: 2.     3     3.3    1.0    0.0       vaddps      %xmm1, %xmm1, %xmm2
+# CHECK-NEXT:        3     1.7    0.9    2.8       <total>
index c701967dd448c74bc582815e5c3c8497533508f2..a6e2fa94ace24a5c7266b5aa2a3b94c533c74fd2 100644 (file)
@@ -144,3 +144,4 @@ movdqu %xmm5, %xmm0
 # CHECK-NEXT: 6.     3     4.7    0.0    0.0       movupd      %xmm3, %xmm4
 # CHECK-NEXT: 7.     3     5.3    0.0    0.0       movdqa      %xmm4, %xmm5
 # CHECK-NEXT: 8.     3     6.0    0.0    0.0       movdqu      %xmm5, %xmm0
+# CHECK-NEXT:        3     3.0    0.4    1.4       <total>
index 4b53663690d6f43f99e948099de615c3aa8d06ce..0a8fda9fe2eb7e6ffad476836a9989659d416613 100644 (file)
@@ -129,3 +129,4 @@ vmovdqu %xmm5, %xmm0
 # CHECK-NEXT: 4.     3     5.7    0.0    0.0       vmovupd     %xmm3, %xmm4
 # CHECK-NEXT: 5.     3     6.3    0.0    0.0       vmovdqa     %xmm4, %xmm5
 # CHECK-NEXT: 6.     3     7.0    0.0    0.0       vmovdqu     %xmm5, %xmm0
+# CHECK-NEXT:        3     4.5    0.5    0.8       <total>
index 0b4afc3f25e21e55f049d95ecf607bf3d383e62d..94163b1162b4d1faedcf4ea95031a2c4f9afa547 100644 (file)
@@ -115,3 +115,4 @@ mov %edx, %eax
 # CHECK-NEXT: 2.     3     4.7    0.0    0.0       movl        %ebx, %ecx
 # CHECK-NEXT: 3.     3     5.3    0.0    0.0       movl        %ecx, %edx
 # CHECK-NEXT: 4.     3     6.0    0.0    0.0       movl        %edx, %eax
+# CHECK-NEXT:        3     4.0    0.8    0.7       <total>
index c0cd38a031b11e3141d583d60c6d3784a5d181e3..8ccbbeab3cc2dadace948773a76baf89f116c542 100644 (file)
@@ -115,3 +115,4 @@ mov %rdx, %rax
 # CHECK-NEXT: 2.     3     4.7    0.0    0.0       movq        %rbx, %rcx
 # CHECK-NEXT: 3.     3     5.3    0.0    0.0       movq        %rcx, %rdx
 # CHECK-NEXT: 4.     3     6.0    0.0    0.0       movq        %rdx, %rax
+# CHECK-NEXT:        3     4.0    0.8    0.7       <total>
index acbe8e8548198784846907c846fba1d8b46b7c3e..b93ee5c09d7fcd0a8e997509c85f7be83fa9c7ea 100644 (file)
@@ -100,3 +100,4 @@ vmulps %xmm0, %xmm0, %xmm0
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     5     20.2   0.2    0.0       vaddps      %xmm0, %xmm0, %xmm0
 # CHECK-NEXT: 1.     5     25.2   0.0    0.0       vmulps      %xmm0, %xmm0, %xmm0
+# CHECK-NEXT:        5     22.7   0.1    0.0       <total>
index 316b9c7a078911cc0d8a223db826700f1910be66..c68b610049fd3e8238c589f81795d98a94b1d251 100644 (file)
@@ -100,3 +100,4 @@ vmulps %xmm0, %xmm0, %xmm0
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     5     14.0   0.2    0.0       vaddps      %xmm0, %xmm0, %xmm0
 # CHECK-NEXT: 1.     5     15.8   0.0    0.0       vmulps      %xmm0, %xmm0, %xmm0
+# CHECK-NEXT:        5     14.9   0.1    0.0       <total>
index 61bcde757f1441120cf5c9aaa4a838e866546e7e..6c86b6ebe22380cdd30bd4d2107cb5d45b4e2afb 100644 (file)
 # CHECK-NEXT: 30.    1     24.0   11.0   0.0       vaddps      %ymm3, %ymm0, %ymm4
 # CHECK-NEXT: 31.    1     25.0   12.0   0.0       vaddps      %ymm3, %ymm0, %ymm5
 # CHECK-NEXT: 32.    1     25.0   13.0   0.0       vaddps      %ymm3, %ymm0, %ymm6
+# CHECK-NEXT:        1     15.6   11.2   0.6       <total>
index b24272c4166ad344c7c51827a298ef5b5abd7ca4..067301b06a513f21a4615b28ddef2535574a8987 100644 (file)
@@ -162,6 +162,7 @@ vmovaps %ymm3, (%rbx)
 # CHECK-NEXT: 1.     1     2.0    0.0    0.0       movb        %bpl, (%rcx)
 # CHECK-NEXT: 2.     1     3.0    0.0    0.0       movb        %sil, (%rdx)
 # CHECK-NEXT: 3.     1     4.0    0.0    0.0       movb        %dil, (%rbx)
+# CHECK-NEXT:        1     2.5    0.3    0.0       <total>
 
 # CHECK:      [1] Code Region
 
@@ -275,6 +276,7 @@ vmovaps %ymm3, (%rbx)
 # CHECK-NEXT: 1.     1     2.0    0.0    0.0       movw        %bp, (%rcx)
 # CHECK-NEXT: 2.     1     3.0    0.0    0.0       movw        %si, (%rdx)
 # CHECK-NEXT: 3.     1     4.0    0.0    0.0       movw        %di, (%rbx)
+# CHECK-NEXT:        1     2.5    0.3    0.0       <total>
 
 # CHECK:      [2] Code Region
 
@@ -388,6 +390,7 @@ vmovaps %ymm3, (%rbx)
 # CHECK-NEXT: 1.     1     2.0    0.0    0.0       movl        %ebp, (%rcx)
 # CHECK-NEXT: 2.     1     3.0    0.0    0.0       movl        %esi, (%rdx)
 # CHECK-NEXT: 3.     1     4.0    0.0    0.0       movl        %edi, (%rbx)
+# CHECK-NEXT:        1     2.5    0.3    0.0       <total>
 
 # CHECK:      [3] Code Region
 
@@ -501,6 +504,7 @@ vmovaps %ymm3, (%rbx)
 # CHECK-NEXT: 1.     1     2.0    0.0    0.0       movq        %rbp, (%rcx)
 # CHECK-NEXT: 2.     1     3.0    0.0    0.0       movq        %rsi, (%rdx)
 # CHECK-NEXT: 3.     1     4.0    0.0    0.0       movq        %rdi, (%rbx)
+# CHECK-NEXT:        1     2.5    0.3    0.0       <total>
 
 # CHECK:      [4] Code Region
 
@@ -616,6 +620,7 @@ vmovaps %ymm3, (%rbx)
 # CHECK-NEXT: 1.     1     3.0    0.0    0.0       movd        %mm1, (%rcx)
 # CHECK-NEXT: 2.     1     5.0    0.0    0.0       movd        %mm2, (%rdx)
 # CHECK-NEXT: 3.     1     7.0    0.0    0.0       movd        %mm3, (%rbx)
+# CHECK-NEXT:        1     4.0    0.3    0.0       <total>
 
 # CHECK:      [5] Code Region
 
@@ -730,6 +735,7 @@ vmovaps %ymm3, (%rbx)
 # CHECK-NEXT: 1.     1     2.0    0.0    0.0       movaps      %xmm1, (%rcx)
 # CHECK-NEXT: 2.     1     4.0    1.0    0.0       movaps      %xmm2, (%rdx)
 # CHECK-NEXT: 3.     1     5.0    0.0    0.0       movaps      %xmm3, (%rbx)
+# CHECK-NEXT:        1     3.0    0.5    0.0       <total>
 
 # CHECK:      [6] Code Region
 
@@ -843,3 +849,4 @@ vmovaps %ymm3, (%rbx)
 # CHECK-NEXT: 1.     1     2.0    1.0    0.0       vmovaps     %ymm1, (%rcx)
 # CHECK-NEXT: 2.     1     35.0   33.0   0.0       vmovaps     %ymm2, (%rdx)
 # CHECK-NEXT: 3.     1     36.0   1.0    0.0       vmovaps     %ymm3, (%rbx)
+# CHECK-NEXT:        1     18.5   9.0    0.0       <total>
index 0246216b734961897741d62281a702e9190da538..ab7a53438afc3c542162e2d5386aac882cd6cfaa 100644 (file)
@@ -80,3 +80,4 @@ vbroadcastss (%rax), %ymm0
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     3     1.0    1.0    2.7       leaq        8(%rsp,%rdi,2), %rax
 # CHECK-NEXT: 1.     3     1.7    0.7    0.0       vbroadcastss        (%rax), %ymm0
+# CHECK-NEXT:        3     1.3    0.8    1.3       <total>
index c977e843c6cdb11ab000293a40c072eb98ee96fb..96e19db3b3a3bc5f668654791bce19626a0e70b0 100644 (file)
@@ -41,3 +41,4 @@ vandps (%rdi), %xmm1, %xmm2
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       vaddps      %xmm0, %xmm0, %xmm1
 # CHECK-NEXT: 1.     1     1.0    0.0    0.0       vandps      (%rdi), %xmm1, %xmm2
+# CHECK-NEXT:        1     1.0    0.5    0.0       <total>
index 55932ecd24526912ed4ccd95a2458d27e6dbbf50..ff74bc352ca67b5a9a6572d5f02763f57d4abc92 100644 (file)
@@ -41,3 +41,4 @@ vandps (%rdi), %ymm1, %ymm2
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       vaddps      %ymm0, %ymm0, %ymm1
 # CHECK-NEXT: 1.     1     1.0    0.0    0.0       vandps      (%rdi), %ymm1, %ymm2
+# CHECK-NEXT:        1     1.0    0.5    0.0       <total>
index 2c00cc7ffefa4dadc5279535f6d8eade1f6d61b6..f694a0429e2a18e16107c7d5af02a1d7b9a0d003 100644 (file)
 # CHECK-NEXT: 3.     2     16.0   0.0    6.0       vaddps      %ymm4, %ymm5, %ymm6
 # CHECK-NEXT: 4.     2     20.0   0.0    4.0       vmulps      %ymm6, %ymm3, %ymm4
 # CHECK-NEXT: 5.     2     25.0   0.0    1.5       vaddps      %ymm4, %ymm5, %ymm0
+# CHECK-NEXT:        2     14.8   0.4    5.3       <total>
index af3b709bb4e62d7937081cbcecf66696b768f793..33ea990b57b5e6844187bf653a20080088c7676f 100644 (file)
 # CHECK-NEXT: 3.     2     8.0    0.0    6.0       vaddps      %ymm4, %ymm5, %ymm6
 # CHECK-NEXT: 4.     2     12.0   0.0    4.0       vmulps      %ymm6, %ymm3, %ymm4
 # CHECK-NEXT: 5.     2     17.0   0.0    1.5       vaddps      %ymm4, %ymm5, %ymm0
+# CHECK-NEXT:        2     8.7    0.3    5.3       <total>
index ea623c1b2e626ca34412aebcca2a0d2d4e808521..5338c3c56044843a60185eb8657cf489a4bb4341 100644 (file)
@@ -120,6 +120,7 @@ vaddps  %ymm1, %ymm1, %ymm0
 # CHECK-NEXT: 0.     3     2.0    2.0    0.0       vaddps      %ymm0, %ymm0, %ymm1
 # CHECK-NEXT: 1.     3     3.0    3.0    1.7       vxorps      %ymm1, %ymm1, %ymm1
 # CHECK-NEXT: 2.     3     4.3    0.0    0.3       vblendps    $2, %ymm1, %ymm2, %ymm3
+# CHECK-NEXT:        3     3.1    1.7    0.7       <total>
 
 # CHECK:      [1] Code Region - ZERO-IDIOM-2
 
@@ -205,6 +206,7 @@ vaddps  %ymm1, %ymm1, %ymm0
 # CHECK-NEXT: 0.     3     2.0    2.0    0.0       vaddpd      %ymm0, %ymm0, %ymm1
 # CHECK-NEXT: 1.     3     3.0    3.0    1.7       vxorpd      %ymm1, %ymm1, %ymm1
 # CHECK-NEXT: 2.     3     4.3    0.0    0.3       vblendpd    $2, %ymm1, %ymm2, %ymm3
+# CHECK-NEXT:        3     3.1    1.7    0.7       <total>
 
 # CHECK:      [2] Code Region - ZERO-IDIOM-3
 
@@ -284,6 +286,7 @@ vaddps  %ymm1, %ymm1, %ymm0
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     3     2.0    2.0    0.0       vaddps      %ymm0, %ymm1, %ymm2
 # CHECK-NEXT: 1.     3     2.0    2.0    3.0       vandnps     %ymm2, %ymm2, %ymm3
+# CHECK-NEXT:        3     2.0    2.0    1.5       <total>
 
 # CHECK:      [3] Code Region - ZERO-IDIOM-4
 
@@ -363,6 +366,7 @@ vaddps  %ymm1, %ymm1, %ymm0
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     3     2.0    2.0    0.0       vaddps      %ymm0, %ymm1, %ymm2
 # CHECK-NEXT: 1.     3     2.0    2.0    3.0       vandnps     %ymm2, %ymm2, %ymm3
+# CHECK-NEXT:        3     2.0    2.0    1.5       <total>
 
 # CHECK:      [4] Code Region - ZERO-IDIOM-5
 
@@ -442,3 +446,4 @@ vaddps  %ymm1, %ymm1, %ymm0
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     3     7.0    0.3    0.0       vperm2f128  $136, %ymm0, %ymm0, %ymm1
 # CHECK-NEXT: 1.     3     9.0    0.0    0.0       vaddps      %ymm1, %ymm1, %ymm0
+# CHECK-NEXT:        3     8.0    0.2    0.0       <total>
index 7db6e09c77d8bfd1890ac63c9b836a5a943e25c0..c0509d8f451c88e95f4d86aac0a24e8a355adc8c 100644 (file)
@@ -450,3 +450,4 @@ vpxor  %xmm3, %xmm3, %xmm5
 # CHECK-NEXT: 68.    1     0.0    0.0    11.0      vxorps      %xmm4, %xmm4, %xmm5
 # CHECK-NEXT: 69.    1     0.0    0.0    11.0      vxorpd      %xmm1, %xmm1, %xmm3
 # CHECK-NEXT: 70.    1     0.0    0.0    12.0      vpxor       %xmm3, %xmm3, %xmm5
+# CHECK-NEXT:        1     1.2    1.2    4.1       <total>
index 16a9ca4b51beb6154d609511f9f92a63fde99302..4fdb7c11d6fd8dcd5265598eafddd1fe061c0934 100644 (file)
@@ -448,3 +448,4 @@ vpxor  %ymm3, %ymm3, %ymm5
 # CHECK-NEXT: 72.    1     0.0    0.0    3.0       vxorpd      %ymm1, %ymm1, %ymm3
 # CHECK-NEXT: 73.    1     0.0    0.0    3.0       vpxor       %xmm3, %xmm3, %xmm5
 # CHECK-NEXT: 74.    1     0.0    0.0    3.0       vpxor       %ymm3, %ymm3, %ymm5
+# CHECK-NEXT:        1     0.9    0.2    1.8       <total>
index 59b20c755ae0a27483a6d6025924ee5ffa104747..80f42c9e8f6bfcb35ce776c7fb8810238acfd3e4 100644 (file)
@@ -99,3 +99,4 @@ add %eax, %edx
 # CHECK-NEXT: 0.     10    2.5    0.4    0.0       addl        %eax, %ecx
 # CHECK-NEXT: 1.     10    2.1    0.7    0.5       addl        %esi, %eax
 # CHECK-NEXT: 2.     10    2.6    0.0    0.3       addl        %eax, %edx
+# CHECK-NEXT:        10    2.4    0.4    0.3       <total>
index 4091ad8d7157f9dcd62b42f3086e8b0d3c897a95..30b05eb290efdffe43775b1897d9c90549c92a38 100644 (file)
@@ -99,3 +99,4 @@ add %edx, %eax
 # CHECK-NEXT: 1.     1     2.0    0.0    0.0       addl        %ebx, %ecx
 # CHECK-NEXT: 2.     1     2.0    0.0    0.0       addl        %ecx, %edx
 # CHECK-NEXT: 3.     1     3.0    0.0    0.0       addl        %edx, %eax
+# CHECK-NEXT:        1     2.0    0.3    0.0       <total>
index 3b0639a0c5a38c0461ac99a341f7a4623946927e..d78e887f03b8008a3121ee153b9257dce7111415 100644 (file)
@@ -124,3 +124,4 @@ vmovaps %xmm0, 48(%rdi)
 # CHECK-NEXT: 5.     1     16.0   0.0    0.0       vmovaps     %xmm0, 32(%rdi)
 # CHECK-NEXT: 6.     1     16.0   0.0    0.0       vmovaps     48(%rsi), %xmm0
 # CHECK-NEXT: 7.     1     21.0   0.0    0.0       vmovaps     %xmm0, 48(%rdi)
+# CHECK-NEXT:        1     11.0   0.1    0.0       <total>
index 0681f7ddc06fe93c31e4b10c4858e6cec11cbc26..6483809deda3a93411cb7b623db9b8a918757cc2 100644 (file)
@@ -61,3 +61,4 @@ bsf   %rax, %rcx
 # CHECK-NEXT: 1.     2     1.5    1.0    4.5       lzcntl      %ecx, %eax
 # CHECK-NEXT: 2.     2     2.0    0.0    4.5       andq        %rcx, %rax
 # CHECK-NEXT: 3.     2     2.0    0.0    0.5       bsfq        %rax, %rcx
+# CHECK-NEXT:        2     1.8    0.4    2.4       <total>
index 649c8f982d5d902049b406264d161b2143b83457..987c54a07567dbba8a1399ce34c060fffe9deb64 100644 (file)
@@ -121,3 +121,4 @@ vandps %xmm4, %xmm1, %xmm0
 # CHECK-NEXT: 15.    2     21.0   21.0   13.5      vaddps      %ymm3, %ymm1, %ymm4
 # CHECK-NEXT: 16.    2     22.0   22.0   12.5      vaddps      %ymm3, %ymm1, %ymm4
 # CHECK-NEXT: 17.    2     24.0   0.0    11.5      vandps      %xmm4, %xmm1, %xmm0
+# CHECK-NEXT:        2     17.5   9.9    21.6      <total>
index 865dc56a7b66fe8afaa79c6a08087bfb7cac7ee6..c0b9c7ed37d957c0094fd93e516295d9a3828961 100644 (file)
@@ -110,6 +110,7 @@ lock cmpxchg16b (%rsp)
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       imulq       %rax, %rax
 # CHECK-NEXT: 1.     1     3.0    0.0    0.0       cmpxchgq    %rcx, (%rdx)
+# CHECK-NEXT:        1     2.0    0.5    0.0       <total>
 
 # CHECK:      [1] Code Region
 
@@ -176,6 +177,7 @@ lock cmpxchg16b (%rsp)
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       imulq       %rcx, %rcx
 # CHECK-NEXT: 1.     1     3.0    0.0    0.0       cmpxchgq    %rcx, (%rdx)
+# CHECK-NEXT:        1     2.0    0.5    0.0       <total>
 
 # CHECK:      [2] Code Region
 
@@ -242,6 +244,7 @@ lock cmpxchg16b (%rsp)
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       imulq       %rax, %rax
 # CHECK-NEXT: 1.     1     3.0    0.0    0.0       lock                cmpxchgq        %rcx, (%rdx)
+# CHECK-NEXT:        1     2.0    0.5    0.0       <total>
 
 # CHECK:      [3] Code Region
 
@@ -308,6 +311,7 @@ lock cmpxchg16b (%rsp)
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       imulq       %rcx, %rcx
 # CHECK-NEXT: 1.     1     3.0    0.0    0.0       lock                cmpxchgq        %rcx, (%rdx)
+# CHECK-NEXT:        1     2.0    0.5    0.0       <total>
 
 # CHECK:      [4] Code Region
 
@@ -378,6 +382,7 @@ lock cmpxchg16b (%rsp)
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       imull       %eax, %eax
 # CHECK-NEXT: 1.     1     2.0    2.0    0.0       imull       %edx, %edx
 # CHECK-NEXT: 2.     1     1.0    0.0    0.0       cmpxchg8b   (%rsp)
+# CHECK-NEXT:        1     1.3    1.0    0.0       <total>
 
 # CHECK:      [5] Code Region
 
@@ -448,6 +453,7 @@ lock cmpxchg16b (%rsp)
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       imull       %eax, %eax
 # CHECK-NEXT: 1.     1     2.0    2.0    0.0       imull       %edx, %edx
 # CHECK-NEXT: 2.     1     1.0    0.0    0.0       cmpxchg16b  (%rsp)
+# CHECK-NEXT:        1     1.3    1.0    0.0       <total>
 
 # CHECK:      [6] Code Region
 
@@ -518,6 +524,7 @@ lock cmpxchg16b (%rsp)
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       imull       %ebx, %ebx
 # CHECK-NEXT: 1.     1     2.0    2.0    0.0       imull       %ecx, %ecx
 # CHECK-NEXT: 2.     1     1.0    0.0    0.0       lock                cmpxchg8b       (%rsp)
+# CHECK-NEXT:        1     1.3    1.0    0.0       <total>
 
 # CHECK:      [7] Code Region
 
@@ -588,3 +595,4 @@ lock cmpxchg16b (%rsp)
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       imull       %ebx, %ebx
 # CHECK-NEXT: 1.     1     2.0    2.0    0.0       imull       %ecx, %ecx
 # CHECK-NEXT: 2.     1     1.0    0.0    0.0       lock                cmpxchg16b      (%rsp)
+# CHECK-NEXT:        1     1.3    1.0    0.0       <total>
index 7fd97d32d0fb8a0e1ceddfc7750aed3001b1de57..25762ec14ad3b3f5d623898dd3bbddfb17ba69ff 100644 (file)
@@ -75,3 +75,4 @@ cmovae %ebx, %eax
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     3     1.0    1.0    0.0       cmpl        %eax, %eax
 # CHECK-NEXT: 1.     3     2.0    0.0    0.0       cmovael     %ebx, %eax
+# CHECK-NEXT:        3     1.5    0.5    0.0       <total>
index aed7d75ffdc5549423c8bc9b91a036bcd8f8b7dc..4f7187fa1e14b55059e0e3d26c61d5d570271b4d 100644 (file)
@@ -90,3 +90,4 @@ vpcmpeqq %xmm3, %xmm3, %xmm0
 # CHECK-NEXT: 1.     3     1.0    1.0    0.0       vpcmpeqw    %xmm1, %xmm1, %xmm2
 # CHECK-NEXT: 2.     3     1.0    1.0    0.0       vpcmpeqd    %xmm2, %xmm2, %xmm3
 # CHECK-NEXT: 3.     3     1.0    1.0    0.0       vpcmpeqq    %xmm3, %xmm3, %xmm0
+# CHECK-NEXT:        3     1.0    1.0    0.0       <total>
index ef6faa58eba43c5af1f4b4222b5c419f23cb26e3..014062abed383662df30393aeaeabe1a4777054d 100644 (file)
@@ -91,3 +91,4 @@ vpcmpgtq %xmm3, %xmm3, %xmm0
 # CHECK-NEXT: 1.     3     0.0    0.0    0.0       vpcmpgtw    %xmm1, %xmm1, %xmm2
 # CHECK-NEXT: 2.     3     0.0    0.0    0.0       vpcmpgtd    %xmm2, %xmm2, %xmm3
 # CHECK-NEXT: 3.     3     0.0    0.0    0.0       vpcmpgtq    %xmm3, %xmm3, %xmm0
+# CHECK-NEXT:        3     0.0    0.0    0.0       <total>
index b2bd7169c51801d8b27bba380f255be55fa290c5..6466998763c25c9306eb260a1472d55d1ba992fd 100644 (file)
@@ -76,3 +76,4 @@ sbb %eax, %eax
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     3     2.0    0.3    0.0       sbbl        %edx, %edx
 # CHECK-NEXT: 1.     3     3.0    0.0    0.0       sbbl        %eax, %eax
+# CHECK-NEXT:        3     2.5    0.2    0.0       <total>
index 6adf58fccd3ea08eb4c457b13ac9811476a2a286..69179506e4741473b9db6383f966e529bb8c67b7 100644 (file)
@@ -84,3 +84,4 @@ sbb %eax, %eax
 # CHECK-NEXT: 0.     3     2.3    1.0    0.0       imull       %edx, %eax
 # CHECK-NEXT: 1.     3     1.3    1.0    2.7       addl        %edx, %edx
 # CHECK-NEXT: 2.     3     1.7    0.0    2.7       sbbl        %eax, %eax
+# CHECK-NEXT:        3     1.8    0.7    1.8       <total>
index ca69339467d8cd152e1a985d24e4a53ca3426cd3..586aa73b15ab1e16f95eedb78dd27bb1cda20827 100644 (file)
@@ -99,3 +99,4 @@ vpaddd %xmm0, %xmm0, %xmm3
 # CHECK-NEXT: 0.     10    8.0    0.1    0.0       vpmuldq     %xmm0, %xmm0, %xmm1
 # CHECK-NEXT: 1.     10    9.5    0.0    0.0       vpaddd      %xmm1, %xmm1, %xmm0
 # CHECK-NEXT: 2.     10    10.0   0.0    0.0       vpaddd      %xmm0, %xmm0, %xmm3
+# CHECK-NEXT:        10    9.2    0.0    0.0       <total>
index a43b8285a5186b5f83ed5fee1aec34c128a16941..fdfbf311b1a22431a1d04ce6c8ce68651d0baa45 100644 (file)
@@ -78,3 +78,4 @@ vhaddps  %xmm3, %xmm3, %xmm4
 # CHECK-NEXT: 0.     3     1.0    1.0    4.7       vmulps      %xmm0, %xmm1, %xmm2
 # CHECK-NEXT: 1.     3     2.7    0.0    2.3       vhaddps     %xmm2, %xmm2, %xmm3
 # CHECK-NEXT: 2.     3     6.0    0.0    0.0       vhaddps     %xmm3, %xmm3, %xmm4
+# CHECK-NEXT:        3     3.2    0.3    2.3       <total>
index 197c1dce581513b7874383fbab48169c8d2fbcc2..ebf2739665620f1a7ebd41c6f37e7024f39bbcd2 100644 (file)
@@ -42,3 +42,4 @@ vhaddps (%rdi), %xmm1, %xmm2
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       vshufps     $0, %xmm0, %xmm1, %xmm1
 # CHECK-NEXT: 1.     1     1.0    0.0    0.0       vhaddps     (%rdi), %xmm1, %xmm2
+# CHECK-NEXT:        1     1.0    0.5    0.0       <total>
index e64ee28103f31467f8798afbcdd84ea88c25e9c2..7b9a1e601b7049c145050af132cf4d7be1d19185 100644 (file)
@@ -42,3 +42,4 @@ vhaddps (%rdi), %ymm1, %ymm2
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       vshufps     $0, %xmm0, %xmm1, %xmm1
 # CHECK-NEXT: 1.     1     1.0    1.0    0.0       vhaddps     (%rdi), %ymm1, %ymm2
+# CHECK-NEXT:        1     1.0    1.0    0.0       <total>
index 00c13f9ef59a9039d04361c3d829c927be5400d2..432b262c12198690e6065e99c677c8ed26ebd2df 100644 (file)
@@ -80,3 +80,4 @@ vpinsrb $1, %eax, %xmm0, %xmm0
 # CHECK-NEXT: 0.     3     1.0    1.0    3.3       addl        %eax, %eax
 # CHECK-NEXT: 1.     3     7.0    0.0    0.0       vpinsrb     $0, %eax, %xmm0, %xmm0
 # CHECK-NEXT: 2.     3     7.0    0.0    0.0       vpinsrb     $1, %eax, %xmm0, %xmm0
+# CHECK-NEXT:        3     5.0    0.3    1.1       <total>
index 2eee80e917eb3e49c49a09a24c9a663417a32c17..b5f32049553081c3870a85230df648e9ae4be003 100644 (file)
@@ -97,3 +97,4 @@ vmovaps %xmm0, 48(%rdi)
 # CHECK-NEXT: 5.     1     16.0   0.0    0.0       vmovaps     %xmm0, 32(%rdi)
 # CHECK-NEXT: 6.     1     16.0   0.0    0.0       vmovaps     48(%rsi), %xmm0
 # CHECK-NEXT: 7.     1     21.0   0.0    0.0       vmovaps     %xmm0, 48(%rdi)
+# CHECK-NEXT:        1     11.0   0.1    0.0       <total>
index 8cdba9acc6cb4480a9f30347e69382585492b9b3..6d175868406075cbd60778db3c7720581a6e8f59 100644 (file)
@@ -97,3 +97,4 @@ vmovaps %xmm0, 48(%rdi)
 # CHECK-NEXT: 5.     1     6.0    0.0    0.0       vmovaps     %xmm0, 32(%rdi)
 # CHECK-NEXT: 6.     1     1.0    1.0    0.0       vmovaps     48(%rsi), %xmm0
 # CHECK-NEXT: 7.     1     6.0    0.0    0.0       vmovaps     %xmm0, 48(%rdi)
+# CHECK-NEXT:        1     3.5    0.5    0.0       <total>
index c45e86ab1eb083a47d208c8e99596895dc2c68e8..3377e92253b16138853a2c487be5725632eeadcf 100644 (file)
@@ -156,3 +156,4 @@ vpcmpeqw  %xmm3, %xmm3, %xmm5
 # CHECK-NEXT: 12.    1     1.0    1.0    0.0       vpcmpeqd    %xmm3, %xmm3, %xmm5
 # CHECK-NEXT: 13.    1     1.0    1.0    0.0       vpcmpeqq    %xmm3, %xmm3, %xmm5
 # CHECK-NEXT: 14.    1     1.0    1.0    0.0       vpcmpeqw    %xmm3, %xmm3, %xmm5
+# CHECK-NEXT:        1     1.0    1.0    0.0       <total>
index 66e452665c399418bfca5d3c2a15966b607d0549..722e37a70831cf528fc6d60da343e912013d1e0c 100644 (file)
@@ -46,3 +46,4 @@ add    %ecx, %ebx
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       imulq       %rax, %rbx
 # CHECK-NEXT: 1.     1     7.0    0.0    0.0       lzcntw      %ax, %bx
 # CHECK-NEXT: 2.     1     7.0    0.0    0.0       addl        %ecx, %ebx
+# CHECK-NEXT:        1     5.0    0.3    0.0       <total>
index f5ad0be561053e410c343f6c0f6d5c3ff60172a9..9e824acab71427804ec7c9a321db4760850f65e7 100644 (file)
@@ -83,3 +83,4 @@ xor %bx, %dx
 # CHECK-NEXT: 0.     3     2.7    0.3    0.0       addw        %cx, %dx
 # CHECK-NEXT: 1.     3     3.3    0.0    0.0       movw        %ax, %dx
 # CHECK-NEXT: 2.     3     3.7    0.0    0.0       xorw        %bx, %dx
+# CHECK-NEXT:        3     3.2    0.1    0.0       <total>
index 4c839d52e7c1d2999a6df739feda0aff99cd807a..bdd6d341166fd29553888c48c9d0040040d51f80 100644 (file)
@@ -83,3 +83,4 @@ add %cx, %bx
 # CHECK-NEXT: 0.     3     4.7    0.3    0.0       imulw       %ax, %bx
 # CHECK-NEXT: 1.     3     7.3    0.0    0.0       lzcntw      %ax, %bx
 # CHECK-NEXT: 2.     3     7.7    0.0    0.0       addw        %cx, %bx
+# CHECK-NEXT:        3     6.6    0.1    0.0       <total>
index 1714dc7725b3fbd98dc4367c54f396ec079199cd..7ca046be68e38f68508effa376e22c95f8fe341d 100644 (file)
@@ -84,3 +84,4 @@ lzcnt 2(%rsp), %cx
 # CHECK-NEXT: 0.     3     4.7    0.3    0.0       imull       %edx, %ecx
 # CHECK-NEXT: 1.     3     4.3    0.0    0.0       lzcntw      (%rsp), %cx
 # CHECK-NEXT: 2.     3     4.7    0.0    0.0       lzcntw      2(%rsp), %cx
+# CHECK-NEXT:        3     4.6    0.1    0.0       <total>
index f3991dccaa6f0c05873206f2e36f3bcb7ec0337b..0cd064bcb872e22e6ff52877e8ffd8d4732ea380 100644 (file)
@@ -102,3 +102,4 @@ cmpl $1025, %eax
 # CHECK-NEXT: 2.     5     6.2    0.0    0.8       shll        $2, %eax
 # CHECK-NEXT: 3.     5     6.8    0.0    0.0       imull       %ecx, %eax
 # CHECK-NEXT: 4.     5     9.2    0.0    0.0       cmpl        $1025, %eax
+# CHECK-NEXT:        5     7.0    0.1    0.3       <total>
index c7ec67d94ccb7e141dc1801dc63698d5a3a1e097..c44ca83efb7fef691670479dae139029d1f199e7 100644 (file)
@@ -45,3 +45,4 @@ add  %ecx, %ebx
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       imulw       %ax, %cx
 # CHECK-NEXT: 1.     1     4.0    0.0    0.0       addb        %al, %cl
 # CHECK-NEXT: 2.     1     4.0    0.0    0.0       addl        %ecx, %ebx
+# CHECK-NEXT:        1     3.0    0.3    0.0       <total>
index 6bf375be02b619f26975b41e09c115ae1cb754c8..41f014fa09e473575dde508a7838c3c41cd12092 100644 (file)
@@ -109,3 +109,4 @@ vsqrtps     %ymm0, %ymm2
 # CHECK-NEXT: 5.     2     29.5   29.5   0.0       vsqrtps     %xmm0, %xmm2
 # CHECK-NEXT: 6.     2     1.0    1.0    45.5      vaddps      %ymm0, %ymm1, %ymm2
 # CHECK-NEXT: 7.     2     48.5   48.5   0.0       vsqrtps     %ymm0, %ymm2
+# CHECK-NEXT:        2     10.5   10.5   23.7      <total>
index 4cce5c85e95e0d9bbef25b25b68c970625f517b9..ee31bf4b8b18d10c543a9012a243041d7475e0ac 100644 (file)
@@ -42,3 +42,4 @@ stmxcsr (%rsp)
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     2     51.0   0.5    0.0       int3
 # CHECK-NEXT: 1.     2     151.0  0.0    0.0       stmxcsr     (%rsp)
+# CHECK-NEXT:        2     101.0  0.3    0.0       <total>
index 380f8ccecb9ba4b32f048f2e5fdfc86c9d0a0269..9962ca41021d8c48d20399341da2a8bf054de1b8 100644 (file)
@@ -113,3 +113,4 @@ add %ebx, %eax
 # CHECK-NEXT: 5.     3     2.0    0.0    0.0       addl        %edx, %esi
 # CHECK-NEXT: 6.     3     2.0    0.0    0.0       addl        %ebx, %eax
 # CHECK-NEXT: 7.     3     3.0    0.0    0.0       addl        %ebx, %eax
+# CHECK-NEXT:        3     2.1    0.2    0.0       <total>
index 3896967c5858f7df2224190bf6e9e3aa5ee349e1..f61bce125f588338b76903d7e4dfafc8d86fbd11 100644 (file)
@@ -45,3 +45,4 @@ vmulps  (%rdi), %xmm1, %xmm2
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       vaddps      %xmm0, %xmm0, %xmm1
 # CHECK-NEXT: 1.     1     1.0    0.0    0.0       vmulps      (%rdi), %xmm1, %xmm2
+# CHECK-NEXT:        1     1.0    0.5    0.0       <total>
index 5e199a1018e0a38e879f1bc6474c9b899761619c..8b922644b73262a4c73f2fdca6600c7c2802cca4 100644 (file)
@@ -45,3 +45,4 @@
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       imull       %esi
 # CHECK-NEXT: 1.     1     2.0    2.0    0.0       imull       (%rdi)
+# CHECK-NEXT:        1     1.5    1.5    0.0       <total>
index ef8d50aab1ed79be685e48bdf1756f21bcd344e9..6a4bad2aa7f47d74edfee14f49dcc4df21dbbaf7 100644 (file)
@@ -45,3 +45,4 @@
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       addq        %rdi, %rsi
 # CHECK-NEXT: 1.     1     1.0    0.0    0.0       addq        (%rsp), %rsi
 # CHECK-NEXT: 2.     1     2.0    2.0    2.0       addq        %rdx, %r8
+# CHECK-NEXT:        1     1.3    1.0    0.7       <total>
index 0c27d2cdac3d743f029339cf8ef1deb9a8c6f54e..4788f8c46aa785a2375ebaffe5ae5c25c08ff6dc 100644 (file)
@@ -98,3 +98,4 @@ vaddps %xmm1, %xmm1, %xmm2
 # CHECK-NEXT: 0.     3     0.0    0.0    2.7       vxorps      %xmm0, %xmm0, %xmm0
 # CHECK-NEXT: 1.     3     0.0    0.0    2.7       vmovaps     %xmm0, %xmm1
 # CHECK-NEXT: 2.     3     1.0    1.0    0.0       vaddps      %xmm1, %xmm1, %xmm2
+# CHECK-NEXT:        3     0.3    0.3    1.8       <total>
index 08465f907eec043b32aab6a1c206eb2edd7200e0..2182118a712acbdf89059696928c3e5d3daff092 100644 (file)
@@ -139,3 +139,4 @@ movdqu %xmm5, %xmm0
 # CHECK-NEXT: 6.     3     0.0    0.0    0.0       movupd      %xmm3, %xmm4
 # CHECK-NEXT: 7.     3     0.0    0.0    0.0       movdqa      %xmm4, %xmm5
 # CHECK-NEXT: 8.     3     0.0    0.0    0.0       movdqu      %xmm5, %xmm0
+# CHECK-NEXT:        3     0.0    0.0    0.0       <total>
index f3d850fc90aa3ff88787d7738c696442a24482a5..0d2f2160d3ecc35520a47602f4019e5af8b21547 100644 (file)
@@ -124,3 +124,4 @@ vmovdqu %xmm5, %xmm0
 # CHECK-NEXT: 4.     3     0.0    0.0    0.0       vmovupd     %xmm3, %xmm4
 # CHECK-NEXT: 5.     3     0.0    0.0    0.0       vmovdqa     %xmm4, %xmm5
 # CHECK-NEXT: 6.     3     0.0    0.0    0.0       vmovdqu     %xmm5, %xmm0
+# CHECK-NEXT:        3     0.0    0.0    0.0       <total>
index c2df1baf5c03c579ef901291f9eb89bcb86c7e70..d21b9815129da1472de9e9dc27a2ba3191f0eb9b 100644 (file)
@@ -109,3 +109,4 @@ mov %edx, %eax
 # CHECK-NEXT: 2.     3     0.0    0.0    0.0       movl        %ebx, %ecx
 # CHECK-NEXT: 3.     3     0.0    0.0    0.0       movl        %ecx, %edx
 # CHECK-NEXT: 4.     3     0.0    0.0    0.0       movl        %edx, %eax
+# CHECK-NEXT:        3     0.0    0.0    0.0       <total>
index 277293e429ba33032c48e414bc1060b2e3afeedc..f121087250cc8a323802ea86095407abe38f7661 100644 (file)
@@ -109,3 +109,4 @@ mov %rdx, %rax
 # CHECK-NEXT: 2.     3     0.0    0.0    0.0       movq        %rbx, %rcx
 # CHECK-NEXT: 3.     3     0.0    0.0    0.0       movq        %rcx, %rdx
 # CHECK-NEXT: 4.     3     0.0    0.0    0.0       movq        %rdx, %rax
+# CHECK-NEXT:        3     0.0    0.0    0.0       <total>
index d4800943b8bf1646f4d3341045c7f8aa519313a9..0b6c0231870908a909d2c2ddbc85400272063b68 100644 (file)
@@ -117,3 +117,4 @@ mov %esi, %ecx
 # CHECK-NEXT: 3.     3     2.0    0.0    0.0       addq        %rcx, %rcx
 # CHECK-NEXT: 4.     3     2.0    0.0    0.0       addq        %rcx, %rcx
 # CHECK-NEXT: 5.     3     0.0    0.0    3.0       movl        %esi, %ecx
+# CHECK-NEXT:        3     1.0    0.2    1.1       <total>
index 0319bd622e28c4ecba12b44e5ff6c4a7fb234c96..1492de0c7ff4af2d8216b94e4ba03b0ba2734c43 100644 (file)
@@ -90,3 +90,4 @@ vmulps %xmm0, %xmm0, %xmm0
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     5     9.0    0.2    0.0       vaddps      %xmm0, %xmm0, %xmm0
 # CHECK-NEXT: 1.     5     12.0   0.0    0.0       vmulps      %xmm0, %xmm0, %xmm0
+# CHECK-NEXT:        5     10.5   0.1    0.0       <total>
index 5f3fe1e6ccb3d67893c401d040a3d452910f96ab..ba33ba065ff068899f89042f1f5010ef83ff6bc5 100644 (file)
@@ -91,3 +91,4 @@ vmulps %xmm0, %xmm0, %xmm0
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     5     6.6    0.2    0.0       vaddps      %xmm0, %xmm0, %xmm0
 # CHECK-NEXT: 1.     5     7.8    0.0    0.0       vmulps      %xmm0, %xmm0, %xmm0
+# CHECK-NEXT:        5     7.2    0.1    0.0       <total>
index f676e77bf1ed30189015bb85c95c0b49185f5926..32101c718d53836cf1c48f6f6649b965926c9dba 100644 (file)
 # CHECK-NEXT: 30.    1     30.0   25.0   0.0       vaddps      %ymm3, %ymm0, %ymm4
 # CHECK-NEXT: 31.    1     31.0   27.0   0.0       vaddps      %ymm3, %ymm0, %ymm5
 # CHECK-NEXT: 32.    1     24.0   24.0   0.0       vaddps      %ymm3, %ymm0, %ymm6
+# CHECK-NEXT:        1     15.8   14.0   12.4      <total>
index f9fd2c3732a4ad324a258725c0d622c0476e31bf..f0a40ce9af011356ffb19451d13ddae0b50c2f11 100644 (file)
@@ -71,3 +71,4 @@ vbroadcastss (%rax), %ymm0
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     3     1.0    1.0    2.7       leaq        8(%rsp,%rdi,2), %rax
 # CHECK-NEXT: 1.     3     2.0    0.0    0.0       vbroadcastss        (%rax), %ymm0
+# CHECK-NEXT:        3     1.5    0.5    1.3       <total>
index 57f07e1e8a8159592cd6f8b767656589bf72894f..1c5c8cf2eb79e904302a13afbcba2febad4ee304 100644 (file)
@@ -41,3 +41,4 @@ vandps (%rdi), %xmm1, %xmm2
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       vaddps      %xmm0, %xmm0, %xmm1
 # CHECK-NEXT: 1.     1     1.0    0.0    0.0       vandps      (%rdi), %xmm1, %xmm2
+# CHECK-NEXT:        1     1.0    0.5    0.0       <total>
index 5650a8ba15c24beaaf74bb313621a22c6c92ca92..7e76fcc1df8c74ca767e3a99a030c2791f14c31e 100644 (file)
@@ -41,3 +41,4 @@ vandps (%rdi), %ymm1, %ymm2
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       vaddps      %ymm0, %ymm0, %ymm1
 # CHECK-NEXT: 1.     1     1.0    1.0    0.0       vandps      (%rdi), %ymm1, %ymm2
+# CHECK-NEXT:        1     1.0    1.0    0.0       <total>
index a3bb2cd52edcc47686fc64b15ad373d34badaa74..64b6490861c2af087859a0abff7151bba93f847f 100644 (file)
@@ -99,6 +99,7 @@ imul %ecx, %ecx
 # CHECK-NEXT: 2.     2     6.5    0.0    7.0       addl        %ecx, %ecx
 # CHECK-NEXT: 3.     2     6.5    0.0    4.0       imull       %ecx, %ecx
 # CHECK-NEXT: 4.     2     9.5    0.0    2.0       imull       %ecx, %ecx
+# CHECK-NEXT:        2     6.5    0.1    4.0       <total>
 
 # CHECK:      [1] Code Region
 
@@ -182,3 +183,4 @@ imul %ecx, %ecx
 # CHECK-NEXT: 2.     2     17.0   0.0    4.0       addl        %ecx, %ecx
 # CHECK-NEXT: 3.     2     17.0   0.0    1.0       imull       %ecx, %ecx
 # CHECK-NEXT: 4.     2     20.0   0.0    0.0       imull       %ecx, %ecx
+# CHECK-NEXT:        2     15.4   0.1    1.8       <total>
index 22edddaeef7bcfa3e0afa21b093da6e97add3289..2620fa871be53bf4ac12c9f87b765381c9ccce58 100644 (file)
@@ -87,3 +87,4 @@ imul %ecx, %ecx
 # CHECK-NEXT: 2.     2     17.0   0.0    4.0       addl        %ecx, %ecx
 # CHECK-NEXT: 3.     2     18.0   0.0    1.0       imull       %ecx, %ecx
 # CHECK-NEXT: 4.     2     20.0   0.0    0.0       imull       %ecx, %ecx
+# CHECK-NEXT:        2     15.8   0.1    1.8       <total>
index b1669f33405969c1b1668c314013b118a0dfee09..b5a8bb0521b3730b16b9776542725b19fed7b184 100644 (file)
@@ -111,6 +111,7 @@ vaddps  %ymm1, %ymm1, %ymm0
 # CHECK-NEXT: 0.     3     1.3    1.3    0.0       vaddps      %ymm0, %ymm0, %ymm1
 # CHECK-NEXT: 1.     3     1.0    1.0    1.3       vxorps      %ymm1, %ymm1, %ymm1
 # CHECK-NEXT: 2.     3     1.0    0.0    1.3       vblendps    $2, %ymm1, %ymm2, %ymm3
+# CHECK-NEXT:        3     1.1    0.8    0.9       <total>
 
 # CHECK:      [1] Code Region - ZERO-IDIOM-2
 
@@ -187,6 +188,7 @@ vaddps  %ymm1, %ymm1, %ymm0
 # CHECK-NEXT: 0.     3     1.3    1.3    0.0       vaddpd      %ymm0, %ymm0, %ymm1
 # CHECK-NEXT: 1.     3     1.0    1.0    1.3       vxorpd      %ymm1, %ymm1, %ymm1
 # CHECK-NEXT: 2.     3     1.0    0.0    1.3       vblendpd    $2, %ymm1, %ymm2, %ymm3
+# CHECK-NEXT:        3     1.1    0.8    0.9       <total>
 
 # CHECK:      [2] Code Region - ZERO-IDIOM-3
 
@@ -256,6 +258,7 @@ vaddps  %ymm1, %ymm1, %ymm0
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     3     1.0    1.0    0.0       vaddps      %ymm0, %ymm1, %ymm2
 # CHECK-NEXT: 1.     3     1.0    1.0    1.0       vandnps     %ymm2, %ymm2, %ymm3
+# CHECK-NEXT:        3     1.0    1.0    0.5       <total>
 
 # CHECK:      [3] Code Region - ZERO-IDIOM-4
 
@@ -325,6 +328,7 @@ vaddps  %ymm1, %ymm1, %ymm0
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     3     1.0    1.0    0.0       vaddps      %ymm0, %ymm1, %ymm2
 # CHECK-NEXT: 1.     3     1.0    1.0    1.0       vandnps     %ymm2, %ymm2, %ymm3
+# CHECK-NEXT:        3     1.0    1.0    0.5       <total>
 
 # CHECK:      [4] Code Region - ZERO-IDIOM-5
 
@@ -395,3 +399,4 @@ vaddps  %ymm1, %ymm1, %ymm0
 # CHECK:            [0]    [1]    [2]    [3]
 # CHECK-NEXT: 0.     3     1.0    1.0    0.7       vperm2f128  $136, %ymm0, %ymm0, %ymm1
 # CHECK-NEXT: 1.     3     1.0    0.0    0.0       vaddps      %ymm1, %ymm1, %ymm0
+# CHECK-NEXT:        3     1.0    0.5    0.3       <total>
index d9d6c90951a22837c02e344d3e5ccb4fd8d82515..eb41f7acc9589f1596a0623a955c33d834228153 100644 (file)
@@ -441,3 +441,4 @@ vpxor  %xmm3, %xmm3, %xmm5
 # CHECK-NEXT: 68.    1     0.0    0.0    0.0       vxorps      %xmm4, %xmm4, %xmm5
 # CHECK-NEXT: 69.    1     0.0    0.0    0.0       vxorpd      %xmm1, %xmm1, %xmm3
 # CHECK-NEXT: 70.    1     0.0    0.0    0.0       vpxor       %xmm3, %xmm3, %xmm5
+# CHECK-NEXT:        1     0.0    0.0    0.0       <total>
index 75dfe1f1753e1b4a7186e5ab10d1bcf0dfc38b8c..9930d08cf2e1f2dd78e8d9b617475e0417e63bcd 100644 (file)
@@ -87,3 +87,4 @@
 # CHECK-NEXT: 3.     2     8.5    0.0    6.0       vaddps      %xmm4, %xmm5, %xmm6
 # CHECK-NEXT: 4.     2     11.0   0.0    3.5       vmulps      %xmm6, %xmm3, %xmm4
 # CHECK-NEXT: 5.     2     16.0   0.0    2.0       vaddps      %xmm4, %xmm5, %xmm0
+# CHECK-NEXT:        2     8.3    0.3    5.0       <total>
index ce578c3ae7b93ef608f47c61caa988c7e0495417..de72dafda2fde3b2d6526ad5200254dec976babd 100644 (file)
@@ -87,3 +87,4 @@
 # CHECK-NEXT: 3.     2     8.5    0.0    6.0       vaddps      %xmm4, %xmm5, %xmm6
 # CHECK-NEXT: 4.     2     11.0   0.0    3.5       vmulps      %xmm6, %xmm3, %xmm4
 # CHECK-NEXT: 5.     2     16.0   0.0    2.0       vaddps      %xmm4, %xmm5, %xmm0
+# CHECK-NEXT:        2     8.3    0.3    5.0       <total>
index d0cf359379d47b85017b4cd19dc7038ef8360edd..5495b97b3367ff86a27d40f4aa3d600762c159f0 100644 (file)
@@ -87,3 +87,4 @@
 # CHECK-NEXT: 3.     2     8.5    0.0    6.0       vaddps      %xmm4, %xmm18, %xmm6
 # CHECK-NEXT: 4.     2     11.0   0.0    3.5       vmulps      %xmm6, %xmm19, %xmm4
 # CHECK-NEXT: 5.     2     16.0   0.0    2.0       vaddps      %xmm4, %xmm20, %xmm0
+# CHECK-NEXT:        2     8.3    0.3    5.0       <total>
index d7d99861cfb02417114d12f16dc59d48ba7e5627..2a9ef74569f2b905b57d4aeb58ae13614f1f7a91 100644 (file)
@@ -87,3 +87,4 @@
 # CHECK-NEXT: 3.     2     8.5    0.0    6.0       vaddps      %ymm4, %ymm5, %ymm6
 # CHECK-NEXT: 4.     2     11.0   0.0    3.5       vmulps      %ymm6, %ymm3, %ymm4
 # CHECK-NEXT: 5.     2     16.0   0.0    2.0       vaddps      %ymm4, %ymm5, %ymm0
+# CHECK-NEXT:        2     8.3    0.3    5.0       <total>
index a32bbc6fb0e89aa8631fecaaaab4d287f176e11a..915499f4184889b649131530a9c3ee99a8b7499c 100644 (file)
@@ -87,3 +87,4 @@
 # CHECK-NEXT: 3.     2     6.5    0.0    6.0       vaddps      %ymm4, %ymm5, %ymm6
 # CHECK-NEXT: 4.     2     9.0    0.0    3.5       vmulps      %ymm6, %ymm3, %ymm4
 # CHECK-NEXT: 5.     2     14.0   0.0    2.0       vaddps      %ymm4, %ymm5, %ymm0
+# CHECK-NEXT:        2     6.8    0.3    5.2       <total>
index 90592655067f8b2750d29e5923d50f71fbd1929b..b7e47894fd9cf09370423e0b8609c98d91d18b00 100644 (file)
@@ -490,3 +490,4 @@ vpxor  %ymm3, %ymm3, %ymm5
 # CHECK-NEXT: 80.    1     0.0    0.0    3.0       vxorpd      %ymm1, %ymm1, %ymm3
 # CHECK-NEXT: 81.    1     0.0    0.0    3.0       vpxor       %xmm3, %xmm3, %xmm5
 # CHECK-NEXT: 82.    1     0.0    0.0    3.0       vpxor       %ymm3, %ymm3, %ymm5
+# CHECK-NEXT:        1     0.8    0.2    1.6       <total>
index d100946031d12e8196c0fc8a143362b39d888a2c..1a1e83070def3e674f715904e0423617199f3593 100644 (file)
@@ -386,3 +386,4 @@ vpxor  %xmm3, %xmm3, %xmm5
 # CHECK-NEXT: 60.    1     0.0    0.0    10.0      vxorps      %ymm4, %ymm4, %ymm5
 # CHECK-NEXT: 61.    1     0.0    0.0    10.0      vxorpd      %ymm1, %ymm1, %ymm3
 # CHECK-NEXT: 62.    1     0.0    0.0    10.0      vpxor       %xmm3, %xmm3, %xmm5
+# CHECK-NEXT:        1     2.1    0.3    8.7       <total>
index 093d418b21dbf3b4bad45726a7020173e4770f34..a8d608cdd392f72ea1f428f11f1a0a6a0f4c08e3 100644 (file)
@@ -490,3 +490,4 @@ vpxor  %ymm3, %ymm3, %ymm5
 # CHECK-NEXT: 80.    1     0.0    0.0    2.0       vxorpd      %ymm1, %ymm1, %ymm3
 # CHECK-NEXT: 81.    1     0.0    0.0    2.0       vpxor       %xmm3, %xmm3, %xmm5
 # CHECK-NEXT: 82.    1     0.0    0.0    2.0       vpxor       %ymm3, %ymm3, %ymm5
+# CHECK-NEXT:        1     0.6    0.2    1.5       <total>
index d4f5445e1fb65f75fabf4c9c1562abd9a23de1ef..13c9293d4260aa6fb8a33de242152f618e67ef84 100644 (file)
@@ -776,3 +776,4 @@ vpxorq  %zmm19, %zmm19, %zmm21
 # CHECK-NEXT: 136.   1     1.0    0.0    2.0       vpxorq      %ymm19, %ymm19, %ymm21
 # CHECK-NEXT: 137.   1     1.0    0.0    2.0       vpxord      %zmm19, %zmm19, %zmm21
 # CHECK-NEXT: 138.   1     0.0    0.0    2.0       vpxorq      %zmm19, %zmm19, %zmm21
+# CHECK-NEXT:        1     1.1    0.2    1.8       <total>
index 019f84fe542caa1b3098ce39a74562065cad813d..b921b17dea7e43eec4f8664d2741aa3466fafc95 100644 (file)
@@ -45,3 +45,4 @@ add    %ecx, %ebx
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       imulq       %rax, %rbx
 # CHECK-NEXT: 1.     1     4.0    0.0    0.0       lzcntw      %ax, %bx
 # CHECK-NEXT: 2.     1     6.0    0.0    0.0       addl        %ecx, %ebx
+# CHECK-NEXT:        1     3.7    0.3    0.0       <total>
index abe923b5906b0b1435d6303bbf243704ed392dcf..d8afbacdee79a5cb60c25ef11b65eaa8ca2cbd8c 100644 (file)
@@ -88,3 +88,4 @@ xor %bx, %dx
 # CHECK-NEXT: 0.     6     7.0    0.2    0.0       addw        %cx, %dx
 # CHECK-NEXT: 1.     6     7.7    0.0    0.0       movw        %ax, %dx
 # CHECK-NEXT: 2.     6     8.5    0.0    0.0       xorw        %bx, %dx
+# CHECK-NEXT:        6     7.7    0.1    0.0       <total>
index 8202a6057c8c8258c71019990d06d5ab13b84dee..8eb2f503fdb04cf030acf33a5e2eb49f83b57c24 100644 (file)
@@ -91,3 +91,4 @@ add %cx, %bx
 # CHECK-NEXT: 0.     7     14.1   0.1    0.0       imulw       %ax, %bx
 # CHECK-NEXT: 1.     7     15.9   0.0    0.0       lzcntw      %ax, %bx
 # CHECK-NEXT: 2.     7     17.6   0.0    0.0       addw        %cx, %bx
+# CHECK-NEXT:        7     15.9   0.0    0.0       <total>
index 69637932c31f479ed00b7418ec072a41ce4ac3b6..20fee19b54790137f4073dda1b87fb4d25837f07 100644 (file)
@@ -84,3 +84,4 @@ lzcnt 2(%rsp), %cx
 # CHECK-NEXT: 0.     4     9.5    0.3    0.0       imull       %edx, %ecx
 # CHECK-NEXT: 1.     4     9.0    0.0    0.0       lzcntw      (%rsp), %cx
 # CHECK-NEXT: 2.     4     9.5    0.0    0.0       lzcntw      2(%rsp), %cx
+# CHECK-NEXT:        4     9.3    0.1    0.0       <total>
index a7e3860e14537f5346af19f759291956d6a78e84..f3d0321b4541489ef13e551c69c9582114e08d70 100644 (file)
@@ -49,3 +49,4 @@ addq  %rcx, %rdx
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       imulq       %rax, %rcx
 # CHECK-NEXT: 1.     1     5.0    0.0    0.0       addl        %edx, %ecx
 # CHECK-NEXT: 2.     1     6.0    0.0    0.0       addq        %rcx, %rdx
+# CHECK-NEXT:        1     4.0    0.3    0.0       <total>
index f7a85399e5e8ccc16f84915933f1b63c29fe9da0..e2da41b06967c4663991046e721adc72af60c8d5 100644 (file)
@@ -45,3 +45,4 @@ add  %ecx, %ebx
 # CHECK-NEXT: 0.     1     1.0    1.0    0.0       imulw       %ax, %cx
 # CHECK-NEXT: 1.     1     4.0    0.0    0.0       addb        %al, %cl
 # CHECK-NEXT: 2.     1     5.0    0.0    0.0       addl        %ecx, %ebx
+# CHECK-NEXT:        1     3.3    0.3    0.0       <total>
index d9f1c9522db48c9825ead621b23653ac91b35ea7..819d67d8464bf0e02d995c60b25fce26ecd3025f 100644 (file)
@@ -124,3 +124,4 @@ bextrl      %esi, (%rdi), %eax
 # ALL:                [0]    [1]    [2]    [3]
 # ALL-NEXT:     0.     1     1.0    1.0    0.0       addl      %edi, %esi
 # ALL-NEXT:     1.     1     1.0    0.0    0.0       bextrl    %esi, (%rdi), %eax
+# ALL-NEXT:            1     1.0    0.5    0.0       <total>
index fe3ba3a6ec5619decaddb8f4bff90c38d173d7b4..5ec7c47fed3e9af5d9a15ddbcdc2e5f968b7a7f4 100644 (file)
@@ -81,3 +81,4 @@ bzhil %esi, (%rdi), %eax
 # ALL:                [0]    [1]    [2]    [3]
 # ALL-NEXT:     0.     1     1.0    1.0    0.0       addl      %edi, %esi
 # ALL-NEXT:     1.     1     1.0    0.0    0.0       bzhil     %esi, (%rdi), %eax
+# ALL-NEXT:            1     1.0    0.5    0.0       <total>
index 75c77f8f8c4b4b4f61c44ffb97a57664629720d7..d0efd71f6c35b8ecdf9b90533a481d6353de240e 100644 (file)
@@ -75,3 +75,4 @@ vfmadd213ps (%rdi), %xmm1, %xmm2
 # ALL:                [0]    [1]    [2]    [3]
 # ALL-NEXT:     0.     1     1.0    1.0    0.0       vaddps    %xmm0, %xmm0, %xmm1
 # ALL-NEXT:     1.     1     1.0    0.0    0.0       vfmadd213ps       (%rdi), %xmm1, %xmm2
+# ALL-NEXT:            1     1.0    0.5    0.0       <total>
index 96d3ba613c5fcb2126cc935e11064ea6f53c8be6..b9ff4a47e8c9811ecadc257035949891aa50abf5 100644 (file)
@@ -75,3 +75,4 @@ vfmadd213ps (%rdi), %xmm1, %xmm2
 # ALL:                [0]    [1]    [2]    [3]
 # ALL-NEXT:     0.     1     1.0    1.0    0.0       vaddps    %xmm0, %xmm0, %xmm2
 # ALL-NEXT:     1.     1     1.0    0.0    0.0       vfmadd213ps       (%rdi), %xmm1, %xmm2
+# ALL-NEXT:            1     1.0    0.5    0.0       <total>
index f3a88431aa00992ca32c6f51edc7595294d8a13c..63504dd91995d5f2a422b877db22805b66416aae 100644 (file)
@@ -138,10 +138,25 @@ vaddps  (%rax), %xmm1, %xmm1
 # ALL-NEXT:       0.     1     1.0    1.0    0.0       vdivps  %xmm0, %xmm1, %xmm1
 
 # BARCELONA-NEXT: 1.     1     9.0    0.0    0.0       vaddps  (%rax), %xmm1, %xmm1
+# BARCELONA-NEXT:        1     5.0    0.5    0.0       <total>
+
 # BDVER2-NEXT:    1.     1     5.0    0.0    0.0       vaddps  (%rax), %xmm1, %xmm1
+# BDVER2-NEXT:           1     3.0    0.5    0.0       <total>
+
 # BDWELL-NEXT:    1.     1     7.0    0.0    0.0       vaddps  (%rax), %xmm1, %xmm1
+# BDWELL-NEXT:           1     4.0    0.5    0.0       <total>
+
 # BTVER2-NEXT:    1.     1     15.0   0.0    0.0       vaddps  (%rax), %xmm1, %xmm1
+# BTVER2-NEXT:           1     8.0    0.5    0.0       <total>
+
 # HASWELL-NEXT:   1.     1     8.0    0.0    0.0       vaddps  (%rax), %xmm1, %xmm1
+# HASWELL-NEXT:          1     4.5    0.5    0.0       <total>
+
 # SANDY-NEXT:     1.     1     9.0    0.0    0.0       vaddps  (%rax), %xmm1, %xmm1
+# SANDY-NEXT:            1     5.0    0.5    0.0       <total>
+
 # SKYLAKE-NEXT:   1.     1     6.0    0.0    0.0       vaddps  (%rax), %xmm1, %xmm1
+# SKYLAKE-NEXT:          1     3.5    0.5    0.0       <total>
+
 # ZNVER1-NEXT:    1.     1     8.0    0.0    0.0       vaddps  (%rax), %xmm1, %xmm1
+# ZNVER1-NEXT:           1     4.5    0.5    0.0       <total>
index 7d549b395957236ff95d1d31c0e080ed4b3c0c6e..63680b86170e100cbcc5f4dfda3090039af701da 100644 (file)
@@ -244,12 +244,16 @@ cmp     %edi, %edx
 
 # BDWELL-NEXT:  2.     10    1.0    0.4    5.7       addq      $32, %r8
 # BDWELL-NEXT:  3.     10    1.0    0.0    5.3       cmpl      %edi, %edx
+# BDWELL-NEXT:         10    1.0    0.2    3.9       <total>
 
 # HASWELL-NEXT: 2.     10    1.0    0.4    6.7       addq      $32, %r8
 # HASWELL-NEXT: 3.     10    1.0    0.0    6.3       cmpl      %edi, %edx
+# HASWELL-NEXT:        10    1.0    0.2    4.6       <total>
 
 # SKYLAKE-NEXT: 2.     10    1.0    0.1    7.0       addq      $32, %r8
 # SKYLAKE-NEXT: 3.     10    2.0    0.0    6.0       cmpl      %edi, %edx
+# SKYLAKE-NEXT:        10    1.5    0.1    4.6       <total>
 
 # ZNVER1-NEXT:  2.     10    1.0    0.1    7.0       addq      $32, %r8
 # ZNVER1-NEXT:  3.     10    2.0    0.0    6.0       cmpl      %edi, %edx
+# ZNVER1-NEXT:         10    1.3    0.1    4.6       <total>
index 315156df62cd4e1ad800f726aaa642e97accad20..f32b7d2734dd16839da3b73df7d0ad34ef15b6c5 100644 (file)
@@ -48,3 +48,4 @@ addl    (%rdi), %esi
 # ALL:                [0]    [1]    [2]    [3]
 # ALL-NEXT:     0.     1     1.0    1.0    0.0       addl      %edi, %esi
 # ALL-NEXT:     1.     1     1.0    0.0    0.0       addl      (%rdi), %esi
+# ALL-NEXT:            1     1.0    0.5    0.0       <total>
index a4b3f561e5d271cc9ac3987b6df54d1dc40f78aa..293440fce87531fe89e6f14c57324900727ea684 100644 (file)
@@ -83,12 +83,25 @@ rcpss (%rax), %xmm1
 # ALL-NEXT:       0.     1     1.0    1.0    0.0       leaq    8(%rsp,%rdi,2), %rax
 
 # BARCELONA-NEXT: 1.     1     2.0    0.0    0.0       sqrtss  (%rax), %xmm1
+# BARCELONA-NEXT:        1     1.5    0.5    0.0       <total>
+
 # BDVER2-NEXT:    1.     1     2.0    0.0    0.0       sqrtss  (%rax), %xmm1
+# BDVER2-NEXT:           1     1.5    0.5    0.0       <total>
+
 # BROADWELL-NEXT: 1.     1     2.0    0.0    0.0       sqrtss  (%rax), %xmm1
+# BROADWELL-NEXT:        1     1.5    0.5    0.0       <total>
+
 # BTVER2-NEXT:    1.     1     3.0    0.0    0.0       sqrtss  (%rax), %xmm1
+# BTVER2-NEXT:           1     2.0    0.5    0.0       <total>
+
 # HASWELL-NEXT:   1.     1     2.0    0.0    0.0       sqrtss  (%rax), %xmm1
+# HASWELL-NEXT:          1     1.5    0.5    0.0       <total>
+
 # SKYLAKE-NEXT:   1.     1     2.0    0.0    0.0       sqrtss  (%rax), %xmm1
+# SKYLAKE-NEXT:          1     1.5    0.5    0.0       <total>
+
 # ZNVER1-NEXT:    1.     1     2.0    0.0    0.0       sqrtss  (%rax), %xmm1
+# ZNVER1-NEXT:           1     1.5    0.5    0.0       <total>
 
 # ALL:            [1] Code Region - test_sqrtsd
 
@@ -146,12 +159,25 @@ rcpss (%rax), %xmm1
 # ALL-NEXT:       0.     1     1.0    1.0    0.0       leaq    8(%rsp,%rdi,2), %rax
 
 # BARCELONA-NEXT: 1.     1     2.0    0.0    0.0       sqrtsd  (%rax), %xmm1
+# BARCELONA-NEXT:        1     1.5    0.5    0.0       <total>
+
 # BDVER2-NEXT:    1.     1     2.0    0.0    0.0       sqrtsd  (%rax), %xmm1
+# BDVER2-NEXT:           1     1.5    0.5    0.0       <total>
+
 # BROADWELL-NEXT: 1.     1     2.0    0.0    0.0       sqrtsd  (%rax), %xmm1
+# BROADWELL-NEXT:        1     1.5    0.5    0.0       <total>
+
 # BTVER2-NEXT:    1.     1     3.0    0.0    0.0       sqrtsd  (%rax), %xmm1
+# BTVER2-NEXT:           1     2.0    0.5    0.0       <total>
+
 # HASWELL-NEXT:   1.     1     2.0    0.0    0.0       sqrtsd  (%rax), %xmm1
+# HASWELL-NEXT:          1     1.5    0.5    0.0       <total>
+
 # SKYLAKE-NEXT:   1.     1     2.0    0.0    0.0       sqrtsd  (%rax), %xmm1
+# SKYLAKE-NEXT:          1     1.5    0.5    0.0       <total>
+
 # ZNVER1-NEXT:    1.     1     2.0    0.0    0.0       sqrtsd  (%rax), %xmm1
+# ZNVER1-NEXT:           1     1.5    0.5    0.0       <total>
 
 # ALL:            [2] Code Region - test_rsqrtss
 
@@ -198,12 +224,25 @@ rcpss (%rax), %xmm1
 # ALL-NEXT:       0.     1     1.0    1.0    0.0       leaq    8(%rsp,%rdi,2), %rax
 
 # BARCELONA-NEXT: 1.     1     2.0    0.0    0.0       rsqrtss (%rax), %xmm1
+# BARCELONA-NEXT:        1     1.5    0.5    0.0       <total>
+
 # BDVER2-NEXT:    1.     1     2.0    0.0    0.0       rsqrtss (%rax), %xmm1
+# BDVER2-NEXT:           1     1.5    0.5    0.0       <total>
+
 # BROADWELL-NEXT: 1.     1     2.0    0.0    0.0       rsqrtss (%rax), %xmm1
+# BROADWELL-NEXT:        1     1.5    0.5    0.0       <total>
+
 # BTVER2-NEXT:    1.     1     3.0    0.0    0.0       rsqrtss (%rax), %xmm1
+# BTVER2-NEXT:           1     2.0    0.5    0.0       <total>
+
 # HASWELL-NEXT:   1.     1     2.0    0.0    0.0       rsqrtss (%rax), %xmm1
+# HASWELL-NEXT:          1     1.5    0.5    0.0       <total>
+
 # SKYLAKE-NEXT:   1.     1     2.0    0.0    0.0       rsqrtss (%rax), %xmm1
+# SKYLAKE-NEXT:          1     1.5    0.5    0.0       <total>
+
 # ZNVER1-NEXT:    1.     1     2.0    0.0    0.0       rsqrtss (%rax), %xmm1
+# ZNVER1-NEXT:           1     1.5    0.5    0.0       <total>
 
 # ALL:            [3] Code Region - test_rcp
 
@@ -250,9 +289,22 @@ rcpss (%rax), %xmm1
 # ALL-NEXT:       0.     1     1.0    1.0    0.0       leaq    8(%rsp,%rdi,2), %rax
 
 # BARCELONA-NEXT: 1.     1     2.0    0.0    0.0       rcpss   (%rax), %xmm1
+# BARCELONA-NEXT:        1     1.5    0.5    0.0       <total>
+
 # BDVER2-NEXT:    1.     1     2.0    0.0    0.0       rcpss   (%rax), %xmm1
+# BDVER2-NEXT:           1     1.5    0.5    0.0       <total>
+
 # BROADWELL-NEXT: 1.     1     2.0    0.0    0.0       rcpss   (%rax), %xmm1
+# BROADWELL-NEXT:        1     1.5    0.5    0.0       <total>
+
 # BTVER2-NEXT:    1.     1     3.0    0.0    0.0       rcpss   (%rax), %xmm1
+# BTVER2-NEXT:           1     2.0    0.5    0.0       <total>
+
 # HASWELL-NEXT:   1.     1     2.0    0.0    0.0       rcpss   (%rax), %xmm1
+# HASWELL-NEXT:          1     1.5    0.5    0.0       <total>
+
 # SKYLAKE-NEXT:   1.     1     2.0    0.0    0.0       rcpss   (%rax), %xmm1
+# SKYLAKE-NEXT:          1     1.5    0.5    0.0       <total>
+
 # ZNVER1-NEXT:    1.     1     2.0    0.0    0.0       rcpss   (%rax), %xmm1
+# ZNVER1-NEXT:           1     1.5    0.5    0.0       <total>
index 2acd8103931201018b4d5d2395fb5439adc0630c..1069e71d038ec208e86c13ee9e12e057b4b6b81b 100644 (file)
@@ -149,10 +149,25 @@ vblendvps %xmm1, (%rdi), %xmm2, %xmm3
 # ALL-NEXT:     0.     1     1.0    1.0    0.0       vaddps    %xmm0, %xmm0, %xmm1
 
 # BDVER2-NEXT:  1.     1     1.0    0.0    0.0       vblendvps %xmm1, (%rdi), %xmm2, %xmm3
+# BDVER2-NEXT:         1     1.0    0.5    0.0       <total>
+
 # BDWELL-NEXT:  1.     1     1.0    0.0    0.0       vblendvps %xmm1, (%rdi), %xmm2, %xmm3
+# BDWELL-NEXT:         1     1.0    0.5    0.0       <total>
+
 # BTVER2-NEXT:  1.     1     1.0    1.0    0.0       vblendvps %xmm1, (%rdi), %xmm2, %xmm3
+# BTVER2-NEXT:         1     1.0    1.0    0.0       <total>
+
 # HASWELL-NEXT: 1.     1     1.0    0.0    0.0       vblendvps %xmm1, (%rdi), %xmm2, %xmm3
+# HASWELL-NEXT:        1     1.0    0.5    0.0       <total>
+
 # IVY-NEXT:     1.     1     1.0    0.0    0.0       vblendvps %xmm1, (%rdi), %xmm2, %xmm3
+# IVY-NEXT:            1     1.0    0.5    0.0       <total>
+
 # SANDY-NEXT:   1.     1     1.0    0.0    0.0       vblendvps %xmm1, (%rdi), %xmm2, %xmm3
+# SANDY-NEXT:          1     1.0    0.5    0.0       <total>
+
 # SKYLAKE-NEXT: 1.     1     1.0    0.0    0.0       vblendvps %xmm1, (%rdi), %xmm2, %xmm3
+# SKYLAKE-NEXT:        1     1.0    0.5    0.0       <total>
+
 # ZNVER1-NEXT:  1.     1     1.0    0.0    0.0       vblendvps %xmm1, (%rdi), %xmm2, %xmm3
+# ZNVER1-NEXT:         1     1.0    0.5    0.0       <total>
index 657deba83daa46d5cb3fd957d30694f5cbc81e75..f1c57476f181ff5cb9b76113593f39d8ef42012b 100644 (file)
@@ -149,10 +149,25 @@ vblendvps %xmm1, (%rdi), %xmm2, %xmm3
 # ALL-NEXT:     0.     1     1.0    1.0    0.0       vaddps    %xmm0, %xmm0, %xmm2
 
 # BDVER2-NEXT:  1.     1     1.0    0.0    0.0       vblendvps %xmm1, (%rdi), %xmm2, %xmm3
+# BDVER2-NEXT:         1     1.0    0.5    0.0       <total>
+
 # BDWELL-NEXT:  1.     1     1.0    0.0    0.0       vblendvps %xmm1, (%rdi), %xmm2, %xmm3
+# BDWELL-NEXT:         1     1.0    0.5    0.0       <total>
+
 # BTVER2-NEXT:  1.     1     1.0    1.0    0.0       vblendvps %xmm1, (%rdi), %xmm2, %xmm3
+# BTVER2-NEXT:         1     1.0    1.0    0.0       <total>
+
 # HASWELL-NEXT: 1.     1     1.0    0.0    0.0       vblendvps %xmm1, (%rdi), %xmm2, %xmm3
+# HASWELL-NEXT:        1     1.0    0.5    0.0       <total>
+
 # IVY-NEXT:     1.     1     1.0    0.0    0.0       vblendvps %xmm1, (%rdi), %xmm2, %xmm3
+# IVY-NEXT:            1     1.0    0.5    0.0       <total>
+
 # SANDY-NEXT:   1.     1     1.0    0.0    0.0       vblendvps %xmm1, (%rdi), %xmm2, %xmm3
+# SANDY-NEXT:          1     1.0    0.5    0.0       <total>
+
 # SKYLAKE-NEXT: 1.     1     1.0    0.0    0.0       vblendvps %xmm1, (%rdi), %xmm2, %xmm3
+# SKYLAKE-NEXT:        1     1.0    0.5    0.0       <total>
+
 # ZNVER1-NEXT:  1.     1     1.0    0.0    0.0       vblendvps %xmm1, (%rdi), %xmm2, %xmm3
+# ZNVER1-NEXT:         1     1.0    0.5    0.0       <total>
index fe3f16ba344cb4781d6b53d649dfcc3fd7144ced..1e7caa297ac685051272868dda40973025e19a5b 100644 (file)
@@ -12,6 +12,7 @@
 //===----------------------------------------------------------------------===//
 
 #include "Views/TimelineView.h"
+#include <numeric>
 
 namespace llvm {
 namespace mca {
@@ -132,25 +133,38 @@ void TimelineView::printWaitTimeEntry(formatted_raw_ostream &OS,
                                       const WaitTimeEntry &Entry,
                                       unsigned SourceIndex,
                                       unsigned Executions) const {
-  OS << SourceIndex << '.';
+  bool PrintingTotals = SourceIndex == Source.size();
+  unsigned CumulativeExecutions = PrintingTotals ? Timeline.size() : Executions;
+
+  if (!PrintingTotals)
+    OS << SourceIndex << '.';
+
   OS.PadToColumn(7);
 
   double AverageTime1, AverageTime2, AverageTime3;
-  AverageTime1 = (double)Entry.CyclesSpentInSchedulerQueue / Executions;
-  AverageTime2 = (double)Entry.CyclesSpentInSQWhileReady / Executions;
-  AverageTime3 = (double)Entry.CyclesSpentAfterWBAndBeforeRetire / Executions;
+  AverageTime1 =
+      (double)Entry.CyclesSpentInSchedulerQueue / CumulativeExecutions;
+  AverageTime2 = (double)Entry.CyclesSpentInSQWhileReady / CumulativeExecutions;
+  AverageTime3 =
+      (double)Entry.CyclesSpentAfterWBAndBeforeRetire / CumulativeExecutions;
 
   OS << Executions;
   OS.PadToColumn(13);
-  int BufferSize = UsedBuffer[SourceIndex].second;
-  tryChangeColor(OS, Entry.CyclesSpentInSchedulerQueue, Executions, BufferSize);
+
+  int BufferSize = PrintingTotals ? 0 : UsedBuffer[SourceIndex].second;
+  if (!PrintingTotals)
+    tryChangeColor(OS, Entry.CyclesSpentInSchedulerQueue, CumulativeExecutions,
+                   BufferSize);
   OS << format("%.1f", floor((AverageTime1 * 10) + 0.5) / 10);
   OS.PadToColumn(20);
-  tryChangeColor(OS, Entry.CyclesSpentInSQWhileReady, Executions, BufferSize);
+  if (!PrintingTotals)
+    tryChangeColor(OS, Entry.CyclesSpentInSQWhileReady, CumulativeExecutions,
+                   BufferSize);
   OS << format("%.1f", floor((AverageTime2 * 10) + 0.5) / 10);
   OS.PadToColumn(27);
-  tryChangeColor(OS, Entry.CyclesSpentAfterWBAndBeforeRetire, Executions,
-                 STI.getSchedModel().MicroOpBufferSize);
+  if (!PrintingTotals)
+    tryChangeColor(OS, Entry.CyclesSpentAfterWBAndBeforeRetire,
+                   CumulativeExecutions, STI.getSchedModel().MicroOpBufferSize);
   OS << format("%.1f", floor((AverageTime3 * 10) + 0.5) / 10);
 
   if (OS.has_colors())
@@ -190,6 +204,24 @@ void TimelineView::printAverageWaitTimes(raw_ostream &OS) const {
 
     ++IID;
   }
+
+  // If the timeline contains more than one instruction,
+  // let's also print global averages.
+  if (Source.size() != 1) {
+    WaitTimeEntry TotalWaitTime = std::accumulate(
+        WaitTime.begin(), WaitTime.end(), WaitTimeEntry{0, 0, 0},
+        [](const WaitTimeEntry &A, const WaitTimeEntry &B) {
+          return WaitTimeEntry{
+              A.CyclesSpentInSchedulerQueue + B.CyclesSpentInSchedulerQueue,
+              A.CyclesSpentInSQWhileReady + B.CyclesSpentInSQWhileReady,
+              A.CyclesSpentAfterWBAndBeforeRetire +
+                  B.CyclesSpentAfterWBAndBeforeRetire};
+        });
+    printWaitTimeEntry(FOS, TotalWaitTime, IID, Executions);
+    FOS << "   "
+        << "<total>" << '\n';
+    InstrStream.flush();
+  }
 }
 
 void TimelineView::printTimelineViewEntry(formatted_raw_ostream &OS,
index b63b234293cda03f9a83a9f873112a71eb5541cf..9bec3b87db45d35f542eb36ba14dc33dfd171035 100644 (file)
@@ -84,6 +84,7 @@
 /// 3.  2      1.5     0.5     1.0     vaddss  %xmm1, %xmm0, %xmm3
 /// 4.  2      3.5     0.0     0.0     vaddss  %xmm3, %xmm2, %xmm4
 /// 5.  2      6.5     0.0     0.0     vaddss  %xmm4, %xmm5, %xmm6
+///      2     2.4     0.6     1.6     <total>
 ///
 /// By comparing column [2] with column [1], we get an idea about how many
 /// cycles were spent in the scheduler's queue due to data dependencies.