]> granicus.if.org Git - llvm/commitdiff
[mips] Add madd4 subtarget feature
authorPetar Jovanovic <petar.jovanovic@imgtec.com>
Tue, 6 Jun 2017 15:33:01 +0000 (15:33 +0000)
committerPetar Jovanovic <petar.jovanovic@imgtec.com>
Tue, 6 Jun 2017 15:33:01 +0000 (15:33 +0000)
Addition of a feature and a predicate used to control generation of madd.fmt
and similar instructions.

Patch by Stefan Maksimovic.

Differential Revision: https://reviews.llvm.org/D33400

git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@304801 91177308-0d34-0410-b5e6-96231b3b80d8

lib/Target/Mips/Mips.td
lib/Target/Mips/MipsInstrFPU.td
lib/Target/Mips/MipsInstrInfo.td
lib/Target/Mips/MipsSubtarget.cpp
lib/Target/Mips/MipsSubtarget.h
test/CodeGen/Mips/fmadd1.ll

index 9615bc38bfcef02c2000be28f832e2b4f4b4bc34..f24761d7d10135ab0f3f69ddce194b069a33c444 100644 (file)
@@ -185,6 +185,9 @@ def FeatureUseTCCInDIV : SubtargetFeature<
                                "UseTCCInDIV", "false",
                                "Force the assembler to use trapping">;
 
+def FeatureMadd4 : SubtargetFeature<"nomadd4", "DisableMadd4", "true",
+                                    "Disable 4-operand madd.fmt and related instructions">;
+
 //===----------------------------------------------------------------------===//
 // Mips processors supported.
 //===----------------------------------------------------------------------===//
index d81a769d7fd976d2cd767e6b74c1c0257d1059d7..94f3a74be98bc742952b1b31381fde3be3a0986f 100644 (file)
@@ -557,11 +557,11 @@ def FSUB_S : MMRel, ADDS_FT<"sub.s", FGR32Opnd, II_SUB_S, 0, fsub>,
 defm FSUB :  ADDS_M<"sub.d", II_SUB_D, 0, fsub>, ADDS_FM<0x01, 17>;
 
 def MADD_S : MMRel, MADDS_FT<"madd.s", FGR32Opnd, II_MADD_S, fadd>,
-             MADDS_FM<4, 0>, INSN_MIPS4_32R2_NOT_32R6_64R6;
+             MADDS_FM<4, 0>, INSN_MIPS4_32R2_NOT_32R6_64R6, MADD4;
 def MSUB_S : MMRel, MADDS_FT<"msub.s", FGR32Opnd, II_MSUB_S, fsub>,
-             MADDS_FM<5, 0>, INSN_MIPS4_32R2_NOT_32R6_64R6;
+             MADDS_FM<5, 0>, INSN_MIPS4_32R2_NOT_32R6_64R6, MADD4;
 
-let AdditionalPredicates = [NoNaNsFPMath] in {
+let AdditionalPredicates = [NoNaNsFPMath, HasMadd4] in {
   def NMADD_S : MMRel, NMADDS_FT<"nmadd.s", FGR32Opnd, II_NMADD_S, fadd>,
                 MADDS_FM<6, 0>, INSN_MIPS4_32R2_NOT_32R6_64R6;
   def NMSUB_S : MMRel, NMADDS_FT<"nmsub.s", FGR32Opnd, II_NMSUB_S, fsub>,
@@ -569,11 +569,11 @@ let AdditionalPredicates = [NoNaNsFPMath] in {
 }
 
 def MADD_D32 : MMRel, MADDS_FT<"madd.d", AFGR64Opnd, II_MADD_D, fadd>,
-               MADDS_FM<4, 1>, INSN_MIPS4_32R2_NOT_32R6_64R6, FGR_32;
+               MADDS_FM<4, 1>, INSN_MIPS4_32R2_NOT_32R6_64R6, FGR_32, MADD4;
 def MSUB_D32 : MMRel, MADDS_FT<"msub.d", AFGR64Opnd, II_MSUB_D, fsub>,
-               MADDS_FM<5, 1>, INSN_MIPS4_32R2_NOT_32R6_64R6, FGR_32;
+               MADDS_FM<5, 1>, INSN_MIPS4_32R2_NOT_32R6_64R6, FGR_32, MADD4;
 
-let AdditionalPredicates = [NoNaNsFPMath] in {
+let AdditionalPredicates = [NoNaNsFPMath, HasMadd4] in {
   def NMADD_D32 : MMRel, NMADDS_FT<"nmadd.d", AFGR64Opnd, II_NMADD_D, fadd>,
                   MADDS_FM<6, 1>, INSN_MIPS4_32R2_NOT_32R6_64R6, FGR_32;
   def NMSUB_D32 : MMRel, NMADDS_FT<"nmsub.d", AFGR64Opnd, II_NMSUB_D, fsub>,
@@ -582,12 +582,12 @@ let AdditionalPredicates = [NoNaNsFPMath] in {
 
 let DecoderNamespace = "Mips64" in {
   def MADD_D64 : MADDS_FT<"madd.d", FGR64Opnd, II_MADD_D, fadd>,
-                 MADDS_FM<4, 1>, INSN_MIPS4_32R2_NOT_32R6_64R6, FGR_64;
+                 MADDS_FM<4, 1>, INSN_MIPS4_32R2_NOT_32R6_64R6, FGR_64, MADD4;
   def MSUB_D64 : MADDS_FT<"msub.d", FGR64Opnd, II_MSUB_D, fsub>,
-                 MADDS_FM<5, 1>, INSN_MIPS4_32R2_NOT_32R6_64R6, FGR_64;
+                 MADDS_FM<5, 1>, INSN_MIPS4_32R2_NOT_32R6_64R6, FGR_64, MADD4;
 }
 
-let AdditionalPredicates = [NoNaNsFPMath],
+let AdditionalPredicates = [NoNaNsFPMath, HasMadd4],
     DecoderNamespace = "Mips64" in {
   def NMADD_D64 : NMADDS_FT<"nmadd.d", FGR64Opnd, II_NMADD_D, fadd>,
                   MADDS_FM<6, 1>, INSN_MIPS4_32R2_NOT_32R6_64R6, FGR_64;
index 8761946b8dbb325a92d502715c2616c4b892cd9d..40078fb7714420bebf3f0311563bdc0d19d4088e 100644 (file)
@@ -238,6 +238,8 @@ def HasEVA       :    Predicate<"Subtarget->hasEVA()">,
                       AssemblerPredicate<"FeatureEVA,FeatureMips32r2">;
 def HasMSA : Predicate<"Subtarget->hasMSA()">,
              AssemblerPredicate<"FeatureMSA">;
+def HasMadd4 : Predicate<"!Subtarget->disableMadd4()">,
+               AssemblerPredicate<"!FeatureMadd4">;
 
 
 //===----------------------------------------------------------------------===//
@@ -390,6 +392,10 @@ class ASE_NOT_DSP {
   list<Predicate> InsnPredicates = [NotDSP];
 }
 
+class MADD4 {
+  list<Predicate> AdditionalPredicates = [HasMadd4];
+}
+
 //===----------------------------------------------------------------------===//
 
 class MipsPat<dag pattern, dag result> : Pat<pattern, result>, PredicateControl {
index 6b4a3f9a1401629b80f40036115672dc2e7f7b47..154d5825427b36628293f63ddac2b29667e80063 100644 (file)
@@ -70,7 +70,7 @@ MipsSubtarget::MipsSubtarget(const Triple &TT, StringRef CPU, StringRef FS,
       InMips16HardFloat(Mips16HardFloat), InMicroMipsMode(false), HasDSP(false),
       HasDSPR2(false), HasDSPR3(false), AllowMixed16_32(Mixed16_32 | Mips_Os16),
       Os16(Mips_Os16), HasMSA(false), UseTCCInDIV(false), HasSym32(false),
-      HasEVA(false), TM(TM), TargetTriple(TT), TSInfo(),
+      HasEVA(false), DisableMadd4(false), TM(TM), TargetTriple(TT), TSInfo(),
       InstrInfo(
           MipsInstrInfo::create(initializeSubtargetDependencies(CPU, FS, TM))),
       FrameLowering(MipsFrameLowering::create(*this)),
index b4d15ee361ffe06fc060d7c9ae15463e2a2b3e52..ba9f9d2836af44e137d6bf3c84d5728b8e6fc330 100644 (file)
@@ -144,6 +144,10 @@ class MipsSubtarget : public MipsGenSubtargetInfo {
 
   // HasEVA -- supports EVA ASE.
   bool HasEVA;
+  
+  // nomadd4 - disables generation of 4-operand madd.s, madd.d and
+  // related instructions.
+  bool DisableMadd4;
 
   InstrItineraryData InstrItins;
 
@@ -253,6 +257,7 @@ public:
   bool hasDSPR2() const { return HasDSPR2; }
   bool hasDSPR3() const { return HasDSPR3; }
   bool hasMSA() const { return HasMSA; }
+  bool disableMadd4() const { return DisableMadd4; }
   bool hasEVA() const { return HasEVA; }
   bool useSmallSection() const { return UseSmallSection; }
 
index c155eedd62c4b7ac265825fa0d4f419dac22c4d7..d7f6308ac0b00f6378c660a4aa3d57bcc651649c 100644 (file)
@@ -5,52 +5,63 @@
 ; IEEE 754 (1985) and IEEE 754 (2008). These instructions are therefore only
 ; available when -enable-no-nans-fp-math is given.
 
-; RUN: llc < %s -march=mipsel   -mcpu=mips32              -enable-no-nans-fp-math | FileCheck %s -check-prefixes=ALL,32,32-NONAN
+; RUN: llc < %s -march=mipsel   -mcpu=mips32              -enable-no-nans-fp-math | FileCheck %s -check-prefixes=ALL,32-NOMADD,32-NONAN-NOMADD
 ; RUN: llc < %s -march=mipsel   -mcpu=mips32r2            -enable-no-nans-fp-math | FileCheck %s -check-prefixes=ALL,32R2,32R2-NONAN
-; RUN: llc < %s -march=mipsel   -mcpu=mips32r6            -enable-no-nans-fp-math | FileCheck %s -check-prefixes=ALL,32R6,32R6-NONAN
+; RUN: llc < %s -march=mipsel   -mcpu=mips32r6            -enable-no-nans-fp-math | FileCheck %s -check-prefixes=ALL,32R6-NOMADD,32R6-NONAN-NOMADD
 ; RUN: llc < %s -march=mips64el -mcpu=mips64   -target-abi=n64 -enable-no-nans-fp-math | FileCheck %s -check-prefixes=ALL,64,64-NONAN
 ; RUN: llc < %s -march=mips64el -mcpu=mips64r2 -target-abi=n64 -enable-no-nans-fp-math | FileCheck %s -check-prefixes=ALL,64R2,64R2-NONAN
-; RUN: llc < %s -march=mips64el -mcpu=mips64r6 -target-abi=n64 -enable-no-nans-fp-math | FileCheck %s -check-prefixes=ALL,64R6,64R6-NONAN
-; RUN: llc < %s -march=mipsel   -mcpu=mips32              | FileCheck %s -check-prefixes=ALL,32,32-NAN
+; RUN: llc < %s -march=mips64el -mcpu=mips64r6 -target-abi=n64 -enable-no-nans-fp-math | FileCheck %s -check-prefixes=ALL,64R6-NOMADD,64R6-NONAN-NOMADD
+; RUN: llc < %s -march=mipsel   -mcpu=mips32              | FileCheck %s -check-prefixes=ALL,32-NOMADD,32-NAN-NOMADD
 ; RUN: llc < %s -march=mipsel   -mcpu=mips32r2            | FileCheck %s -check-prefixes=ALL,32R2,32R2-NAN
-; RUN: llc < %s -march=mipsel   -mcpu=mips32r6            | FileCheck %s -check-prefixes=ALL,32R6,32R6-NAN
+; RUN: llc < %s -march=mipsel   -mcpu=mips32r6            | FileCheck %s -check-prefixes=ALL,32R6-NOMADD,32R6-NAN-NOMADD
 ; RUN: llc < %s -march=mips64el -mcpu=mips64   -target-abi=n64 | FileCheck %s -check-prefixes=ALL,64,64-NAN
 ; RUN: llc < %s -march=mips64el -mcpu=mips64r2 -target-abi=n64 | FileCheck %s -check-prefixes=ALL,64R2,64R2-NAN
-; RUN: llc < %s -march=mips64el -mcpu=mips64r6 -target-abi=n64 | FileCheck %s -check-prefixes=ALL,64R6,64R6-NAN
+; RUN: llc < %s -march=mips64el -mcpu=mips64r6 -target-abi=n64 | FileCheck %s -check-prefixes=ALL,64R6-NOMADD,64R6-NAN-NOMADD
+
+; Check that madd.[ds], msub.[ds], nmadd.[ds], and nmsub.[ds] are not generated
+; when +nomadd attribute is specified.
+; Output for mips32 and mips64r6 reused since aforementioned instructions are
+; not generated in those cases.
+; RUN: llc < %s -march=mipsel   -mcpu=mips32r2            -enable-no-nans-fp-math -mattr=+nomadd4 | FileCheck %s -check-prefixes=ALL,32-NOMADD,32-NONAN-NOMADD
+; RUN: llc < %s -march=mips64el -mcpu=mips64   -target-abi=n64 -enable-no-nans-fp-math -mattr=+nomadd4 | FileCheck %s -check-prefixes=ALL,64R6-NOMADD,64R6-NONAN-NOMADD
+; RUN: llc < %s -march=mips64el -mcpu=mips64r2 -target-abi=n64 -enable-no-nans-fp-math -mattr=+nomadd4 | FileCheck %s -check-prefixes=ALL,64R6-NOMADD,64R6-NONAN-NOMADD
+; RUN: llc < %s -march=mipsel   -mcpu=mips32r2            -mattr=+nomadd4 | FileCheck %s -check-prefixes=ALL,32-NOMADD,32-NAN-NOMADD
+; RUN: llc < %s -march=mips64el -mcpu=mips64   -target-abi=n64 -mattr=+nomadd4 | FileCheck %s -check-prefixes=ALL,64R6-NOMADD,64R6-NAN-NOMADD
+; RUN: llc < %s -march=mips64el -mcpu=mips64r2 -target-abi=n64 -mattr=+nomadd4 | FileCheck %s -check-prefixes=ALL,64R6-NOMADD,64R6-NAN-NOMADD
 
 define float @FOO0float(float %a, float %b, float %c) nounwind readnone {
 entry:
 ; ALL-LABEL: FOO0float:
 
-; 32-DAG:        mtc1 $6, $[[T0:f[0-9]+]]
-; 32-DAG:        mul.s $[[T1:f[0-9]+]], $f12, $f14
-; 32-DAG:        add.s $[[T2:f[0-9]+]], $[[T1]], $[[T0]]
-; 32-DAG:        mtc1 $zero, $[[T2:f[0-9]+]]
-; 32-DAG:        add.s $f0, $[[T1]], $[[T2]]
+; 32-NOMADD-DAG:        mtc1 $6, $[[T0:f[0-9]+]]
+; 32-NOMADD-DAG:        mul.s $[[T1:f[0-9]+]], $f12, $f14
+; 32-NOMADD-DAG:        add.s $[[T2:f[0-9]+]], $[[T1]], $[[T0]]
+; 32-NOMADD-DAG:        mtc1 $zero, $[[T2:f[0-9]+]]
+; 32-NOMADD-DAG:        add.s $f0, $[[T1]], $[[T2]]
 
-; 32R2:          mtc1 $6, $[[T0:f[0-9]+]]
-; 32R2:          madd.s $[[T1:f[0-9]+]], $[[T0]], $f12, $f14
-; 32R2:          mtc1 $zero, $[[T2:f[0-9]+]]
-; 32R2:          add.s $f0, $[[T1]], $[[T2]]
+; 32R2:                 mtc1 $6, $[[T0:f[0-9]+]]
+; 32R2:                 madd.s $[[T1:f[0-9]+]], $[[T0]], $f12, $f14
+; 32R2:                 mtc1 $zero, $[[T2:f[0-9]+]]
+; 32R2:                 add.s $f0, $[[T1]], $[[T2]]
 
-; 32R6-DAG:      mtc1 $6, $[[T0:f[0-9]+]]
-; 32R6-DAG:      mul.s $[[T1:f[0-9]+]], $f12, $f14
-; 32R6-DAG:      add.s $[[T2:f[0-9]+]], $[[T1]], $[[T0]]
-; 32R6-DAG:      mtc1 $zero, $[[T2:f[0-9]+]]
-; 32R6-DAG:      add.s $f0, $[[T1]], $[[T2]]
+; 32R6-NOMADD-DAG:      mtc1 $6, $[[T0:f[0-9]+]]
+; 32R6-NOMADD-DAG:      mul.s $[[T1:f[0-9]+]], $f12, $f14
+; 32R6-NOMADD-DAG:      add.s $[[T2:f[0-9]+]], $[[T1]], $[[T0]]
+; 32R6-NOMADD-DAG:      mtc1 $zero, $[[T2:f[0-9]+]]
+; 32R6-NOMADD-DAG:      add.s $f0, $[[T1]], $[[T2]]
 
-; 64-DAG:        madd.s $[[T0:f[0-9]+]], $f14, $f12, $f13
-; 64-DAG:        mtc1 $zero, $[[T1:f[0-9]+]]
-; 64-DAG:        add.s $f0, $[[T0]], $[[T1]]
+; 64-DAG:               madd.s $[[T0:f[0-9]+]], $f14, $f12, $f13
+; 64-DAG:               mtc1 $zero, $[[T1:f[0-9]+]]
+; 64-DAG:               add.s $f0, $[[T0]], $[[T1]]
 
-; 64R2:          madd.s $[[T0:f[0-9]+]], $f14, $f12, $f13
-; 64R2:          mtc1 $zero, $[[T1:f[0-9]+]]
-; 64R2:          add.s $f0, $[[T0]], $[[T1]]
+; 64R2:                 madd.s $[[T0:f[0-9]+]], $f14, $f12, $f13
+; 64R2:                 mtc1 $zero, $[[T1:f[0-9]+]]
+; 64R2:                 add.s $f0, $[[T0]], $[[T1]]
 
-; 64R6-DAG:      mul.s $[[T0:f[0-9]+]], $f12, $f13
-; 64R6-DAG:      add.s $[[T1:f[0-9]+]], $[[T0]], $f14
-; 64R6-DAG:      mtc1 $zero, $[[T2:f[0-9]+]]
-; 64R6-DAG:      add.s $f0, $[[T1]], $[[T2]]
+; 64R6-NOMADD-DAG:      mul.s $[[T0:f[0-9]+]], $f12, $f13
+; 64R6-NOMADD-DAG:      add.s $[[T1:f[0-9]+]], $[[T0]], $f14
+; 64R6-NOMADD-DAG:      mtc1 $zero, $[[T2:f[0-9]+]]
+; 64R6-NOMADD-DAG:      add.s $f0, $[[T1]], $[[T2]]
 
   %mul = fmul float %a, %b
   %add = fadd float %mul, %c
@@ -62,35 +73,35 @@ define float @FOO1float(float %a, float %b, float %c) nounwind readnone {
 entry:
 ; ALL-LABEL: FOO1float:
 
-; 32-DAG:        mtc1 $6, $[[T0:f[0-9]+]]
-; 32-DAG:        mul.s $[[T1:f[0-9]+]], $f12, $f14
-; 32-DAG:        sub.s $[[T2:f[0-9]+]], $[[T1]], $[[T0]]
-; 32-DAG:        mtc1 $zero, $[[T2:f[0-9]+]]
-; 32-DAG:        add.s $f0, $[[T1]], $[[T2]]
+; 32-NOMADD-DAG:        mtc1 $6, $[[T0:f[0-9]+]]
+; 32-NOMADD-DAG:        mul.s $[[T1:f[0-9]+]], $f12, $f14
+; 32-NOMADD-DAG:        sub.s $[[T2:f[0-9]+]], $[[T1]], $[[T0]]
+; 32-NOMADD-DAG:        mtc1 $zero, $[[T2:f[0-9]+]]
+; 32-NOMADD-DAG:        add.s $f0, $[[T1]], $[[T2]]
 
-; 32R2:          mtc1 $6, $[[T0:f[0-9]+]]
-; 32R2:          msub.s $[[T1:f[0-9]+]], $[[T0]], $f12, $f14
-; 32R2:          mtc1 $zero, $[[T2:f[0-9]+]]
-; 32R2:          add.s $f0, $[[T1]], $[[T2]]
+; 32R2:                 mtc1 $6, $[[T0:f[0-9]+]]
+; 32R2:                 msub.s $[[T1:f[0-9]+]], $[[T0]], $f12, $f14
+; 32R2:                 mtc1 $zero, $[[T2:f[0-9]+]]
+; 32R2:                 add.s $f0, $[[T1]], $[[T2]]
 
-; 32R6-DAG:      mtc1 $6, $[[T0:f[0-9]+]]
-; 32R6-DAG:      mul.s $[[T1:f[0-9]+]], $f12, $f14
-; 32R6-DAG:      sub.s $[[T2:f[0-9]+]], $[[T1]], $[[T0]]
-; 32R6-DAG:      mtc1 $zero, $[[T2:f[0-9]+]]
-; 32R6-DAG:      add.s $f0, $[[T1]], $[[T2]]
+; 32R6-NOMADD-DAG:      mtc1 $6, $[[T0:f[0-9]+]]
+; 32R6-NOMADD-DAG:      mul.s $[[T1:f[0-9]+]], $f12, $f14
+; 32R6-NOMADD-DAG:      sub.s $[[T2:f[0-9]+]], $[[T1]], $[[T0]]
+; 32R6-NOMADD-DAG:      mtc1 $zero, $[[T2:f[0-9]+]]
+; 32R6-NOMADD-DAG:      add.s $f0, $[[T1]], $[[T2]]
 
-; 64-DAG:        msub.s $[[T0:f[0-9]+]], $f14, $f12, $f13
-; 64-DAG:        mtc1 $zero, $[[T1:f[0-9]+]]
-; 64-DAG:        add.s $f0, $[[T0]], $[[T1]]
+; 64-DAG:               msub.s $[[T0:f[0-9]+]], $f14, $f12, $f13
+; 64-DAG:               mtc1 $zero, $[[T1:f[0-9]+]]
+; 64-DAG:               add.s $f0, $[[T0]], $[[T1]]
 
-; 64R2:          msub.s $[[T0:f[0-9]+]], $f14, $f12, $f13
-; 64R2:          mtc1 $zero, $[[T1:f[0-9]+]]
-; 64R2:          add.s $f0, $[[T0]], $[[T1]]
+; 64R2:                 msub.s $[[T0:f[0-9]+]], $f14, $f12, $f13
+; 64R2:                 mtc1 $zero, $[[T1:f[0-9]+]]
+; 64R2:                 add.s $f0, $[[T0]], $[[T1]]
 
-; 64R6-DAG:      mul.s $[[T0:f[0-9]+]], $f12, $f13
-; 64R6-DAG:      sub.s $[[T1:f[0-9]+]], $[[T0]], $f14
-; 64R6-DAG:      mtc1 $zero, $[[T2:f[0-9]+]]
-; 64R6-DAG:      add.s $f0, $[[T1]], $[[T2]]
+; 64R6-NOMADD-DAG:      mul.s $[[T0:f[0-9]+]], $f12, $f13
+; 64R6-NOMADD-DAG:      sub.s $[[T1:f[0-9]+]], $[[T0]], $f14
+; 64R6-NOMADD-DAG:      mtc1 $zero, $[[T2:f[0-9]+]]
+; 64R6-NOMADD-DAG:      add.s $f0, $[[T1]], $[[T2]]
 
   %mul = fmul float %a, %b
   %sub = fsub float %mul, %c
@@ -102,42 +113,42 @@ define float @FOO2float(float %a, float %b, float %c) nounwind readnone {
 entry:
 ; ALL-LABEL: FOO2float:
 
-; 32-DAG:        mtc1 $6, $[[T0:f[0-9]+]]
-; 32-DAG:        mul.s $[[T1:f[0-9]+]], $f12, $f14
-; 32-DAG:        add.s $[[T2:f[0-9]+]], $[[T1]], $[[T0]]
-; 32-DAG:        mtc1 $zero, $[[T2:f[0-9]+]]
-; 32-DAG:        sub.s $f0, $[[T2]], $[[T1]]
+; 32-NOMADD-DAG:        mtc1 $6, $[[T0:f[0-9]+]]
+; 32-NOMADD-DAG:        mul.s $[[T1:f[0-9]+]], $f12, $f14
+; 32-NOMADD-DAG:        add.s $[[T2:f[0-9]+]], $[[T1]], $[[T0]]
+; 32-NOMADD-DAG:        mtc1 $zero, $[[T2:f[0-9]+]]
+; 32-NOMADD-DAG:        sub.s $f0, $[[T2]], $[[T1]]
 
-; 32R2-NONAN:    mtc1 $6, $[[T0:f[0-9]+]]
-; 32R2-NONAN:    nmadd.s $f0, $[[T0]], $f12, $f14
+; 32R2-NONAN:           mtc1 $6, $[[T0:f[0-9]+]]
+; 32R2-NONAN:           nmadd.s $f0, $[[T0]], $f12, $f14
 
-; 32R2-NAN:      mtc1 $6, $[[T0:f[0-9]+]]
-; 32R2-NAN:      madd.s $[[T1:f[0-9]+]], $[[T0]], $f12, $f14
-; 32R2-NAN:      mtc1 $zero, $[[T2:f[0-9]+]]
-; 32R2-NAN:      sub.s  $f0, $[[T2]], $[[T1]]
+; 32R2-NAN:             mtc1 $6, $[[T0:f[0-9]+]]
+; 32R2-NAN:             madd.s $[[T1:f[0-9]+]], $[[T0]], $f12, $f14
+; 32R2-NAN:             mtc1 $zero, $[[T2:f[0-9]+]]
+; 32R2-NAN:             sub.s  $f0, $[[T2]], $[[T1]]
 
-; 32R6-DAG:      mtc1 $6, $[[T0:f[0-9]+]]
-; 32R6-DAG:      mul.s $[[T1:f[0-9]+]], $f12, $f14
-; 32R6-DAG:      add.s $[[T2:f[0-9]+]], $[[T1]], $[[T0]]
-; 32R6-DAG:      mtc1 $zero, $[[T2:f[0-9]+]]
-; 32R6-DAG:      sub.s $f0, $[[T2]], $[[T1]]
+; 32R6-NOMADD-DAG:      mtc1 $6, $[[T0:f[0-9]+]]
+; 32R6-NOMADD-DAG:      mul.s $[[T1:f[0-9]+]], $f12, $f14
+; 32R6-NOMADD-DAG:      add.s $[[T2:f[0-9]+]], $[[T1]], $[[T0]]
+; 32R6-NOMADD-DAG:      mtc1 $zero, $[[T2:f[0-9]+]]
+; 32R6-NOMADD-DAG:      sub.s $f0, $[[T2]], $[[T1]]
 
-; 64-NONAN:      nmadd.s $f0, $f14, $f12, $f13
+; 64-NONAN:             nmadd.s $f0, $f14, $f12, $f13
 
-; 64-NAN:        madd.s $[[T0:f[0-9]+]], $f14, $f12, $f13
-; 64-NAN:        mtc1 $zero, $[[T1:f[0-9]+]]
-; 64-NAN:        sub.s  $f0, $[[T1]], $[[T0]]
+; 64-NAN:               madd.s $[[T0:f[0-9]+]], $f14, $f12, $f13
+; 64-NAN:               mtc1 $zero, $[[T1:f[0-9]+]]
+; 64-NAN:               sub.s  $f0, $[[T1]], $[[T0]]
 
-; 64R2-NONAN:    nmadd.s $f0, $f14, $f12, $f13
+; 64R2-NONAN:           nmadd.s $f0, $f14, $f12, $f13
 
-; 64R2-NAN:      madd.s $[[T0:f[0-9]+]], $f14, $f12, $f13
-; 64R2-NAN:      mtc1 $zero, $[[T1:f[0-9]+]]
-; 64R2-NAN:      sub.s  $f0, $[[T1]], $[[T0]]
+; 64R2-NAN:             madd.s $[[T0:f[0-9]+]], $f14, $f12, $f13
+; 64R2-NAN:             mtc1 $zero, $[[T1:f[0-9]+]]
+; 64R2-NAN:             sub.s  $f0, $[[T1]], $[[T0]]
 
-; 64R6-DAG:      mul.s $[[T1:f[0-9]+]], $f12, $f13
-; 64R6-DAG:      add.s $[[T2:f[0-9]+]], $[[T1]], $f14
-; 64R6-DAG:      mtc1 $zero, $[[T2:f[0-9]+]]
-; 64R6-DAG:      sub.s $f0, $[[T2]], $[[T1]]
+; 64R6-NOMADD-DAG:      mul.s $[[T1:f[0-9]+]], $f12, $f13
+; 64R6-NOMADD-DAG:      add.s $[[T2:f[0-9]+]], $[[T1]], $f14
+; 64R6-NOMADD-DAG:      mtc1 $zero, $[[T2:f[0-9]+]]
+; 64R6-NOMADD-DAG:      sub.s $f0, $[[T2]], $[[T1]]
 
   %mul = fmul float %a, %b
   %add = fadd float %mul, %c
@@ -149,34 +160,34 @@ define float @FOO3float(float %a, float %b, float %c) nounwind readnone {
 entry:
 ; ALL-LABEL: FOO3float:
 
-; 32-DAG:        mtc1 $6, $[[T0:f[0-9]+]]
-; 32-DAG:        mul.s $[[T1:f[0-9]+]], $f12, $f14
-; 32-DAG:        sub.s $[[T2:f[0-9]+]], $[[T1]], $[[T0]]
-; 32-DAG:        mtc1 $zero, $[[T2:f[0-9]+]]
-; 32-DAG:        sub.s $f0, $[[T2]], $[[T1]]
+; 32-NOMADD-DAG:        mtc1 $6, $[[T0:f[0-9]+]]
+; 32-NOMADD-DAG:        mul.s $[[T1:f[0-9]+]], $f12, $f14
+; 32-NOMADD-DAG:        sub.s $[[T2:f[0-9]+]], $[[T1]], $[[T0]]
+; 32-NOMADD-DAG:        mtc1 $zero, $[[T2:f[0-9]+]]
+; 32-NOMADD-DAG:        sub.s $f0, $[[T2]], $[[T1]]
 
-; 32R2-NONAN:    mtc1 $6, $[[T0:f[0-9]+]]
-; 32R2-NONAN:    nmsub.s $f0, $[[T0]], $f12, $f14
+; 32R2-NONAN:           mtc1 $6, $[[T0:f[0-9]+]]
+; 32R2-NONAN:           nmsub.s $f0, $[[T0]], $f12, $f14
 
-; 32R2-NAN:      mtc1 $6, $[[T0:f[0-9]+]]
-; 32R2-NAN:      msub.s $[[T1:f[0-9]+]], $[[T0]], $f12, $f14
-; 32R2-NAN:      mtc1 $zero, $[[T2:f[0-9]+]]
-; 32R2-NAN:      sub.s  $f0, $[[T2]], $[[T1]]
+; 32R2-NAN:             mtc1 $6, $[[T0:f[0-9]+]]
+; 32R2-NAN:             msub.s $[[T1:f[0-9]+]], $[[T0]], $f12, $f14
+; 32R2-NAN:             mtc1 $zero, $[[T2:f[0-9]+]]
+; 32R2-NAN:             sub.s  $f0, $[[T2]], $[[T1]]
 
-; 64-NAN:        msub.s $[[T0:f[0-9]+]], $f14, $f12, $f13
-; 64-NAN:        mtc1 $zero, $[[T1:f[0-9]+]]
-; 64-NAN:        sub.s  $f0, $[[T1]], $[[T0]]
+; 64-NAN:               msub.s $[[T0:f[0-9]+]], $f14, $f12, $f13
+; 64-NAN:               mtc1 $zero, $[[T1:f[0-9]+]]
+; 64-NAN:               sub.s  $f0, $[[T1]], $[[T0]]
 
-; 64-NONAN:      nmsub.s $f0, $f14, $f12, $f13
+; 64-NONAN:             nmsub.s $f0, $f14, $f12, $f13
 
-; 64R2-NAN:      msub.s $[[T0:f[0-9]+]], $f14, $f12, $f13
-; 64R2-NAN:      mtc1 $zero, $[[T1:f[0-9]+]]
-; 64R2-NAN:      sub.s  $f0, $[[T1]], $[[T0]]
+; 64R2-NAN:             msub.s $[[T0:f[0-9]+]], $f14, $f12, $f13
+; 64R2-NAN:             mtc1 $zero, $[[T1:f[0-9]+]]
+; 64R2-NAN:             sub.s  $f0, $[[T1]], $[[T0]]
 
-; 64R6-DAG:      mul.s $[[T1:f[0-9]+]], $f12, $f13
-; 64R6-DAG:      sub.s $[[T2:f[0-9]+]], $[[T1]], $f14
-; 64R6-DAG:      mtc1 $zero, $[[T2:f[0-9]+]]
-; 64R6-DAG:      sub.s $f0, $[[T2]], $[[T1]]
+; 64R6-NOMADD-DAG:      mul.s $[[T1:f[0-9]+]], $f12, $f13
+; 64R6-NOMADD-DAG:      sub.s $[[T2:f[0-9]+]], $[[T1]], $f14
+; 64R6-NOMADD-DAG:      mtc1 $zero, $[[T2:f[0-9]+]]
+; 64R6-NOMADD-DAG:      sub.s $f0, $[[T2]], $[[T1]]
 
   %mul = fmul float %a, %b
   %sub = fsub float %mul, %c
@@ -188,36 +199,36 @@ define double @FOO10double(double %a, double %b, double %c) nounwind readnone {
 entry:
 ; ALL-LABEL: FOO10double:
 
-; 32-DAG:        ldc1 $[[T0:f[0-9]+]], 16($sp)
-; 32-DAG:        mul.d $[[T1:f[0-9]+]], $f12, $f14
-; 32-DAG:        add.d $[[T2:f[0-9]+]], $[[T1]], $[[T0]]
-; 32-DAG:        mtc1 $zero, $[[T2:f[0-9]+]]
-; 32-DAG:        add.d $f0, $[[T1]], $[[T2]]
-
-; 32R2:          ldc1 $[[T0:f[0-9]+]], 16($sp)
-; 32R2:          madd.d $[[T1:f[0-9]+]], $[[T0]], $f12, $f14
-; 32R2:          mtc1 $zero, $[[T2:f[0-9]+]]
-; 32R2:          mthc1 $zero, $[[T2]]
-; 32R2:          add.d $f0, $[[T1]], $[[T2]]
-
-; 32R6-DAG:      ldc1 $[[T0:f[0-9]+]], 16($sp)
-; 32R6-DAG:      mul.d $[[T1:f[0-9]+]], $f12, $f14
-; 32R6-DAG:      add.d $[[T2:f[0-9]+]], $[[T1]], $[[T0]]
-; 32R6-DAG:      mtc1 $zero, $[[T2:f[0-9]+]]
-; 32R6-DAG:      add.d $f0, $[[T1]], $[[T2]]
-
-; 64-DAG:        madd.d $[[T0:f[0-9]+]], $f14, $f12, $f13
-; 64-DAG:        mtc1 $zero, $[[T1:f[0-9]+]]
-; 64-DAG:        add.d $f0, $[[T0]], $[[T1]]
-
-; 64R2:          madd.d $[[T0:f[0-9]+]], $f14, $f12, $f13
-; 64R2:          mtc1 $zero, $[[T1:f[0-9]+]]
-; 64R2:          add.d $f0, $[[T0]], $[[T1]]
-
-; 64R6-DAG:      mul.d $[[T1:f[0-9]+]], $f12, $f13
-; 64R6-DAG:      add.d $[[T2:f[0-9]+]], $[[T1]], $f14
-; 64R6-DAG:      dmtc1 $zero, $[[T2:f[0-9]+]]
-; 64R6-DAG:      add.d $f0, $[[T1]], $[[T2]]
+; 32-NOMADD-DAG:        ldc1 $[[T0:f[0-9]+]], 16($sp)
+; 32-NOMADD-DAG:        mul.d $[[T1:f[0-9]+]], $f12, $f14
+; 32-NOMADD-DAG:        add.d $[[T2:f[0-9]+]], $[[T1]], $[[T0]]
+; 32-NOMADD-DAG:        mtc1 $zero, $[[T2:f[0-9]+]]
+; 32-NOMADD-DAG:        add.d $f0, $[[T1]], $[[T2]]
+
+; 32R2:                 ldc1 $[[T0:f[0-9]+]], 16($sp)
+; 32R2:                 madd.d $[[T1:f[0-9]+]], $[[T0]], $f12, $f14
+; 32R2:                 mtc1 $zero, $[[T2:f[0-9]+]]
+; 32R2:                 mthc1 $zero, $[[T2]]
+; 32R2:                 add.d $f0, $[[T1]], $[[T2]]
+
+; 32R6-NOMADD-DAG:      ldc1 $[[T0:f[0-9]+]], 16($sp)
+; 32R6-NOMADD-DAG:      mul.d $[[T1:f[0-9]+]], $f12, $f14
+; 32R6-NOMADD-DAG:      add.d $[[T2:f[0-9]+]], $[[T1]], $[[T0]]
+; 32R6-NOMADD-DAG:      mtc1 $zero, $[[T2:f[0-9]+]]
+; 32R6-NOMADD-DAG:      add.d $f0, $[[T1]], $[[T2]]
+
+; 64-DAG:               madd.d $[[T0:f[0-9]+]], $f14, $f12, $f13
+; 64-DAG:               mtc1 $zero, $[[T1:f[0-9]+]]
+; 64-DAG:               add.d $f0, $[[T0]], $[[T1]]
+
+; 64R2:                 madd.d $[[T0:f[0-9]+]], $f14, $f12, $f13
+; 64R2:                 mtc1 $zero, $[[T1:f[0-9]+]]
+; 64R2:                 add.d $f0, $[[T0]], $[[T1]]
+
+; 64R6-NOMADD-DAG:      mul.d $[[T1:f[0-9]+]], $f12, $f13
+; 64R6-NOMADD-DAG:      add.d $[[T2:f[0-9]+]], $[[T1]], $f14
+; 64R6-NOMADD-DAG:      dmtc1 $zero, $[[T2:f[0-9]+]]
+; 64R6-NOMADD-DAG:      add.d $f0, $[[T1]], $[[T2]]
 
   %mul = fmul double %a, %b
   %add = fadd double %mul, %c
@@ -229,36 +240,36 @@ define double @FOO11double(double %a, double %b, double %c) nounwind readnone {
 entry:
 ; ALL-LABEL: FOO11double:
 
-; 32-DAG:        ldc1 $[[T0:f[0-9]+]], 16($sp)
-; 32-DAG:        mul.d $[[T1:f[0-9]+]], $f12, $f14
-; 32-DAG:        sub.d $[[T2:f[0-9]+]], $[[T1]], $[[T0]]
-; 32-DAG:        mtc1 $zero, $[[T2:f[0-9]+]]
-; 32-DAG:        add.d $f0, $[[T1]], $[[T2]]
-
-; 32R2:          ldc1 $[[T0:f[0-9]+]], 16($sp)
-; 32R2:          msub.d $[[T1:f[0-9]+]], $[[T0]], $f12, $f14
-; 32R2:          mtc1 $zero, $[[T2:f[0-9]+]]
-; 32R2:          mthc1 $zero, $[[T2]]
-; 32R2:          add.d $f0, $[[T1]], $[[T2]]
-
-; 32R6-DAG:      ldc1 $[[T0:f[0-9]+]], 16($sp)
-; 32R6-DAG:      mul.d $[[T1:f[0-9]+]], $f12, $f14
-; 32R6-DAG:      sub.d $[[T2:f[0-9]+]], $[[T1]], $[[T0]]
-; 32R6-DAG:      mtc1 $zero, $[[T2:f[0-9]+]]
-; 32R6-DAG:      add.d $f0, $[[T1]], $[[T2]]
-
-; 64-DAG:        msub.d $[[T0:f[0-9]+]], $f14, $f12, $f13
-; 64-DAG:        mtc1 $zero, $[[T1:f[0-9]+]]
-; 64-DAG:        add.d $f0, $[[T0]], $[[T1]]
-
-; 64R2:          msub.d $[[T0:f[0-9]+]], $f14, $f12, $f13
-; 64R2:          mtc1 $zero, $[[T1:f[0-9]+]]
-; 64R2:          add.d $f0, $[[T0]], $[[T1]]
-
-; 64R6-DAG:      mul.d $[[T1:f[0-9]+]], $f12, $f13
-; 64R6-DAG:      sub.d $[[T2:f[0-9]+]], $[[T1]], $f14
-; 64R6-DAG:      dmtc1 $zero, $[[T2:f[0-9]+]]
-; 64R6-DAG:      add.d $f0, $[[T1]], $[[T2]]
+; 32-NOMADD-DAG:        ldc1 $[[T0:f[0-9]+]], 16($sp)
+; 32-NOMADD-DAG:        mul.d $[[T1:f[0-9]+]], $f12, $f14
+; 32-NOMADD-DAG:        sub.d $[[T2:f[0-9]+]], $[[T1]], $[[T0]]
+; 32-NOMADD-DAG:        mtc1 $zero, $[[T2:f[0-9]+]]
+; 32-NOMADD-DAG:        add.d $f0, $[[T1]], $[[T2]]
+
+; 32R2:                 ldc1 $[[T0:f[0-9]+]], 16($sp)
+; 32R2:                 msub.d $[[T1:f[0-9]+]], $[[T0]], $f12, $f14
+; 32R2:                 mtc1 $zero, $[[T2:f[0-9]+]]
+; 32R2:                 mthc1 $zero, $[[T2]]
+; 32R2:                 add.d $f0, $[[T1]], $[[T2]]
+
+; 32R6-NOMADD-DAG:      ldc1 $[[T0:f[0-9]+]], 16($sp)
+; 32R6-NOMADD-DAG:      mul.d $[[T1:f[0-9]+]], $f12, $f14
+; 32R6-NOMADD-DAG:      sub.d $[[T2:f[0-9]+]], $[[T1]], $[[T0]]
+; 32R6-NOMADD-DAG:      mtc1 $zero, $[[T2:f[0-9]+]]
+; 32R6-NOMADD-DAG:      add.d $f0, $[[T1]], $[[T2]]
+
+; 64-DAG:               msub.d $[[T0:f[0-9]+]], $f14, $f12, $f13
+; 64-DAG:               mtc1 $zero, $[[T1:f[0-9]+]]
+; 64-DAG:               add.d $f0, $[[T0]], $[[T1]]
+
+; 64R2:                 msub.d $[[T0:f[0-9]+]], $f14, $f12, $f13
+; 64R2:                 mtc1 $zero, $[[T1:f[0-9]+]]
+; 64R2:                 add.d $f0, $[[T0]], $[[T1]]
+
+; 64R6-NOMADD-DAG:      mul.d $[[T1:f[0-9]+]], $f12, $f13
+; 64R6-NOMADD-DAG:      sub.d $[[T2:f[0-9]+]], $[[T1]], $f14
+; 64R6-NOMADD-DAG:      dmtc1 $zero, $[[T2:f[0-9]+]]
+; 64R6-NOMADD-DAG:      add.d $f0, $[[T1]], $[[T2]]
 
   %mul = fmul double %a, %b
   %sub = fsub double %mul, %c
@@ -270,43 +281,43 @@ define double @FOO12double(double %a, double %b, double %c) nounwind readnone {
 entry:
 ; ALL-LABEL: FOO12double:
 
-; 32-DAG:        ldc1 $[[T0:f[0-9]+]], 16($sp)
-; 32-DAG:        mul.d $[[T1:f[0-9]+]], $f12, $f14
-; 32-DAG:        add.d $[[T2:f[0-9]+]], $[[T1]], $[[T0]]
-; 32-DAG:        mtc1 $zero, $[[T2:f[0-9]+]]
-; 32-DAG:        sub.d $f0, $[[T2]], $[[T1]]
+; 32-NOMADD-DAG:        ldc1 $[[T0:f[0-9]+]], 16($sp)
+; 32-NOMADD-DAG:        mul.d $[[T1:f[0-9]+]], $f12, $f14
+; 32-NOMADD-DAG:        add.d $[[T2:f[0-9]+]], $[[T1]], $[[T0]]
+; 32-NOMADD-DAG:        mtc1 $zero, $[[T2:f[0-9]+]]
+; 32-NOMADD-DAG:        sub.d $f0, $[[T2]], $[[T1]]
 
-; 32R2-NONAN:    ldc1 $[[T0:f[0-9]+]], 16($sp)
-; 32R2-NONAN:    nmadd.d $f0, $[[T0]], $f12, $f14
+; 32R2-NONAN:           ldc1 $[[T0:f[0-9]+]], 16($sp)
+; 32R2-NONAN:           nmadd.d $f0, $[[T0]], $f12, $f14
 
-; 32R2-NAN:      ldc1 $[[T0:f[0-9]+]], 16($sp)
-; 32R2-NAN:      madd.d $[[T1:f[0-9]+]], $[[T0]], $f12, $f14
-; 32R2-NAN:      mtc1 $zero, $[[T2:f[0-9]+]]
-; 32R2-NAN:      mthc1 $zero, $[[T2]]
-; 32R2-NAN:      sub.d $f0, $[[T2]], $[[T1]]
+; 32R2-NAN:             ldc1 $[[T0:f[0-9]+]], 16($sp)
+; 32R2-NAN:             madd.d $[[T1:f[0-9]+]], $[[T0]], $f12, $f14
+; 32R2-NAN:             mtc1 $zero, $[[T2:f[0-9]+]]
+; 32R2-NAN:             mthc1 $zero, $[[T2]]
+; 32R2-NAN:             sub.d $f0, $[[T2]], $[[T1]]
 
-; 32R6-DAG:      ldc1 $[[T0:f[0-9]+]], 16($sp)
-; 32R6-DAG:      mul.d $[[T1:f[0-9]+]], $f12, $f14
-; 32R6-DAG:      add.d $[[T2:f[0-9]+]], $[[T1]], $[[T0]]
-; 32R6-DAG:      mtc1 $zero, $[[T2:f[0-9]+]]
-; 32R6-DAG:      sub.d $f0, $[[T2]], $[[T1]]
+; 32R6-NOMADD-DAG:      ldc1 $[[T0:f[0-9]+]], 16($sp)
+; 32R6-NOMADD-DAG:      mul.d $[[T1:f[0-9]+]], $f12, $f14
+; 32R6-NOMADD-DAG:      add.d $[[T2:f[0-9]+]], $[[T1]], $[[T0]]
+; 32R6-NOMADD-DAG:      mtc1 $zero, $[[T2:f[0-9]+]]
+; 32R6-NOMADD-DAG:      sub.d $f0, $[[T2]], $[[T1]]
 
-; 64-NONAN:      nmadd.d $f0, $f14, $f12, $f13
+; 64-NONAN:             nmadd.d $f0, $f14, $f12, $f13
 
-; 64-NAN:        madd.d $[[T0:f[0-9]+]], $f14, $f12, $f13
-; 64-NAN:        mtc1 $zero, $[[T1:f[0-9]+]]
-; 64-NAN:        sub.d $f0, $[[T1]], $[[T0]]
+; 64-NAN:               madd.d $[[T0:f[0-9]+]], $f14, $f12, $f13
+; 64-NAN:               mtc1 $zero, $[[T1:f[0-9]+]]
+; 64-NAN:               sub.d $f0, $[[T1]], $[[T0]]
 
-; 64R2-NONAN:    nmadd.d $f0, $f14, $f12, $f13
+; 64R2-NONAN:           nmadd.d $f0, $f14, $f12, $f13
 
-; 64R2-NAN:      madd.d $[[T0:f[0-9]+]], $f14, $f12, $f13
-; 64R2-NAN:      mtc1 $zero, $[[T1:f[0-9]+]]
-; 64R2-NAN:      sub.d $f0, $[[T1]], $[[T0]]
+; 64R2-NAN:             madd.d $[[T0:f[0-9]+]], $f14, $f12, $f13
+; 64R2-NAN:             mtc1 $zero, $[[T1:f[0-9]+]]
+; 64R2-NAN:             sub.d $f0, $[[T1]], $[[T0]]
 
-; 64R6-DAG:      mul.d $[[T1:f[0-9]+]], $f12, $f13
-; 64R6-DAG:      add.d $[[T2:f[0-9]+]], $[[T1]], $f14
-; 64R6-DAG:      dmtc1 $zero, $[[T2:f[0-9]+]]
-; 64R6-DAG:      sub.d $f0, $[[T2]], $[[T1]]
+; 64R6-NOMADD-DAG:      mul.d $[[T1:f[0-9]+]], $f12, $f13
+; 64R6-NOMADD-DAG:      add.d $[[T2:f[0-9]+]], $[[T1]], $f14
+; 64R6-NOMADD-DAG:      dmtc1 $zero, $[[T2:f[0-9]+]]
+; 64R6-NOMADD-DAG:      sub.d $f0, $[[T2]], $[[T1]]
 
   %mul = fmul double %a, %b
   %add = fadd double %mul, %c
@@ -318,43 +329,43 @@ define double @FOO13double(double %a, double %b, double %c) nounwind readnone {
 entry:
 ; ALL-LABEL: FOO13double:
 
-; 32-DAG:        ldc1 $[[T0:f[0-9]+]], 16($sp)
-; 32-DAG:        mul.d $[[T1:f[0-9]+]], $f12, $f14
-; 32-DAG:        sub.d $[[T2:f[0-9]+]], $[[T1]], $[[T0]]
-; 32-DAG:        mtc1 $zero, $[[T2:f[0-9]+]]
-; 32-DAG:        sub.d $f0, $[[T2]], $[[T1]]
+; 32-NOMADD-DAG:        ldc1 $[[T0:f[0-9]+]], 16($sp)
+; 32-NOMADD-DAG:        mul.d $[[T1:f[0-9]+]], $f12, $f14
+; 32-NOMADD-DAG:        sub.d $[[T2:f[0-9]+]], $[[T1]], $[[T0]]
+; 32-NOMADD-DAG:        mtc1 $zero, $[[T2:f[0-9]+]]
+; 32-NOMADD-DAG:        sub.d $f0, $[[T2]], $[[T1]]
 
-; 32R2-NONAN:    ldc1 $[[T0:f[0-9]+]], 16($sp)
-; 32R2-NONAN:    nmsub.d $f0, $[[T0]], $f12, $f14
+; 32R2-NONAN:           ldc1 $[[T0:f[0-9]+]], 16($sp)
+; 32R2-NONAN:           nmsub.d $f0, $[[T0]], $f12, $f14
 
-; 32R2-NAN:      ldc1 $[[T0:f[0-9]+]], 16($sp)
-; 32R2-NAN:      msub.d $[[T1:f[0-9]+]], $[[T0]], $f12, $f14
-; 32R2-NAN:      mtc1 $zero, $[[T2:f[0-9]+]]
-; 32R2-NAN:      mthc1 $zero, $[[T2]]
-; 32R2-NAN:      sub.d $f0, $[[T2]], $[[T1]]
+; 32R2-NAN:             ldc1 $[[T0:f[0-9]+]], 16($sp)
+; 32R2-NAN:             msub.d $[[T1:f[0-9]+]], $[[T0]], $f12, $f14
+; 32R2-NAN:             mtc1 $zero, $[[T2:f[0-9]+]]
+; 32R2-NAN:             mthc1 $zero, $[[T2]]
+; 32R2-NAN:             sub.d $f0, $[[T2]], $[[T1]]
 
-; 32R6-DAG:      ldc1 $[[T0:f[0-9]+]], 16($sp)
-; 32R6-DAG:      mul.d $[[T1:f[0-9]+]], $f12, $f14
-; 32R6-DAG:      sub.d $[[T2:f[0-9]+]], $[[T1]], $[[T0]]
-; 32R6-DAG:      mtc1 $zero, $[[T2:f[0-9]+]]
-; 32R6-DAG:      sub.d $f0, $[[T2]], $[[T1]]
+; 32R6-NOMADD-DAG:      ldc1 $[[T0:f[0-9]+]], 16($sp)
+; 32R6-NOMADD-DAG:      mul.d $[[T1:f[0-9]+]], $f12, $f14
+; 32R6-NOMADD-DAG:      sub.d $[[T2:f[0-9]+]], $[[T1]], $[[T0]]
+; 32R6-NOMADD-DAG:      mtc1 $zero, $[[T2:f[0-9]+]]
+; 32R6-NOMADD-DAG:      sub.d $f0, $[[T2]], $[[T1]]
 
-; 64-NONAN:      nmsub.d $f0, $f14, $f12, $f13
+; 64-NONAN:             nmsub.d $f0, $f14, $f12, $f13
 
-; 64-NAN:        msub.d $[[T0:f[0-9]+]], $f14, $f12, $f13
-; 64-NAN:        mtc1 $zero, $[[T1:f[0-9]+]]
-; 64-NAN:        sub.d $f0, $[[T1]], $[[T0]]
+; 64-NAN:               msub.d $[[T0:f[0-9]+]], $f14, $f12, $f13
+; 64-NAN:               mtc1 $zero, $[[T1:f[0-9]+]]
+; 64-NAN:               sub.d $f0, $[[T1]], $[[T0]]
 
-; 64R2-NONAN:    nmsub.d $f0, $f14, $f12, $f13
+; 64R2-NONAN:           nmsub.d $f0, $f14, $f12, $f13
 
-; 64R2-NAN:      msub.d $[[T0:f[0-9]+]], $f14, $f12, $f13
-; 64R2-NAN:      mtc1 $zero, $[[T1:f[0-9]+]]
-; 64R2-NAN:      sub.d $f0, $[[T1]], $[[T0]]
+; 64R2-NAN:             msub.d $[[T0:f[0-9]+]], $f14, $f12, $f13
+; 64R2-NAN:             mtc1 $zero, $[[T1:f[0-9]+]]
+; 64R2-NAN:             sub.d $f0, $[[T1]], $[[T0]]
 
-; 64R6-DAG:      mul.d $[[T1:f[0-9]+]], $f12, $f13
-; 64R6-DAG:      sub.d $[[T2:f[0-9]+]], $[[T1]], $f14
-; 64R6-DAG:      dmtc1 $zero, $[[T2:f[0-9]+]]
-; 64R6-DAG:      sub.d $f0, $[[T2]], $[[T1]]
+; 64R6-NOMADD-DAG:      mul.d $[[T1:f[0-9]+]], $f12, $f13
+; 64R6-NOMADD-DAG:      sub.d $[[T2:f[0-9]+]], $[[T1]], $f14
+; 64R6-NOMADD-DAG:      dmtc1 $zero, $[[T2:f[0-9]+]]
+; 64R6-NOMADD-DAG:      sub.d $f0, $[[T2]], $[[T1]]
 
   %mul = fmul double %a, %b
   %sub = fsub double %mul, %c