Merging r293259:

author Hans Wennborg <hans@hanshq.net>

Fri, 27 Jan 2017 17:13:59 +0000 (17:13 +0000)

committer Hans Wennborg <hans@hanshq.net>

Fri, 27 Jan 2017 17:13:59 +0000 (17:13 +0000)
author Hans Wennborg <hans@hanshq.net>
Fri, 27 Jan 2017 17:13:59 +0000 (17:13 +0000)
committer Hans Wennborg <hans@hanshq.net>
Fri, 27 Jan 2017 17:13:59 +0000 (17:13 +0000)
diff --git a/lib/Target/ARM/ARMISelLowering.cpp b/lib/Target/ARM/ARMISelLowering.cpp

index fb4c689bcb5981f72144550672d1f74b8356bf2d..1606c157646571ccb0a36e75a32f82c4ac6c0232 100644 (file)
--- a/lib/Target/ARM/ARMISelLowering.cpp
+++ b/lib/Target/ARM/ARMISelLowering.cpp
@@ -7571,11 +7571,11 @@ SDValue ARMTargetLowering::LowerOperation(SDValue Op, SelectionDAG &DAG) const {
    case ISD::FLT_ROUNDS_:   return LowerFLT_ROUNDS_(Op, DAG);
    case ISD::MUL:           return LowerMUL(Op, DAG);
    case ISD::SDIV:
-    if (Subtarget->isTargetWindows())
+    if (Subtarget->isTargetWindows() && !Op.getValueType().isVector())
        return LowerDIV_Windows(Op, DAG, /* Signed */ true);
      return LowerSDIV(Op, DAG);
    case ISD::UDIV:
-    if (Subtarget->isTargetWindows())
+    if (Subtarget->isTargetWindows() && !Op.getValueType().isVector())
        return LowerDIV_Windows(Op, DAG, /* Signed */ false);
      return LowerUDIV(Op, DAG);
    case ISD::ADDC:
diff --git a/test/CodeGen/ARM/neon_div.ll b/test/CodeGen/ARM/neon_div.ll

index e185c2a8afbcda42bb06b633c8bb550f35a91698..23b626e0ce51615dbb09efa6cf9fe6e36a43a80a 100644 (file)
--- a/test/CodeGen/ARM/neon_div.ll
+++ b/test/CodeGen/ARM/neon_div.ll
@@ -1,49 +1,58 @@
-; RUN: llc -mtriple=arm-eabi -mattr=+neon -pre-RA-sched=source -disable-post-ra %s -o - \
-; RUN:  | FileCheck %s
+; RUN: llc -mtriple arm-eabi -mattr=+neon -disable-post-ra -pre-RA-sched source %s -o - | FileCheck %s
+; RUN: llc -mtriple thumbv7-windows-itanium -mattr=+neon -disable-post-ra -pre-RA-sched source %s -o - | FileCheck %s
  
  define <8 x i8> @sdivi8(<8 x i8>* %A, <8 x i8>* %B) nounwind {
-;CHECK: vrecpe.f32
-;CHECK: vmovn.i32
-;CHECK: vrecpe.f32
-;CHECK: vmovn.i32
-;CHECK: vmovn.i16
-       %tmp1 = load <8 x i8>, <8 x i8>* %A
-       %tmp2 = load <8 x i8>, <8 x i8>* %B
-       %tmp3 = sdiv <8 x i8> %tmp1, %tmp2
-       ret <8 x i8> %tmp3
+  %tmp1 = load <8 x i8>, <8 x i8>* %A
+  %tmp2 = load <8 x i8>, <8 x i8>* %B
+  %tmp3 = sdiv <8 x i8> %tmp1, %tmp2
+  ret <8 x i8> %tmp3
  }
  
+; CHECK-LABEL: sdivi8:
+; CHECK: vrecpe.f32
+; CHECK: vmovn.i32
+; CHECK: vrecpe.f32
+; CHECK: vmovn.i32
+; CHECK: vmovn.i16
+
  define <8 x i8> @udivi8(<8 x i8>* %A, <8 x i8>* %B) nounwind {
-;CHECK: vrecpe.f32
-;CHECK: vrecps.f32
-;CHECK: vmovn.i32
-;CHECK: vrecpe.f32
-;CHECK: vrecps.f32
-;CHECK: vmovn.i32
-;CHECK: vqmovun.s16
-       %tmp1 = load <8 x i8>, <8 x i8>* %A
-       %tmp2 = load <8 x i8>, <8 x i8>* %B
-       %tmp3 = udiv <8 x i8> %tmp1, %tmp2
-       ret <8 x i8> %tmp3
+  %tmp1 = load <8 x i8>, <8 x i8>* %A
+  %tmp2 = load <8 x i8>, <8 x i8>* %B
+  %tmp3 = udiv <8 x i8> %tmp1, %tmp2
+  ret <8 x i8> %tmp3
  }
  
+; CHECK-LABEL: udivi8:
+; CHECK: vrecpe.f32
+; CHECK: vrecps.f32
+; CHECK: vmovn.i32
+; CHECK: vrecpe.f32
+; CHECK: vrecps.f32
+; CHECK: vmovn.i32
+; CHECK: vqmovun.s16
+
  define <4 x i16> @sdivi16(<4 x i16>* %A, <4 x i16>* %B) nounwind {
-;CHECK: vrecpe.f32
-;CHECK: vrecps.f32
-;CHECK: vmovn.i32
-       %tmp1 = load <4 x i16>, <4 x i16>* %A
-       %tmp2 = load <4 x i16>, <4 x i16>* %B
-       %tmp3 = sdiv <4 x i16> %tmp1, %tmp2
-       ret <4 x i16> %tmp3
+  %tmp1 = load <4 x i16>, <4 x i16>* %A
+  %tmp2 = load <4 x i16>, <4 x i16>* %B
+  %tmp3 = sdiv <4 x i16> %tmp1, %tmp2
+  ret <4 x i16> %tmp3
  }
  
+; CHECK-LABEL: sdivi16:
+; CHECK: vrecpe.f32
+; CHECK: vrecps.f32
+; CHECK: vmovn.i32
+
  define <4 x i16> @udivi16(<4 x i16>* %A, <4 x i16>* %B) nounwind {
-;CHECK: vrecpe.f32
-;CHECK: vrecps.f32
-;CHECK: vrecps.f32
-;CHECK: vmovn.i32
-       %tmp1 = load <4 x i16>, <4 x i16>* %A
-       %tmp2 = load <4 x i16>, <4 x i16>* %B
-       %tmp3 = udiv <4 x i16> %tmp1, %tmp2
-       ret <4 x i16> %tmp3
+  %tmp1 = load <4 x i16>, <4 x i16>* %A
+  %tmp2 = load <4 x i16>, <4 x i16>* %B
+  %tmp3 = udiv <4 x i16> %tmp1, %tmp2
+  ret <4 x i16> %tmp3
  }
+
+; CHECK-LABEL: udivi16:
+; CHECK: vrecpe.f32
+; CHECK: vrecps.f32
+; CHECK: vrecps.f32
+; CHECK: vmovn.i32
+
author	Hans Wennborg <hans@hanshq.net>
	Fri, 27 Jan 2017 17:13:59 +0000 (17:13 +0000)
committer	Hans Wennborg <hans@hanshq.net>
	Fri, 27 Jan 2017 17:13:59 +0000 (17:13 +0000)
lib/Target/ARM/ARMISelLowering.cpp		patch \| blob \| history
test/CodeGen/ARM/neon_div.ll		patch \| blob \| history