[NEON] Support vrndns_f32 intrinsic

author Ivan A. Kosarev <ikosarev@accesssoftek.com>

Fri, 13 Apr 2018 12:46:02 +0000 (12:46 +0000)

committer Ivan A. Kosarev <ikosarev@accesssoftek.com>

Fri, 13 Apr 2018 12:46:02 +0000 (12:46 +0000)
author Ivan A. Kosarev <ikosarev@accesssoftek.com>
Fri, 13 Apr 2018 12:46:02 +0000 (12:46 +0000)
committer Ivan A. Kosarev <ikosarev@accesssoftek.com>
Fri, 13 Apr 2018 12:46:02 +0000 (12:46 +0000)
diff --git a/include/clang/Basic/arm_neon.td b/include/clang/Basic/arm_neon.td

index 94d39e92f23b4dedcd7b74d862be8b843412395e..afa2d32ef04fd1ce89f71991451826974cd34898 100644 (file)
--- a/include/clang/Basic/arm_neon.td
+++ b/include/clang/Basic/arm_neon.td
@@ -1115,6 +1115,12 @@ def SCALAR_FCVTZS_N_S64 : SInst<"vcvt_n_s64", "$si", "Sd">;
  def SCALAR_FCVTZU_N_U64 : SInst<"vcvt_n_u64", "bsi", "Sd">;
  }
  
+////////////////////////////////////////////////////////////////////////////////
+// Scalar Floating-point Round to Integral
+let ArchGuard = "__ARM_ARCH >= 8 && defined(__ARM_FEATURE_DIRECTED_ROUNDING)" in {
+def SCALAR_FRINTN_S32 : SInst<"vrndn", "ss", "Sf">;
+}
+
  ////////////////////////////////////////////////////////////////////////////////
  // Scalar Reduce Pairwise Addition (Scalar and Floating Point)
  def SCALAR_ADDP  : SInst<"vpadd", "sd", "SfSHlSHdSHUl">;
diff --git a/lib/CodeGen/CGBuiltin.cpp b/lib/CodeGen/CGBuiltin.cpp

index 4baa5aff72ed79b645694c3ce1c372e36b617a24..e194a5de5e446cdd15f82e562d2b13583533c9e9 100644 (file)
--- a/lib/CodeGen/CGBuiltin.cpp
+++ b/lib/CodeGen/CGBuiltin.cpp
@@ -5590,6 +5590,12 @@ Value *CodeGenFunction::EmitARMBuiltinExpr(unsigned BuiltinID,
    case NEON::BI__builtin_neon_vgetq_lane_f32:
      return Builder.CreateExtractElement(Ops[0], Ops[1], "vget_lane");
  
+  case NEON::BI__builtin_neon_vrndns_f32: {
+    Value *Arg = EmitScalarExpr(E->getArg(0));
+    llvm::Type *Tys[] = {Arg->getType()};
+    Function *F = CGM.getIntrinsic(Intrinsic::arm_neon_vrintn, Tys);
+    return Builder.CreateCall(F, {Arg}, "vrndn"); }
+
    case NEON::BI__builtin_neon_vset_lane_i8:
    case NEON::BI__builtin_neon_vset_lane_i16:
    case NEON::BI__builtin_neon_vset_lane_i32:
diff --git a/test/CodeGen/arm-neon-directed-rounding.c b/test/CodeGen/arm-neon-directed-rounding.c

index b06808a77cd11e166c51c19b7603cefd073077ee..9f30ac7cb0a81f259fefb16c931d89a128200068 100644 (file)
--- a/test/CodeGen/arm-neon-directed-rounding.c
+++ b/test/CodeGen/arm-neon-directed-rounding.c
@@ -1,4 +1,6 @@
-// RUN: %clang_cc1 -triple thumbv8-linux-gnueabihf -target-cpu cortex-a57 -ffreestanding -disable-O0-optnone -emit-llvm %s -o - | opt -S -mem2reg | FileCheck %s
+// RUN: %clang_cc1 -triple thumbv8-linux-gnueabihf -target-cpu cortex-a57 \
+// RUN:     -ffreestanding -disable-O0-optnone -emit-llvm %s -o - | \
+// RUN:     opt -S -mem2reg | FileCheck %s
  
  #include <arm_neon.h>
  
@@ -85,3 +87,10 @@ float32x2_t test_vrnd_f32(float32x2_t a) {
  float32x4_t test_vrndq_f32(float32x4_t a) {
    return vrndq_f32(a);
  }
+
+// CHECK-LABEL: define float @test_vrndns_f32(float %a) #0 {
+// CHECK:   [[VRNDN_I:%.*]] = call float @llvm.arm.neon.vrintn.f32(float %a) #2
+// CHECK:   ret float [[VRNDN_I]]
+float32_t test_vrndns_f32(float32_t a) {
+  return vrndns_f32(a);
+}
author	Ivan A. Kosarev <ikosarev@accesssoftek.com>
	Fri, 13 Apr 2018 12:46:02 +0000 (12:46 +0000)
committer	Ivan A. Kosarev <ikosarev@accesssoftek.com>
	Fri, 13 Apr 2018 12:46:02 +0000 (12:46 +0000)
include/clang/Basic/arm_neon.td		patch \| blob \| history
lib/CodeGen/CGBuiltin.cpp		patch \| blob \| history
test/CodeGen/arm-neon-directed-rounding.c		patch \| blob \| history