[Aarch64] Add v8.2-a half precision element extract intrinsics

author Diogo N. Sampaio <diogo.sampaio@arm.com>

Fri, 12 Apr 2019 10:43:48 +0000 (10:43 +0000)

committer Diogo N. Sampaio <diogo.sampaio@arm.com>

Fri, 12 Apr 2019 10:43:48 +0000 (10:43 +0000)
author Diogo N. Sampaio <diogo.sampaio@arm.com>
Fri, 12 Apr 2019 10:43:48 +0000 (10:43 +0000)
committer Diogo N. Sampaio <diogo.sampaio@arm.com>
Fri, 12 Apr 2019 10:43:48 +0000 (10:43 +0000)
diff --git a/lib/CodeGen/CGBuiltin.cpp b/lib/CodeGen/CGBuiltin.cpp

index 6b7ed4e8bfdb0c46d883c1e4ef40acb3fe924f66..02969a1908b07873ed655afd4e4879fe64dc0bc7 100644 (file)
--- a/lib/CodeGen/CGBuiltin.cpp
+++ b/lib/CodeGen/CGBuiltin.cpp
@@ -7847,6 +7847,14 @@ Value *CodeGenFunction::EmitAArch64BuiltinExpr(unsigned BuiltinID,
                            : Intrinsic::aarch64_neon_sqsub;
      return EmitNeonCall(CGM.getIntrinsic(AccInt, Int64Ty), Ops, "vqdmlXl");
    }
+  case NEON::BI__builtin_neon_vduph_lane_f16: {
+    return Builder.CreateExtractElement(Ops[0], EmitScalarExpr(E->getArg(1)),
+                                        "vget_lane");
+  }
+  case NEON::BI__builtin_neon_vduph_laneq_f16: {
+    return Builder.CreateExtractElement(Ops[0], EmitScalarExpr(E->getArg(1)),
+                                        "vgetq_lane");
+  }
    }
  
    llvm::VectorType *VTy = GetNeonType(this, Type);
diff --git a/test/CodeGen/aarch64-v8.2a-neon-intrinsics.c b/test/CodeGen/aarch64-v8.2a-neon-intrinsics.c

index a4bf8753363064db58b217a6435c286c7de96295..a84445b62a24e57b70cf7d5f51b26050124c2958 100644 (file)
--- a/test/CodeGen/aarch64-v8.2a-neon-intrinsics.c
+++ b/test/CodeGen/aarch64-v8.2a-neon-intrinsics.c
@@ -1618,3 +1618,16 @@ float16x8_t test_vtrn2q_f16(float16x8_t a, float16x8_t b) {
    return vtrn2q_f16(a, b);
  }
  
+// CHECK-LABEL: @test_vduph_laneq_f16(
+// CHECK:        [[V:%.*]] = extractelement <8 x half> [[V2:%.*]], i32 7
+// CHECK-NEXT:   ret half [[V]]
+float16_t test_vduph_laneq_f16(float16x8_t vec) {
+  return vduph_laneq_f16(vec, 7);
+}
+
+// CHECK-LABEL: @test_vduph_lane_f16(
+// CHECK:        [[V:%.*]] = extractelement <4 x half> [[V2:%.*]], i32 3
+// CHECK-NEXT:   ret half [[V]]
+float16_t test_vduph_lane_f16(float16x4_t vec) {
+  return vduph_lane_f16(vec, 3);
+}
author	Diogo N. Sampaio <diogo.sampaio@arm.com>
	Fri, 12 Apr 2019 10:43:48 +0000 (10:43 +0000)
committer	Diogo N. Sampaio <diogo.sampaio@arm.com>
	Fri, 12 Apr 2019 10:43:48 +0000 (10:43 +0000)
lib/CodeGen/CGBuiltin.cpp		patch \| blob \| history
test/CodeGen/aarch64-v8.2a-neon-intrinsics.c		patch \| blob \| history