]> granicus.if.org Git - llvm/commit
[AMDGPU] Enable v4f16 and above for v_pk_fma instructions
authorDavid Stuttard <david.stuttard@amd.com>
Mon, 29 Jul 2019 08:15:10 +0000 (08:15 +0000)
committerDavid Stuttard <david.stuttard@amd.com>
Mon, 29 Jul 2019 08:15:10 +0000 (08:15 +0000)
commit9afdb55893b46486b467feb387976ee774748cac
treef298d01e21cd315261dba6daae978d846e3b4629
parent42a80c679ead022155bd58a9caad7ea795ea95df
[AMDGPU] Enable v4f16 and above for v_pk_fma instructions

Summary:
If isel is presented with <2 x half> vectors then it will correctly select
v_pk_fma style instructions.
If isel is presented with e.g. <4 x half> vectors it will scalarize, unlike for
other instruction types (such as fadd, fmul etc.)

Added extra support to enable this. Updated one of the tests to include a test
for this (as well as extending the test to GFX9)

Subscribers: arsenm, kzhuravl, jvesely, wdng, nhaehnle, yaxunl, tpr, t-tye, llvm-commits

Tags: #llvm

Differential Revision: https://reviews.llvm.org/D65325

Change-Id: I50a4577a3f8223fb53992af3b7d26121f65b71ee

git-svn-id: https://llvm.org/svn/llvm-project/llvm/trunk@367206 91177308-0d34-0410-b5e6-96231b3b80d8
lib/Target/AMDGPU/SIISelLowering.cpp
lib/Target/AMDGPU/SIISelLowering.h
test/CodeGen/AMDGPU/fmac.sdwa.ll
test/CodeGen/AMDGPU/llvm.fma.f16.ll