[OpenMP] Add flag for overwriting default PTX version for OpenMP targets

author Gheorghe-Teodor Bercea <gheorghe-teod.bercea@ibm.com>

Wed, 9 Aug 2017 15:56:54 +0000 (15:56 +0000)

committer Gheorghe-Teodor Bercea <gheorghe-teod.bercea@ibm.com>

Wed, 9 Aug 2017 15:56:54 +0000 (15:56 +0000)
author Gheorghe-Teodor Bercea <gheorghe-teod.bercea@ibm.com>
Wed, 9 Aug 2017 15:56:54 +0000 (15:56 +0000)
committer Gheorghe-Teodor Bercea <gheorghe-teod.bercea@ibm.com>
Wed, 9 Aug 2017 15:56:54 +0000 (15:56 +0000)
diff --git a/include/clang/Driver/Options.td b/include/clang/Driver/Options.td

index c86941181b75cb913c2e2b326e3c0bfe27d57595..a303143850ed1ab1292c88b2d9f2b148e8d8283b 100644 (file)
--- a/include/clang/Driver/Options.td
+++ b/include/clang/Driver/Options.td
@@ -544,6 +544,8 @@ def no_cuda_version_check : Flag<["--"], "no-cuda-version-check">,
  def no_cuda_noopt_device_debug : Flag<["--"], "no-cuda-noopt-device-debug">;
  def cuda_path_EQ : Joined<["--"], "cuda-path=">, Group<i_Group>,
    HelpText<"CUDA installation path">;
+def fopenmp_ptx_EQ : Joined<["--"], "fopenmp-ptx=">, Flags<[DriverOption]>,
+  HelpText<"Pass a PTX version +ptxXX, default +ptx42 (for PTX version 4.2) used by OpenMP device offloading.">;
  def ptxas_path_EQ : Joined<["--"], "ptxas-path=">, Group<i_Group>,
    HelpText<"Path to ptxas (used for compiling CUDA code)">;
  def fcuda_flush_denormals_to_zero : Flag<["-"], "fcuda-flush-denormals-to-zero">,
diff --git a/lib/Driver/ToolChains/Cuda.cpp b/lib/Driver/ToolChains/Cuda.cpp

index 1ff41ce66d446399de7edb88ec522dd866be77bd..b6a7b829f5023830fa347f4a0dac57fcdf489c52 100644 (file)
--- a/lib/Driver/ToolChains/Cuda.cpp
+++ b/lib/Driver/ToolChains/Cuda.cpp
@@ -481,7 +481,13 @@ void CudaToolChain::addClangTargetOptions(
    // than LLVM defaults to. Use PTX4.2 which is the PTX version that
    // came with CUDA-7.0.
    CC1Args.push_back("-target-feature");
-  CC1Args.push_back("+ptx42");
+
+  if (DeviceOffloadingKind == Action::OFK_OpenMP)
+    CC1Args.push_back(
+        DriverArgs.getLastArgValue(options::OPT_fopenmp_ptx_EQ,
+                                   "+ptx42").data());
+  else
+    CC1Args.push_back("+ptx42");
  }
  
  void CudaToolChain::AddCudaIncludeArgs(const ArgList &DriverArgs,
diff --git a/test/Driver/openmp-offload.c b/test/Driver/openmp-offload.c

index cd2ca3e3d6e33ec0f7e8504fc2a1c29d909fe3f8..30dd1ea2ab07d5a63b8b0503560e711219e3eb8e 100644 (file)
--- a/test/Driver/openmp-offload.c
+++ b/test/Driver/openmp-offload.c
@@ -699,7 +699,7 @@
  /// ###########################################################################
  
  /// PTXAS is passed -c flag by default when offloading to an NVIDIA device using OpenMP - disable it.
-// RUN:   %clang -### -fopenmp=libomp -fopenmp-targets=nvptx64-nvidia-cuda -fnoopenmp-relocatable-target -save-temps -no-canonical-prefixes %s 2>&1 \
+// RUN:   %clang -### -fopenmp=libomp -fopenmp-targets=nvptx64-nvidia-cuda -fnoopenmp-relocatable-target -no-canonical-prefixes %s 2>&1 \
  // RUN:   | FileCheck -check-prefix=CHK-PTXAS-NORELO %s
  
  // CHK-PTXAS-NORELO-NOT: ptxas{{.*}}" "-c"
@@ -708,7 +708,17 @@
  
  /// PTXAS is passed -c flag by default when offloading to an NVIDIA device using OpenMP
  /// Check that the flag is passed when -fopenmp-relocatable-target is used.
-// RUN:   %clang -### -fopenmp=libomp -fopenmp-targets=nvptx64-nvidia-cuda -fopenmp-relocatable-target -save-temps -no-canonical-prefixes %s 2>&1 \
+// RUN:   %clang -### -fopenmp=libomp -fopenmp-targets=nvptx64-nvidia-cuda -fopenmp-relocatable-target -no-canonical-prefixes %s 2>&1 \
  // RUN:   | FileCheck -check-prefix=CHK-PTXAS-RELO %s
  
  // CHK-PTXAS-RELO: ptxas{{.*}}" "-c"
+
+/// ###########################################################################
+
+/// Check PTXAS is passed the compute capability passed to the driver.
+// RUN:   %clang -### -fopenmp=libomp -fopenmp-targets=nvptx64-nvidia-cuda --fopenmp-ptx=+ptx52 -save-temps -no-canonical-prefixes %s 2>&1 \
+// RUN:   | FileCheck -check-prefix=CHK-PTXAS-VERSION %s
+
+// CHK-PTXAS-VERSION: clang{{.*}}.bc" {{.*}}"-target-feature" "+ptx52"
+// CHK-PTXAS-VERSION-NEXT: clang{{.*}}.bc" {{.*}}"-target-feature" "+ptx52"
+// CHK-PTXAS-VERSION-NEXT: clang{{.*}}.bc" {{.*}}"-target-feature" "+ptx52"
author	Gheorghe-Teodor Bercea <gheorghe-teod.bercea@ibm.com>
	Wed, 9 Aug 2017 15:56:54 +0000 (15:56 +0000)
committer	Gheorghe-Teodor Bercea <gheorghe-teod.bercea@ibm.com>
	Wed, 9 Aug 2017 15:56:54 +0000 (15:56 +0000)
include/clang/Driver/Options.td		patch \| blob \| history
lib/Driver/ToolChains/Cuda.cpp		patch \| blob \| history
test/Driver/openmp-offload.c		patch \| blob \| history