[OpenMP] Make OpenMP generated code for the NVIDIA device relocatable by default

author Gheorghe-Teodor Bercea <gheorghe-teod.bercea@ibm.com>

Mon, 7 Aug 2017 20:31:51 +0000 (20:31 +0000)

committer Gheorghe-Teodor Bercea <gheorghe-teod.bercea@ibm.com>

Mon, 7 Aug 2017 20:31:51 +0000 (20:31 +0000)
author Gheorghe-Teodor Bercea <gheorghe-teod.bercea@ibm.com>
Mon, 7 Aug 2017 20:31:51 +0000 (20:31 +0000)
committer Gheorghe-Teodor Bercea <gheorghe-teod.bercea@ibm.com>
Mon, 7 Aug 2017 20:31:51 +0000 (20:31 +0000)
diff --git a/lib/Driver/ToolChains/Cuda.cpp b/lib/Driver/ToolChains/Cuda.cpp

index 70f472fb025f3f9fa6a06a963ddf7c4471f8c37f..927704a685745010b14b0bb3f1c7bf1b3a32d6e0 100644 (file)
--- a/lib/Driver/ToolChains/Cuda.cpp
+++ b/lib/Driver/ToolChains/Cuda.cpp
@@ -291,6 +291,10 @@ void NVPTX::Assembler::ConstructJob(Compilation &C, const JobAction &JA,
    for (const auto& A : Args.getAllArgValues(options::OPT_Xcuda_ptxas))
      CmdArgs.push_back(Args.MakeArgString(A));
  
+  // In OpenMP we need to generate relocatable code.
+  if (JA.isOffloading(Action::OFK_OpenMP))
+    CmdArgs.push_back("-c");
+
    const char *Exec;
    if (Arg *A = Args.getLastArg(options::OPT_ptxas_path_EQ))
      Exec = A->getValue();
diff --git a/test/Driver/openmp-offload.c b/test/Driver/openmp-offload.c

index 37a86aba9426c54b8705edfc166cf7c7f4a77e86..527856d440d6ef60aa946f9ec08e5faea1f95c47 100644 (file)
--- a/test/Driver/openmp-offload.c
+++ b/test/Driver/openmp-offload.c
@@ -669,3 +669,11 @@
  // CHK-TWOCUBIN: clang-offload-bundler" "-type=o" "{{.*}}inputs={{.*}}tmp1.o" "-outputs={{.*}}.o,{{.*}}tmp1-openmp-nvptx64-nvidia-cuda.cubin" "-unbundle"
  // CHK-TWOCUBIN-NEXT: clang-offload-bundler" "-type=o" "{{.*}}inputs={{.*}}tmp2.o" "-outputs={{.*}}.o,{{.*}}tmp2-openmp-nvptx64-nvidia-cuda.cubin" "-unbundle"
  // CHK-TWOCUBIN-NEXT: nvlink" "-o" "{{.*}}-openmp-nvptx64-nvidia-cuda" {{.*}} "openmp-offload.c.tmp1-openmp-nvptx64-nvidia-cuda.cubin" "openmp-offload.c.tmp2-openmp-nvptx64-nvidia-cuda.cubin"
+
+/// ###########################################################################
+
+/// Check PTXAS is passed -c flag when offloading to an NVIDIA device using OpenMP.
+// RUN:   %clang -### -fopenmp=libomp -fopenmp-targets=nvptx64-nvidia-cuda -no-canonical-prefixes %s 2>&1 \
+// RUN:   | FileCheck -check-prefix=CHK-PTXAS-DEFAULT %s
+
+// CHK-PTXAS-DEFAULT: ptxas{{.*}}" "-c"
author	Gheorghe-Teodor Bercea <gheorghe-teod.bercea@ibm.com>
	Mon, 7 Aug 2017 20:31:51 +0000 (20:31 +0000)
committer	Gheorghe-Teodor Bercea <gheorghe-teod.bercea@ibm.com>
	Mon, 7 Aug 2017 20:31:51 +0000 (20:31 +0000)
lib/Driver/ToolChains/Cuda.cpp		patch \| blob \| history
test/Driver/openmp-offload.c		patch \| blob \| history