[Driver] Driver changes to support CUDA compilation on Windows.

author Justin Lebar <jlebar@google.com>

Thu, 5 Jan 2017 16:52:29 +0000 (16:52 +0000)

committer Justin Lebar <jlebar@google.com>

Thu, 5 Jan 2017 16:52:29 +0000 (16:52 +0000)
author Justin Lebar <jlebar@google.com>
Thu, 5 Jan 2017 16:52:29 +0000 (16:52 +0000)
committer Justin Lebar <jlebar@google.com>
Thu, 5 Jan 2017 16:52:29 +0000 (16:52 +0000)
diff --git a/include/clang/Driver/ToolChain.h b/include/clang/Driver/ToolChain.h

index cca239c4be2a688e6054ef6561db1f66f23874f0..ffb0d60a6398969e12acc93a9b2320836ca041b4 100644 (file)
--- a/include/clang/Driver/ToolChain.h
+++ b/include/clang/Driver/ToolChain.h
@@ -139,6 +139,13 @@ public:
    vfs::FileSystem &getVFS() const;
    const llvm::Triple &getTriple() const { return Triple; }
  
+  /// Get the toolchain's aux triple, if it has one.
+  ///
+  /// Exactly what the aux triple represents depends on the toolchain, but for
+  /// example when compiling CUDA code for the GPU, the triple might be NVPTX,
+  /// while the aux triple is the host (CPU) toolchain, e.g. x86-linux-gnu.
+  virtual const llvm::Triple *getAuxTriple() const { return nullptr; }
+
    llvm::Triple::ArchType getArch() const { return Triple.getArch(); }
    StringRef getArchName() const { return Triple.getArchName(); }
    StringRef getPlatform() const { return Triple.getVendorName(); }
diff --git a/lib/Driver/MSVCToolChain.cpp b/lib/Driver/MSVCToolChain.cpp

index 95cf056f7a741d7a0c849d95aec13d85c0a586f1..17fd6ac6f714bf99b46dd12af524a1551afa4e86 100644 (file)
--- a/lib/Driver/MSVCToolChain.cpp
+++ b/lib/Driver/MSVCToolChain.cpp
@@ -47,9 +47,9 @@ using namespace clang::driver::toolchains;
  using namespace clang;
  using namespace llvm::opt;
  
-MSVCToolChain::MSVCToolChain(const Driver &D, const llvm::Triple& Triple,
+MSVCToolChain::MSVCToolChain(const Driver &D, const llvm::Triple &Triple,
                               const ArgList &Args)
-  : ToolChain(D, Triple, Args) {
+    : ToolChain(D, Triple, Args), CudaInstallation(D, Triple, Args) {
    getProgramPaths().push_back(getDriver().getInstalledDir());
    if (getDriver().getInstalledDir() != getDriver().Dir)
      getProgramPaths().push_back(getDriver().Dir);
@@ -94,6 +94,15 @@ bool MSVCToolChain::isPICDefaultForced() const {
    return getArch() == llvm::Triple::x86_64;
  }
  
+void MSVCToolChain::AddCudaIncludeArgs(const ArgList &DriverArgs,
+                                       ArgStringList &CC1Args) const {
+  CudaInstallation.AddCudaIncludeArgs(DriverArgs, CC1Args);
+}
+
+void MSVCToolChain::printVerboseInfo(raw_ostream &OS) const {
+  CudaInstallation.print(OS);
+}
+
  #ifdef USE_WIN32
  static bool readFullStringValue(HKEY hkey, const char *valueName,
                                  std::string &value) {
diff --git a/lib/Driver/MinGWToolChain.cpp b/lib/Driver/MinGWToolChain.cpp

index 938440b08f602fa43f13c9d92bb16d3d900ae0a5..2c8aa93047ae43e618c301d3da7af49e8318bcb0 100644 (file)
--- a/lib/Driver/MinGWToolChain.cpp
+++ b/lib/Driver/MinGWToolChain.cpp
@@ -63,7 +63,7 @@ void MinGW::findGccLibDir() {
  }
  
  MinGW::MinGW(const Driver &D, const llvm::Triple &Triple, const ArgList &Args)
-    : ToolChain(D, Triple, Args) {
+    : ToolChain(D, Triple, Args), CudaInstallation(D, Triple, Args) {
    getProgramPaths().push_back(getDriver().getInstalledDir());
  
  // In Windows there aren't any standard install locations, we search
@@ -135,6 +135,15 @@ bool MinGW::UseSEHExceptions() const {
    return getArch() == llvm::Triple::x86_64;
  }
  
+void MinGW::AddCudaIncludeArgs(const ArgList &DriverArgs,
+                               ArgStringList &CC1Args) const {
+  CudaInstallation.AddCudaIncludeArgs(DriverArgs, CC1Args);
+}
+
+void MinGW::printVerboseInfo(raw_ostream &OS) const {
+  CudaInstallation.print(OS);
+}
+
  // Include directories for various hosts:
  
  // Windows, mingw.org
diff --git a/lib/Driver/ToolChains.cpp b/lib/Driver/ToolChains.cpp

index 8815c1320164a403a02995db67bac03381a41a01..789a2f0525be98a3ab656bd084076dd97fc7eec5 100644 (file)
--- a/lib/Driver/ToolChains.cpp
+++ b/lib/Driver/ToolChains.cpp
@@ -1810,14 +1810,21 @@ CudaInstallationDetector::CudaInstallationDetector(
      : D(D) {
    SmallVector<std::string, 4> CudaPathCandidates;
  
-  if (Args.hasArg(options::OPT_cuda_path_EQ))
+  // In decreasing order so we prefer newer versions to older versions.
+  std::initializer_list<const char *> Versions = {"8.0", "7.5", "7.0"};
+
+  if (Args.hasArg(options::OPT_cuda_path_EQ)) {
      CudaPathCandidates.push_back(
          Args.getLastArgValue(options::OPT_cuda_path_EQ));
-  else {
+  } else if (HostTriple.isOSWindows()) {
+    for (const char *Ver : Versions)
+      CudaPathCandidates.push_back(
+          D.SysRoot + "/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v" +
+          Ver);
+  } else {
      CudaPathCandidates.push_back(D.SysRoot + "/usr/local/cuda");
-    CudaPathCandidates.push_back(D.SysRoot + "/usr/local/cuda-8.0");
-    CudaPathCandidates.push_back(D.SysRoot + "/usr/local/cuda-7.5");
-    CudaPathCandidates.push_back(D.SysRoot + "/usr/local/cuda-7.0");
+    for (const char *Ver : Versions)
+      CudaPathCandidates.push_back(D.SysRoot + "/usr/local/cuda-" + Ver);
    }
  
    for (const auto &CudaPath : CudaPathCandidates) {
@@ -5021,6 +5028,11 @@ SanitizerMask CudaToolChain::getSupportedSanitizers() const {
    return HostTC.getSupportedSanitizers();
  }
  
+VersionTuple CudaToolChain::computeMSVCVersion(const Driver *D,
+                                               const ArgList &Args) const {
+  return HostTC.computeMSVCVersion(D, Args);
+}
+
  /// XCore tool chain
  XCoreToolChain::XCoreToolChain(const Driver &D, const llvm::Triple &Triple,
                                 const ArgList &Args)
diff --git a/lib/Driver/ToolChains.h b/lib/Driver/ToolChains.h

index f43db7a24d547234dae8a6d471c0706f02131af9..3240357ba6b1f75862ad238f41fb7cc66bb76f75 100644 (file)
--- a/lib/Driver/ToolChains.h
+++ b/lib/Driver/ToolChains.h
@@ -709,12 +709,19 @@ public:
        const llvm::opt::ArgList &DriverArgs,
        llvm::opt::ArgStringList &CC1Args) const override;
  
+  void AddCudaIncludeArgs(const llvm::opt::ArgList &DriverArgs,
+                          llvm::opt::ArgStringList &CC1Args) const override;
+
+  void printVerboseInfo(raw_ostream &OS) const override;
+
  protected:
    Tool *getTool(Action::ActionClass AC) const override;
    Tool *buildLinker() const override;
    Tool *buildAssembler() const override;
  
  private:
+  CudaInstallationDetector CudaInstallation;
+
    std::string Base;
    std::string GccLibDir;
    std::string Ver;
@@ -892,6 +899,10 @@ public:
    CudaToolChain(const Driver &D, const llvm::Triple &Triple,
                  const ToolChain &HostTC, const llvm::opt::ArgList &Args);
  
+  virtual const llvm::Triple *getAuxTriple() const override {
+    return &HostTC.getTriple();
+  }
+
    llvm::opt::DerivedArgList *
    TranslateArgs(const llvm::opt::DerivedArgList &Args, StringRef BoundArch,
                  Action::OffloadKind DeviceOffloadKind) const override;
@@ -924,6 +935,10 @@ public:
  
    SanitizerMask getSupportedSanitizers() const override;
  
+  VersionTuple
+  computeMSVCVersion(const Driver *D,
+                     const llvm::opt::ArgList &Args) const override;
+
    const ToolChain &HostTC;
    CudaInstallationDetector CudaInstallation;
  
@@ -1147,6 +1162,9 @@ public:
        const llvm::opt::ArgList &DriverArgs,
        llvm::opt::ArgStringList &CC1Args) const override;
  
+  void AddCudaIncludeArgs(const llvm::opt::ArgList &DriverArgs,
+                          llvm::opt::ArgStringList &CC1Args) const override;
+
    bool getWindowsSDKDir(std::string &path, int &major,
                          std::string &windowsSDKIncludeVersion,
                          std::string &windowsSDKLibVersion) const;
@@ -1166,6 +1184,8 @@ public:
                                            types::ID InputType) const override;
    SanitizerMask getSupportedSanitizers() const override;
  
+  void printVerboseInfo(raw_ostream &OS) const override;
+
  protected:
    void AddSystemIncludeWithSubfolder(const llvm::opt::ArgList &DriverArgs,
                                       llvm::opt::ArgStringList &CC1Args,
@@ -1179,6 +1199,8 @@ protected:
  private:
    VersionTuple getMSVCVersionFromTriple() const;
    VersionTuple getMSVCVersionFromExe() const;
+
+  CudaInstallationDetector CudaInstallation;
  };
  
  class LLVM_LIBRARY_VISIBILITY CrossWindowsToolChain : public Generic_GCC {
diff --git a/lib/Driver/Tools.cpp b/lib/Driver/Tools.cpp

index 62ac95a8697542e050f39a8c2a4051cf327366db..8e02d45fcc4a462bf0a3d88c949b5ed863469fca 100644 (file)
--- a/lib/Driver/Tools.cpp
+++ b/lib/Driver/Tools.cpp
@@ -4086,13 +4086,6 @@ void Clang::ConstructJob(Compilation &C, const JobAction &JA,
    const Driver &D = getToolChain().getDriver();
    ArgStringList CmdArgs;
  
-  bool IsWindowsGNU = getToolChain().getTriple().isWindowsGNUEnvironment();
-  bool IsWindowsCygnus =
-      getToolChain().getTriple().isWindowsCygwinEnvironment();
-  bool IsWindowsMSVC = getToolChain().getTriple().isWindowsMSVCEnvironment();
-  bool IsPS4CPU = getToolChain().getTriple().isPS4CPU();
-  bool IsIAMCU = getToolChain().getTriple().isOSIAMCU();
-
    // Check number of inputs for sanity. We need at least one input.
    assert(Inputs.size() >= 1 && "Must have at least one input.");
    const InputInfo &Input = Inputs[0];
@@ -4106,6 +4099,23 @@ void Clang::ConstructJob(Compilation &C, const JobAction &JA,
            Inputs.size() == 1) &&
           "Unable to handle multiple inputs.");
  
+  bool IsWindowsGNU = getToolChain().getTriple().isWindowsGNUEnvironment();
+  bool IsWindowsCygnus =
+      getToolChain().getTriple().isWindowsCygwinEnvironment();
+  bool IsWindowsMSVC = getToolChain().getTriple().isWindowsMSVCEnvironment();
+  bool IsPS4CPU = getToolChain().getTriple().isPS4CPU();
+  bool IsIAMCU = getToolChain().getTriple().isOSIAMCU();
+
+  // Adjust IsWindowsXYZ for CUDA compilations.  Even when compiling in device
+  // mode (i.e., getToolchain().getTriple() is NVPTX, not Windows), we need to
+  // pass Windows-specific flags to cc1.
+  if (IsCuda) {
+    const llvm::Triple *AuxTriple = getToolChain().getAuxTriple();
+    IsWindowsMSVC |= AuxTriple && AuxTriple->isWindowsMSVCEnvironment();
+    IsWindowsGNU |= AuxTriple && AuxTriple->isWindowsGNUEnvironment();
+    IsWindowsCygnus |= AuxTriple && AuxTriple->isWindowsCygwinEnvironment();
+  }
+
    // C++ is not supported for IAMCU.
    if (IsIAMCU && types::isCXX(Input.getType()))
      D.Diag(diag::err_drv_clang_unsupported) << "C++ for IAMCU";
diff --git a/test/Driver/Inputs/CUDA-windows/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v8.0/bin/.keep b/test/Driver/Inputs/CUDA-windows/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v8.0/bin/.keep

new file mode 100644 (file)

index 0000000..e69de29
diff --git a/test/Driver/Inputs/CUDA-windows/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v8.0/include/.keep b/test/Driver/Inputs/CUDA-windows/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v8.0/include/.keep

new file mode 100644 (file)

index 0000000..e69de29
diff --git a/test/Driver/Inputs/CUDA-windows/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v8.0/lib/.keep b/test/Driver/Inputs/CUDA-windows/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v8.0/lib/.keep

new file mode 100644 (file)

index 0000000..e69de29
diff --git a/test/Driver/Inputs/CUDA-windows/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v8.0/nvvm/libdevice/libdevice.compute_30.10.bc b/test/Driver/Inputs/CUDA-windows/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v8.0/nvvm/libdevice/libdevice.compute_30.10.bc

new file mode 100644 (file)

index 0000000..e69de29
diff --git a/test/Driver/Inputs/CUDA-windows/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v8.0/nvvm/libdevice/libdevice.compute_35.10.bc b/test/Driver/Inputs/CUDA-windows/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v8.0/nvvm/libdevice/libdevice.compute_35.10.bc

new file mode 100644 (file)

index 0000000..e69de29
diff --git a/test/Driver/cuda-windows.cu b/test/Driver/cuda-windows.cu

new file mode 100644 (file)

index 0000000..1d67710
--- /dev/null
+++ b/test/Driver/cuda-windows.cu
@@ -0,0 +1,14 @@
+// REQUIRES: clang-driver
+// REQUIRES: x86-registered-target
+// REQUIRES: nvptx-registered-target
+//
+// RUN: %clang -v --target=i386-pc-windows-msvc \
+// RUN:   --sysroot=%S/Inputs/CUDA-windows 2>&1 %s -### | FileCheck %s
+// RUN: %clang -v --target=i386-pc-windows-mingw32 \
+// RUN:   --sysroot=%S/Inputs/CUDA-windows 2>&1 %s -### | FileCheck %s
+
+// CHECK: Found CUDA installation: {{.*}}/Inputs/CUDA-windows/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v8.0
+// CHECK: "-cc1" "-triple" "nvptx-nvidia-cuda"
+// CHECK-SAME: "-fms-extensions"
+// CHECK-SAME: "-fms-compatibility"
+// CHECK-SAME: "-fms-compatibility-version=
author	Justin Lebar <jlebar@google.com>
	Thu, 5 Jan 2017 16:52:29 +0000 (16:52 +0000)
committer	Justin Lebar <jlebar@google.com>
	Thu, 5 Jan 2017 16:52:29 +0000 (16:52 +0000)
include/clang/Driver/ToolChain.h		patch \| blob \| history
lib/Driver/MSVCToolChain.cpp		patch \| blob \| history
lib/Driver/MinGWToolChain.cpp		patch \| blob \| history
lib/Driver/ToolChains.cpp		patch \| blob \| history
lib/Driver/ToolChains.h		patch \| blob \| history
lib/Driver/Tools.cpp		patch \| blob \| history
test/Driver/Inputs/CUDA-windows/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v8.0/bin/.keep	[new file with mode: 0644]	patch \| blob
test/Driver/Inputs/CUDA-windows/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v8.0/include/.keep	[new file with mode: 0644]	patch \| blob
test/Driver/Inputs/CUDA-windows/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v8.0/lib/.keep	[new file with mode: 0644]	patch \| blob
test/Driver/Inputs/CUDA-windows/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v8.0/nvvm/libdevice/libdevice.compute_30.10.bc	[new file with mode: 0644]	patch \| blob
test/Driver/Inputs/CUDA-windows/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v8.0/nvvm/libdevice/libdevice.compute_35.10.bc	[new file with mode: 0644]	patch \| blob
test/Driver/cuda-windows.cu	[new file with mode: 0644]	patch \| blob