Windows 系统上安装 CUDA 的教程

  • 兼容性:支持的 Windows 版本、合适的驱动程序以及正确配置的 WDDM/TCC 型号。
  • 灵活的安装方式:图形化或静默工具包、Conda 和 Wheels,并通过示例进行验证。
  • 混合环境:在 Windows 上的 Linux 系统中,使用 WSL 支持最小内核、Docker 和 AI 框架。

Windows 上的 CUDA

在 Windows 上安装 CUDA 只要遵循官方指南中验证过的清晰步骤,就不会遇到什么难题。在本实用技术指南中,我们将涵盖在原生 Windows 和 WSL 环境中微调工具包、驱动程序和验证工具所需的一切内容。 目标是让您最终获得一个可正常运行且经过测试的安装版本。随时准备加速您的 GPU 工作流程。

除了经典步骤之外,我们还将介绍 Visual Studio 兼容性、静默安装、Conda 包和 NVIDIA Wheels、使用 CUDA 示例进行验证、WSL 特性以及关键发行说明(例如从 CUDA 13 安装程序中删除驱动程序)。 你还将学习如何诊断常见问题。 (包括使用联想 Ideapad 和 526.56 驱动程序的真实案例)以及针对特定场景的具体要求,例如使用 CUDA 10.1 和 cuDNN 7.6.4 的模型构建器。

CUDA是什么?

CUDA 是 NVIDIA 的并行编程平台和模型,它允许在 GPU 上加速计算密集型应用程序。 使用 CUDA C/C++ 及其扩展 您可以专注于算法的并行化,而 CUDA 运行时则负责管理 CPU 和 GPU 之间的执行和内存分配。通过划分串行(CPU)和并行(GPU)工作, 利用数千个线程可以提升性能。 以及共享的片上存储器。

本指南重点介绍如何在 Windows(原生和 WSL)中微调环境、安装工具包、编译示例以及验证系统是否正确检测到 GPU。 使用 deviceQuery 和 bandwidthTest 等示例进行验证 这是一个经常被忽视的关键部分,我们将在本文中明确讨论。

CUDA

系统要求和支持的 Windows 版本

要使用 CUDA,您需要兼容的 NVIDIA GPU 和受支持的 Windows 操作系统。 支持的操作系统版本包括Windows 11 24H2、23H2 和 22H2-SV2;Windows 10 22H2;Windows Server 2022 和 Windows Server 2025。在设备管理器中检查您的显卡是否出现在“显示适配器”下,并在支持 CUDA 的 GPU 官方列表(NVIDIA 页面)中验证其兼容性。

在编译器级别,该工具包支持 Visual Studio 2022 17.x (C++11/14/17/20) 中的 MSVC 193x 和 Visual Studio 2019 16.x (C++11/14/17) 中的 MSVC 192x。 11.1 版本已弃用对 Visual Studio 2015 的支持。对于 VS 2017,该功能在 12.5 版本中已被弃用,并在 13.0 版本中被移除。请注意,从 CUDA 12.0 开始,32 位编译功能已被移除(包括原生编译和交叉编译);如果您需要 32 位功能,则必须使用旧版本的工具包。

尽管NVIDIA驱动程序将继续允许在GeForce GPU(最高至Ada架构)上运行32位二进制文​​件, 艾达将是最后一个获得这种支持的人。Hopper 已不再支持 32 位应用程序。如果您在生产环境中维护旧版软件并需要规划升级,这一点至关重要。

在 Windows 10 及更高版本中,NVIDIA 驱动程序可以以两种模式运行: WDDM(用于显示设备) 以及用于没有视频输出的GPU(例如Tesla或某些Titan型号)的TCC(Tesla计算集群)。 nvidia-smi 您可以查看当前模式,并在支持的情况下进行切换。在配备游戏显卡的台式电脑上,WDDM 将是标准配置;在配备计算卡的工作站上, TCC通常默认启用。.

在 Windows 上安装工具包:分步指南

  1. 请确认您拥有支持 CUDA 的 GPU 和受支持的 Windows 版本。在设备管理器(显示适配器)中,您可以查看制造商和型号。
  2. 从官方下载页面下载 NVIDIA CUDA 工具包。 您有两种格式:网络安装程序(仅下载安装过程中选择的内容)和完整安装程序(包含所有组件,适用于离线或企业部署)。
  3. 运行安装程序并按照图形向导操作。 如有需要,安装工具包、示例以及与 Visual Studio 的集成。
  4. 在自动化安装中,您可以使用静默模式。 -s并添加参数以选择特定的子包。该标志 -n 必要时避免自动重启。
  5. 完成并重新开始 如果有要求的话。
  6. 打开命令提示符并运行 nvcc -V 查看已安装的 CUDA 编译器版本。

在 Windows 上安装 CUDA

静默安装和工具包子包

安装程序允许您部署工具包的特定组件,这在托管或 CI 环境中非常有用。 CUDA 13.0 中的一些典型子包 (默认路径为 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v13.0):

  • cublas_13.0 / cublas_dev_13.0cuBLAS 运行时库。
  • crt_13.0:CUDA应用程序的编译器。
  • ctadvisor_13.0通过 NVCC/NVRTC 跟踪分析来缩短编译时间。
  • cuda_profiler_api_13.0 y cuadrt_13.0CUDA 分析器和运行时 API。
  • cufft_13.0 / cufft_dev_13.0:cuFFT。
  • cuobjdump_13.0 y nvdisasm_13.0用于检查立方体的实用程序。
  • cupti_13.0:性能分析工具界面。
  • curand_13.0 / curand_dev_13.0:CURAND。
  • cusolver_13.0 / cusolver_dev_13.0 y cusparse_13.0 / cusparse_dev_13.0线性代数库。
  • cuxxfilt_13.0:demannler cu++ 过滤器。
  • 文档_13.0:HTML 和 PDF 指南(编程、最佳实践等)。
  • nsight_compute_13.0, nsight_systems_13.0 y nsight_vse_13.0Nsight 工具。
  • npp_13.0 / npp_dev_13.0:核电站。
  • nvcc_13.0CUDA编译器。
  • nvfatbin_13.0, nvjitlink_13.0, nvtx_13.0, nvvm_13.0, nvptxcompiler_13.0工具链工具/库和跟踪。
  • nvjpeg_13.0 / nvjpeg_dev_13.0:nvJPEG。
  • nvml_dev_13.0NVML 头文件和库。
  • nvprune_13.0:按设备目标修剪对象/静态数据。
  • 入住率计算器_13.0:入住率电子表格。
  • opencl_13.0:OpenCL库。
  • 消毒剂_13.0计算消毒器 API。
  • 推力_13.0 y visual_studio_integration_13.0推力和集成 VS.

如果您需要在安装前检查内容,可以使用 LZMA 兼容工具(例如 7-Zip)提取完整安装程序。 工具包文件位于 CUDAToolkit 文件夹中 文件解压后,你会看到 .dll 和 .nvi 文件,如果你只想查看安装目录结构,可以忽略它们。卸载程序需要通过“控制面板”>“程序和功能”进行。

使用 pip 安装(NVIDIA Wheels)

对于以 Python 为中心的环境,NVIDIA 提供了 Wheels,可以通过 pip 安装 CUDA 运行时和库。 这些软件包旨在用于运行时。 并且不包含开发工具(如有需要,您可以单独安装)。注意:CUDA 环境在 pip 环境中管理,因此如果您打算在 pip 环境之外使用 CUDA,则需要调整宿主机环境。

首先,安装 nvidia-pyindex 以便 pip 可以从 NVIDIA NGC 仓库解析模块。如有必要, 更新 pip 和 setuptools 为避免后续错误,您还可以添加以下代码行: nvidia-pyindex 给你 requirements.txt 如果你遵循这种惯例的话。

验证安装:样本和测试

使用以下命令检查编译器版本: nvcc -V 来自 CMD。 从 github.com/nvidia/cuda-samples 克隆 CUDA 示例按照仓库中的说明编译并运行它们。强烈建议编译并运行。 deviceQuery 确认已检测到 GPU 且配置正确。

考试 bandwidthTest 验证主机设备性能和通信情况。 无论哪种情况,重要的是设备能够出现。它与您的硬件匹配并通过了测试。 deviceQuery 未检测到GPU,请检查驱动程序安装情况以及设备是否在系统中正常运行。

Windows 11 和 Windows 10 21H2+ 中的 CUDA 和 WSL

Windows 11 和较新版本的 Windows 10(21H2 及更高版本)支持使用 WSL 运行 GPU 加速的 ML 工具。 您将能够使用 TensorFlow、PyTorch、Docker 和 NVIDIA 容器工具包 在基于 glibc 的 Linux 发行版(Ubuntu、Debian 等)中。

关键步骤:在 WSL 中安装支持 NVIDIA CUDA 的驱动程序,启用 WSL,并添加 Ubuntu/Debian 类型的发行版。 请确保您使用的是最新版本的 WSL 内核。 (最低版本 5.10.43.3)。您可以使用 PowerShell 命令验证这一点: wsl cat /proc/version接下来,按照 NVIDIA 的 WSL 中 CUDA 用户指南,使用 NVIDIA Docker 或在发行版中安装 PyTorch/TensorFlow。

Windows 中的检查和诊断

要查看您拥有的 GPU 型号:在“设置”>“系统”>“显示”>“高级设置”中,您将在“显示信息”下找到品牌和型号。 在任务管理器中,选择“性能”选项卡选择 GPU 以查看使用情况、型号和显存。如果未显示,请检查“设备管理器”>“显示适配器”,并安装相应的显卡驱动程序。

要查看驱动程序“报告”的 CUDA 版本,请运行 nvidia-smi. 要查找已安装的 Toolkit 编译器的版本,用途 nvcc --version。请记住 nvidia-smi 它显示的是驱动程序支持的最大 CUDA“API”版本,而不是磁盘上工具包中的版本。

云使用情况:GPU实例示例

如果您需要按需供电,云服务提供商可提供配备 NVIDIA A100、RTX 4090 或 A6000 等 GPU 的实例。 这种方法可以实现按需付费、近乎即时的部署和现成的模板。 对于流行的框架(PyTorch、TensorFlow),它是一种高效的替代方案,无需投资专有硬件,并且支持最新的 CUDA 版本,即可应对大规模工作负载或临时峰值需求。

法律声明和商标

NVIDIA 文档和软件按“原样”提供,保留所有权利,不提供任何关于适销性或特定用途适用性的默示保证。 NVIDIA可能会在不事先通知的情况下修改规格和文档。请务必核实最新信息,并遵守第三方销售和许可条款。OpenCL 是 Apple Inc. 的商标,已授权 Khronos 使用;NVIDIA 及其徽标是 NVIDIA 在美国和其他国家/地区的注册商标。

有了以上所有步骤,您现在就拥有了在 Windows 上安装、配置和验证 CUDA 所需的一切(必要时也可以在 WSL 或 Linux 上安装、配置和验证 CUDA )。 从需求和驱动程序到与 Visual Studio 的集成以及使用示例进行验证关键在于使驱动程序版本、工具包和环境保持一致,并依赖诸如以下工具: nvidia-smi, nvcc 并采集样品以确认整个链条按预期运行。