Potente y fiable modelo de programación y kit de herramientas informáticas

Informe Compartir

NVIDIA CUDA Toolkit

28 de mayo de 2026 - 2.3 GB - Gratis

Descargar Libre

Seguro y Confiable

Última Versión

NVIDIA CUDA Toolkit 13.3.0 (for Windows 11) ÚLTIMO
Revisado por

Daniel Leblanc
Sistema Operativo

Windows 11
Ránking Usuario

Haga clic para votar
Autor / Producto

NVIDIA Corporation / Enlace Externo
Nombre de Fichero

cuda_13.3.0_windows.exe

NVIDIA CUDA Toolkit proporciona un entorno de desarrollo para crear aplicaciones de alto rendimiento aceleradas por GPU.

Con el kit de herramientas CUDA, puede desarrollar, optimizar e implementar sus aplicaciones en sistemas embebidos acelerados por GPU, estaciones de trabajo de escritorio, centros de datos empresariales, plataformas basadas en la nube y superordenadores HPC.

El kit de herramientas incluye bibliotecas aceleradas por GPU, herramientas de depuración y optimización, un compilador C/C++ y una biblioteca en tiempo de ejecución para implementar su aplicación.

Las bibliotecas CUDA aceleradas por GPU permiten la aceleración plug-and-play en múltiples dominios como álgebra lineal, procesamiento de imágenes y video, aprendizaje profundo y análisis de grafos. Para desarrollar algoritmos personalizados, puede utilizar las integraciones disponibles con lenguajes y paquetes numéricos de uso común, así como API de desarrollo bien documentadas.

Sus aplicaciones CUDA se pueden implementar en todas las familias de GPU NVIDIA disponibles localmente y en instancias de GPU en la nube. Utilizando las capacidades integradas para distribuir cómputos en configuraciones multi-GPU, científicos e investigadores pueden desarrollar aplicaciones que escalan desde estaciones de trabajo con una sola GPU hasta instalaciones en la nube con miles de GPU.

IDE con herramientas gráficas y de línea de comandos para depurar, identificar cuellos de botella de rendimiento en la GPU y la CPU, y proporcionar orientación de optimización sensible al contexto. Desarrolle aplicaciones utilizando un lenguaje de programación que ya conozca, incluyendo C, C++, Fortran y Python.

Para empezar, explore los recursos en línea de inicio, guías de optimización, ejemplos ilustrativos y colabore con la comunidad de desarrolladores en rápido crecimiento. ¡Descargue NVIDIA CUDA Toolkit para PC hoy mismo!

Características y Destacados

Marca de tiempo de GPU: Marca de tiempo de inicio
Método: Nombre del método de GPU. Este es "memcpy*" para copias de memoria o el nombre de un kernel de GPU. Las copias de memoria tienen un sufijo que describe el tipo de transferencia de memoria, por ejemplo, "memcpyDToHasync" significa una transferencia asíncrona de la memoria del Dispositivo a la memoria del Host
Tiempo de GPU: Es el tiempo de ejecución del método en la GPU
Tiempo de CPU: Es la suma del tiempo de GPU y la sobrecarga de CPU para lanzar ese Método. A nivel de datos generados por el controlador, el tiempo de CPU es solo la sobrecarga de CPU para lanzar el Método para métodos no bloqueantes; para métodos bloqueantes es la suma del tiempo de GPU y la sobrecarga de CPU. Todos los lanzamientos de kernel por defecto son no bloqueantes. Pero si se habilitan contadores de perfilador, los lanzamientos de kernel son bloqueantes. Las solicitudes de copia de memoria asíncronas en diferentes streams no son bloqueantes.
ID de Stream: Número de identificación del stream
Columnas solo para métodos de kernel
Ocupación: La ocupación es la relación entre el número de warps activos por multiprocesador y el número máximo de warps activos
Contadores de perfilador: Consulte la sección de contadores de perfilador para ver una lista de los contadores compatibles
Tamaño de la cuadrícula: El número de bloques en la cuadrícula a lo largo de las dimensiones X, Y y Z se muestra como [num_blocks_X num_blocks_Y num_blocks_Z] en una sola columna
Tamaño del bloque: El número de hilos en un bloque a lo largo de las dimensiones X, Y y Z se muestra como [num_threads_X num_threads_Y num_threads_Z]] en una sola columna
smem dinámico por bloque: Tamaño de memoria compartida dinámica por bloque en bytes
smem estático por bloque: Tamaño de memoria compartida estática por bloque en bytes
regs por hilo: Número de registros por hilo
Columnas solo para métodos de copia de memoria
Tamaño de transferencia de memoria: Tamaño de la transferencia de memoria en bytes
Tipo de transferencia de memoria de host: Especifica si una transferencia de memoria utiliza memoria "paginable" o "bloqueada en página"