Potente y fiable modelo de programación y kit de herramientas informáticas

NVIDIA CUDA Toolkit

NVIDIA CUDA Toolkit

  -  3.3 GB  -  Gratis
  • Última Versión

    NVIDIA CUDA Toolkit 12.9.0 (for Windows 11) ÚLTIMO

  • Revisado por

    Daniel Leblanc

  • Sistema Operativo

    Windows 11

  • Ránking Usuario

    Haga clic para votar
  • Autor / Producto

    NVIDIA Corporation / Enlace Externo

  • Nombre de Fichero

    cuda_12.9.0_576.02_windows.exe

NVIDIA CUDA Toolkit proporciona un entorno de desarrollo para crear aplicaciones de alto rendimiento aceleradas por GPU.

Con el kit de herramientas CUDA, puede desarrollar, optimizar e implementar sus aplicaciones en sistemas embebidos acelerados por GPU, estaciones de trabajo de escritorio, centros de datos empresariales, plataformas basadas en la nube y superordenadores HPC.



El kit de herramientas incluye bibliotecas aceleradas por GPU, herramientas de depuración y optimización, un compilador C/C++ y una biblioteca en tiempo de ejecución para implementar su aplicación.

Las bibliotecas CUDA aceleradas por GPU permiten la aceleración plug-and-play en múltiples dominios como álgebra lineal, procesamiento de imágenes y video, aprendizaje profundo y análisis de grafos. Para desarrollar algoritmos personalizados, puede utilizar las integraciones disponibles con lenguajes y paquetes numéricos de uso común, así como API de desarrollo bien documentadas.

Sus aplicaciones CUDA se pueden implementar en todas las familias de GPU NVIDIA disponibles localmente y en instancias de GPU en la nube. Utilizando las capacidades integradas para distribuir cómputos en configuraciones multi-GPU, científicos e investigadores pueden desarrollar aplicaciones que escalan desde estaciones de trabajo con una sola GPU hasta instalaciones en la nube con miles de GPU.

IDE con herramientas gráficas y de línea de comandos para depurar, identificar cuellos de botella de rendimiento en la GPU y la CPU, y proporcionar orientación de optimización sensible al contexto. Desarrolle aplicaciones utilizando un lenguaje de programación que ya conozca, incluyendo C, C++, Fortran y Python.

Para empezar, explore los recursos en línea de inicio, guías de optimización, ejemplos ilustrativos y colabore con la comunidad de desarrolladores en rápido crecimiento. ¡Descargue NVIDIA CUDA Toolkit para PC hoy mismo!

Características y Destacados
  • Marca de tiempo de GPU: Marca de tiempo de inicio
  • Método: Nombre del método de GPU. Este es "memcpy*" para copias de memoria o el nombre de un kernel de GPU. Las copias de memoria tienen un sufijo que describe el tipo de transferencia de memoria, por ejemplo, "memcpyDToHasync" significa una transferencia asíncrona de la memoria del Dispositivo a la memoria del Host
  • Tiempo de GPU: Es el tiempo de ejecución del método en la GPU
  • Tiempo de CPU: Es la suma del tiempo de GPU y la sobrecarga de CPU para lanzar ese Método. A nivel de datos generados por el controlador, el tiempo de CPU es solo la sobrecarga de CPU para lanzar el Método para métodos no bloqueantes; para métodos bloqueantes es la suma del tiempo de GPU y la sobrecarga de CPU. Todos los lanzamientos de kernel por defecto son no bloqueantes. Pero si se habilitan contadores de perfilador, los lanzamientos de kernel son bloqueantes. Las solicitudes de copia de memoria asíncronas en diferentes streams no son bloqueantes.
  • ID de Stream: Número de identificación del stream
  • Columnas solo para métodos de kernel
  • Ocupación: La ocupación es la relación entre el número de warps activos por multiprocesador y el número máximo de warps activos
  • Contadores de perfilador: Consulte la sección de contadores de perfilador para ver una lista de los contadores compatibles
  • Tamaño de la cuadrícula: El número de bloques en la cuadrícula a lo largo de las dimensiones X, Y y Z se muestra como [num_blocks_X num_blocks_Y num_blocks_Z] en una sola columna
  • Tamaño del bloque: El número de hilos en un bloque a lo largo de las dimensiones X, Y y Z se muestra como [num_threads_X num_threads_Y num_threads_Z]] en una sola columna
  • smem dinámico por bloque: Tamaño de memoria compartida dinámica por bloque en bytes
  • smem estático por bloque: Tamaño de memoria compartida estática por bloque en bytes
  • regs por hilo: Número de registros por hilo
  • Columnas solo para métodos de copia de memoria
  • Tamaño de transferencia de memoria: Tamaño de la transferencia de memoria en bytes
  • Tipo de transferencia de memoria de host: Especifica si una transferencia de memoria utiliza memoria "paginable" o "bloqueada en página"
VENTAJAS
  • Potencia de procesamiento paralelo masivo
  • Optimizado para GPUs NVIDIA
  • Sólido soporte para desarrolladores
  • Amplias aplicaciones de IA y HPC
  • Integración perfecta con bibliotecas
DESVENTAJAS
  • Limitado a GPUs NVIDIA
  • Curva de aprendizaje pronunciada
  • Alto consumo de energía
  • Costos de actualización de hardware
  • No es ideal para todas las cargas de trabajo
También Disponible: Descargar NVIDIA CUDA Toolkit para Mac

Traducido por el Equipo de Localización de Filehorse


¿Por qué se publica esta aplicación en Filehorse? (Más información)