
La GPU Intel Ponte Vecchio promete más del doble de rendimiento que la NVIDIA A100 3t3u2h
por Antonio Delgado 1 Hot Chips 34En el evento GPU A100 de NVIDIA. 4g7165
La compañía ha mostrado el rendimiento de estas GPU en distintas combinaciones de hasta 4 módulos y acompañadas de dos procesadores Intel Sapphire Rapids. Por un lado, tenemos el propio módulo independiente Ponte Vecchio con dos stacks, luego cuatro de estos módulos conectados con Xe Links, y finalmente cuatro de estos módulos y 2 Sapphire Rapids.
Una combinación de dos chips apilados en el módulo OAM consigue una potencia de 52 TFLOPS en FP64 y 52 TFLOPs en FP32. Las cifras se disparan en procesamiento FP16 hasta los 839 TFLOPs y hasta 1.678 TOPS en XMX INT8.
Intel también ha comentado las mejoras a la hora de utilizar cachés de alta capacidad junto a sus propia memoria HBM. Así, la cachéL2 puede alcanzar 408 MB con un pico de velocidad de lectura de 13 TB/s, mientras que los 128 GB máximos de memoria VRAM HBM se quedan en 3,2 TB/s.
Ponte Vecchio soporte hasta 64 MB de caché L1 a 105 TB/s y registros de 64 MB de 419 TB/s.
En la comparativa ante distintas cargas de trabajo, Intel ha comparado el desempeño de Ponte Vecchio con SYCL contra la NVIDIA A100 bajo SYCL y CUDA, con rendimientos que alcanzan hasta 2,5 veces la potencia de la alternativa de NVIDIA.
Fin del Artículo. ¡Cuéntanos algo en los Comentarios!