CUDA 13.3: NVIDIA schiebt GPU-Programmierung weiter vom Thread zum Ti…
… NVIDIA beschreibt das Werkzeug als Compiler-Autotuning, das mit evolutionären und genetischen Algorithmen spezialisierte Compilerkonfigurationen für einzelne Kernel sucht. Für GEMM- und Attention-Kernel nennt NVIDIA bis zu 15 Prozent Mehrleistung auf bereits optimierten Triton- und CUTLASS-Kerneln. …