LongLive 2.0: NVFP4 soll lange KI-Videos schneller und speicherschone…
… Im Zentrum steht NVFP4, also ein 4-Bit-Gleitkommaformat, das in diesem System für Training, Inferenz und KV-Cache eine zentrale Rolle spielt. Der aktuelle GitHub-Stand nennt für den 25. Mai 2026 eine Optimierung des NVFP4-Inferenzpfads. …