На презентации nvidia показали разницу в между 4000 и 5000 серией в генеративной нейросети flux. И совершенно беспардонно прямым текстом написали, что на 5000 серии использовалась модель (fp4 против fp8), которая в два раза меньше и, соответственно, быстрее.