NEWS6 marca 2026
FlashAttention-4 łamie barierę wydajności: 71% utylizacji GPU na układach NVIDIA Blackwell B200
Zespół Together AI we współpracy z wiodącymi inżynierami oprogramowania zoptymalizował algorytm FlashAttention-4, osiągając rewelacyjne 71% utylizacji rdzeni graficznych na najnowszych akceleratorach NVIDIA Blackwell B200. To przełomowe rozwiązanie eliminuje sprzętowe "wąskie gardło" asymetrycznego skalowania, pozwalając na trenowanie gigantycznych modeli sztucznej inteligencji nawet 2,7 raza szybciej niż dotychczasowe standardy, co drastycznie obniży koszty infrastrukturalne największych graczy na rynku.