O rodzinie
Qwen3 to trzecia generacja rodziny dużych modeli językowych Alibaba Group, ogłoszona 29 kwietnia 2025 r. Seria obejmuje modele gęste (0,6B, 1,7B, 4B, 8B, 14B, 32B) oraz modele Mixture-of-Experts (30B-A3B i 235B-A22B). Kluczową innowacją jest hybrydowy tryb pracy: tryb myślenia (thinking mode) — model generuje rozumowanie krok po kroku w bloku <think>…</think> przed finalną odpowiedzią — oraz tryb szybki (non-thinking mode) — odpowiedź bezpośrednia, analogiczna do poprzednich modeli Qwen2.5. Przełączanie trybów odbywa się przez parametr enable_thinking lub flagi /think i /no_think w promptcie. Modele Qwen3 trenowano na ok. 36 bilionach tokenów obejmujących 119 języków i dialektów (trzy razy więcej niż Qwen2.5). Wszystkie modele są publicznie dostępne na licencji Apache 2.0.