
Gated DeltaNet
Architektura liniowych transformerów łącząca regułę delta z bramkowaniem, ulepszenie Mamba2 i DeltaNet (NVIDIA Research, MIT CSAIL, ICLR 2025).
🔬 Research🔬 Research onlyLLM
Parametry
0.4B – 1.3B (skala badawcza)
parametrów
Data premiery
9 grudnia 2024
Dostęp:DownloadWdrożenie:💻 Lokalnie
Przegląd
Klasyfikacja
LLM
Dostęp i wdrożenie
Pobieranie
Lokalnie
Wagi: Zamknięte
Kluczowe parametry
🧩 Parametry: 0.4B – 1.3B (skala badawcza)
📥 Wejście: tekst
Specyfikacja techniczna
Parametry
0.4B – 1.3B (skala badawcza)
parametrów
Licencja
NVIDIA Source Code License-NC
Modalności
⬇ Wejście (Input)
text
⬆ Wyjście (Output)
text
Możliwości i zastosowania
Natywne możliwości modelu
Modelowanie języka
Zdolność przewidywania kolejnych tokenów i generowania spójnego tekstu w języku naturalnym na podstawie poprzedzającego kontekstu.
Kategoria: language
Długi kontekst
Zdolność modelu do pracy na długim kontekście i utrzymywania spójności przy dużej ilości danych wejściowych.
Kategoria: reasoning
Architektura techniczna
Forma modelu (Model Form)
Techniki trenowania (Training Techniques)