Uzywany do badan efektywnosci treningu MoE. Osiaga Databricks Gauntlet 45.5% przy 1.7x mniejszym koszcie FLOP niz LLaMA2-13B (13B aktywnych parametrow).
Okno kontekstowe
32K
tokenów
Parametry
23.5B total / 6.6B active
parametrów
Data premiery
27 marca 2024
Dostęp:APIWdrożenie:☁ Cloud
Przegląd
Zastosowania
Dostęp i wdrożenie
API
Chmura
Wagi: Zamknięte
Kluczowe parametry
📏 Kontekst: 32K
🧩 Parametry: 23.5B total / 6.6B active
📥 Wejście: tekst
Specyfikacja techniczna
Okno kontekstowe
32K
tokenów
Parametry
23.5B total / 6.6B active
parametrów
Licencja
Databricks internal / research
Wymagania sprzętowe
Wewnetrzny model badawczy Databricks; brak publicznego checkpointu.
Modalności
⬇ Wejście (Input)
text
⬆ Wyjście (Output)
textcode
Możliwości i zastosowania
Dziedziny zastosowań
Wyniki benchmarków
1 benchmark
Databricks Model Gauntlet v0.3
avg score
45.5%
📄 Databricks DBRX blog (2024-03-27)
Architektura techniczna
Rdzeń architektury (Core Architecture)
Forma modelu (Model Form)
Źródła i powiązane strony
1 źródło
Przeglądaj powiązane tematy
