Robocikowo>ROBOCIKOWO
Snowflake Arctic Embed L v2.0

Snowflake Arctic Embed L v2.0

2.0 · Rodzina: Snowflake Arctic
Snowflake Arctic Embed L v2.0 to parametrowy wielojęzyczny model embeddingowy zoptymalizowany pod kątem wyszukiwania semantycznego i RAG. Apache 2.0, 1024-wymiarowe wektory, kontekst 8192 tokenów.
✓ Aktywny✓ Publiczny dostęp⚖ Open weightsModel embeddingowy📁 Snowflake Arctic
Okno kontekstowe
8192
tokenów
Parametry
568M
parametrów
Data premiery
4 grudnia 2024
Dostęp:APIDownloadWdrożenie:☁ Cloud💻 Lokalnie

Przegląd

Snowflake Arctic Embed L v2.0 to wielojęzyczny model embeddingowy wydany przez Snowflake w grudniu 2024 roku. Bazując na architekturze BAAI/bge-m3-retromae, model oferuje 568M parametrów łącznie (303M parametrów poza warstwą embeddingową) i generuje wektory o wymiarowości 1024, z obsługą okna kontekstowego do 8192 tokenów.

Model wyróżnia się wysoką jakością wyszukiwania zarówno w języku angielskim (MTEB Retrieval: 55,6 NDCG@10), jak i wielojęzycznym (MIRACL: 55,8; CLEF: 52,9). Obsługuje kompresję wektorów: poprzez Matryoshka Representation Learning (MRL) do 256 wymiarów oraz kwantyzację 4-bit do 128 bajtów/wektor przy zachowaniu ponad 97% jakości bazowej.

Model jest dostępny w Snowflake Cortex AI jako `snowflake-arctic-embed-l-v2.0`, a także na Hugging Face i przez Sentence Transformers. Udostępniany na licencji Apache 2.0 do zastosowań komercyjnych bez opłat.

Klasyfikacja
Model embeddingowy
Dostęp i wdrożenie
APIPobieranie
ChmuraLokalnie
Wagi: Open weights
Kluczowe parametry
📏 Kontekst: 8192
🧩 Parametry: 568M
✓ Fine-tuning
📥 Wejście: tekst

Specyfikacja techniczna

Okno kontekstowe
8192
tokenów
Parametry
568M
parametrów
Licencja
Apache 2.0
Funkcje:Fine-tuning
Modalności
⬇ Wejście (Input)
text
⬆ Wyjście (Output)
structured_data

Możliwości i zastosowania

Natywne możliwości modelu
Wielojęzyczność
Rozumienie i generowanie tekstu w wielu językach.
Kategoria: language
Długi kontekst
Utrzymanie spójności i uwagi w bardzo długim kontekście wejściowym.
Kategoria: language

Wyniki benchmarków

3 benchmarki
MTEB Retrieval (BEIR-15)
NDCG@10 · Average across 15 BEIR datasets
55.6points
📄 Hugging Face model card (self-reported)
MIRACL (4 languages)
NDCG@10 · Wielojęzyczne wyszukiwanie – średnia z 4 języków
55.8points
📄 Hugging Face model card (self-reported)
CLEF (Focused)
NDCG@10
52.9points
📄 Hugging Face model card (self-reported)

Cennik

Wdrożenie i bezpieczeństwo

☁ Dostępny na platformach
🔒 Security / Enterprise
✓ Zweryfikowane informacje enterprise

Modele hostowane w Snowflake Cortex AI korzystają z pełnej infrastruktury bezpieczeństwa Snowflake. Dane nie opuszczają granicy bezpieczeństwa platformy.

Aktualizacja: 28 kwi 2026↗ Dokumentacja security