Robocikowo>ROBOCIKOWO
Snowflake Arctic Embed M v1.5

Snowflake Arctic Embed M v1.5

1.5 · Rodzina: Snowflake Arctic
Snowflake Arctic Embed M v1.5 to 109M-parametrowy model embeddingowy zoptymalizowany pod kątem kompresji wektorów. Obsługuje MRL do 128 bajtów/wektor przy zachowaniu 98% jakości. Apache 2.0.
✓ Aktywny✓ Publiczny dostęp⚖ Open weightsModel embeddingowy📁 Snowflake Arctic
Okno kontekstowe
512
tokenów
Parametry
109M
parametrów
Data premiery
18 lipca 2024
Dostęp:APIDownloadWdrożenie:☁ Cloud💻 Lokalnie

Przegląd

Snowflake Arctic Embed M v1.5 to zaktualizowana wersja modelu snowflake-arctic-embed-m, wydana w lipcu 2024 roku. Model o rozmiarze 109M parametrów (architektura BERT) generuje wektory 768-wymiarowe z oknem kontekstowym 512 tokenów i osiąga wynik MTEB Retrieval 55,14 NDCG@10.

Kluczową cechą modelu jest wysoka kompresyjność wektorów: za pomocą Matryoshka Representation Learning (MRL) wektory można skrócić do 256 wymiarów (wynik 54,2 NDCG@10, 99% jakości bazowej), a poprzez dodatkową kwantyzację 4-bit do zaledwie 128 bajtów/wektor (wynik 53,7, czyli 98% jakości). Dzięki temu model obsługuje 7,8M wektorów na GB.

Model dostępny jest w Snowflake Cortex AI jako `snowflake-arctic-embed-m` i `snowflake-arctic-embed-m-v1.5`, na Hugging Face, przez Sentence Transformers, Transformers.js i Text Embeddings Inference (TEI). Licencja Apache 2.0.

Klasyfikacja
Model embeddingowy
Dostęp i wdrożenie
APIPobieranie
ChmuraLokalnie
Wagi: Open weights
Kluczowe parametry
📏 Kontekst: 512
🧩 Parametry: 109M
✓ Fine-tuning
📥 Wejście: tekst

Specyfikacja techniczna

Okno kontekstowe
512
tokenów
Parametry
109M
parametrów
Licencja
Apache 2.0
Funkcje:Fine-tuning
Modalności
⬇ Wejście (Input)
text
⬆ Wyjście (Output)
structured_data

Możliwości i zastosowania

Natywne możliwości modelu
Wielojęzyczność
Rozumienie i generowanie tekstu w wielu językach.
Kategoria: language

Wyniki benchmarków

2 benchmarki
MTEB Retrieval (BEIR-15)
NDCG@10 · Bez kompresji (768 wymiarów, float32)
55.14points
📄 Hugging Face model card (self-reported)
MTEB Retrieval (BEIR-15) – 256-dim MRL
NDCG@10 · Po skróceniu MRL do 256 wymiarów
54.2points
📄 Hugging Face model card (self-reported)

Cennik

Wdrożenie i bezpieczeństwo

☁ Dostępny na platformach
🔒 Security / Enterprise
✓ Zweryfikowane informacje enterprise

Modele hostowane w Snowflake Cortex AI korzystają z pełnej infrastruktury bezpieczeństwa Snowflake. Dane nie opuszczają granicy bezpieczeństwa platformy.

Aktualizacja: 28 kwi 2026↗ Dokumentacja security