Najbardziej efektywny kosztowo model myślący z serii Gemini 3 firmy Google DeepMind, zaprojektowany pod kątem wysokiej przepustowości i niskich opóźnień przy zachowaniu jakości wnioskowania.
Okno kontekstowe
1M
tokenów
Max output
65 536
tokenów
Data premiery
29 kwietnia 2026
Dostęp:APIHostedWdrożenie:☁ Cloud
Przegląd
Zastosowania
Dostęp i wdrożenie
APIHostowane
Chmura
Wagi: Zamknięte
Kluczowe parametry
📏 Kontekst: 1M
✓ Narzędzia
📥 Wejście: tekst, obraz, audio, wideo…
Platformy
Specyfikacja techniczna
Okno kontekstowe
1M
tokenów
Max output tokens
65 536
tokenów na odpowiedź
Knowledge cutoff
1 sty 2025
Data graniczna wiedzy
Licencja
proprietary
Wymagania sprzętowe
Dostępny wyłącznie przez infrastrukturę chmurową Google (Gemini API, Vertex AI, Google AI Studio).
Funkcje:✓ Używanie narzędzi
Modalności
⬇ Wejście (Input)
textimageaudiovideodocuments
⬆ Wyjście (Output)
textcode
Możliwości i zastosowania
Natywne możliwości modelu
Rozumowanie
Zdolność modelu do logicznego wnioskowania i rozwiązywania złożonych problemów.
Kategoria: reasoning
Rozumowanie wieloetapowe
Prowadzenie wieloetapowego toku rozumowania w długich, złożonych zadaniach.
Kategoria: reasoning
Długi kontekst
Utrzymanie spójności i uwagi w bardzo długim kontekście wejściowym.
Kategoria: language
Rozumienie multimodalne
Zdolność modelu do łączenia i interpretowania informacji z więcej niż jednej modalności, np. tekstu i obrazu.
Kategoria: multimodal
Programowanie
Generowanie, analiza i modyfikacja kodu źródłowego.
Kategoria: coding
Wywoływanie funkcji
Natywne wsparcie dla ustrukturyzowanego wykorzystania narzędzi, umożliwiające przepływy pracy oparte na agentach.
Kategoria: planning
Wyjście strukturyzowane
Generowanie danych w ustrukturyzowanych formatach, np. JSON.
Kategoria: structured_generation
Rozumienie audio
Zdolność modelu do interpretowania dźwięku, mowy, tonów i sygnałów audio.
Kategoria: audio
Rozumienie obrazu
Analiza i interpretacja treści obrazów.
Kategoria: vision
Rozumienie wideo
Zdolność analizy wideo poprzez przetwarzanie sekwencji klatek.
Kategoria: video
Rozumienie wykresów
Odczyt i interpretacja wykresów, tabel i diagramów.
Kategoria: vision
Wielojęzyczność
Rozumienie i generowanie tekstu w wielu językach.
Kategoria: language
Wyjście strumieniowe
Wiadomości strumieniowe umożliwiają pobieranie treści w czasie rzeczywistym, gdy model generuje odpowiedzi, bez czekania na wygenerowanie całej odpowiedzi. Takie podejście może znacząco poprawić doświadczenie użytkownika, zwłaszcza podczas tworzenia długich treści tekstowych, ponieważ użytkownicy mogą od razu zobaczyć, że odpowiedź zaczyna się pojawiać.
Kategoria: reasoning
Wyniki benchmarków
11 benchmarków
Humanity's Last Exam
accuracy · Bez narzędzi, Gemini 3.1 Flash-Lite High
16.0%%
📄 https://deepmind.google/models/gemini/flash-lite/
Pełny zestaw (text + MM). Bez narzędzi.
GPQA Diamond
accuracy · Bez narzędzi, Gemini 3.1 Flash-Lite High
86.9%%
📄 https://deepmind.google/models/gemini/flash-lite/
Wiedza naukowa, bez narzędzi.
MMMU-Pro
accuracy · Bez narzędzi, Gemini 3.1 Flash-Lite High
76.8%%
📄 https://deepmind.google/models/gemini/flash-lite/
Multimodalne rozumienie i wnioskowanie.
CharXiv Reasoning
accuracy · Gemini 3.1 Flash-Lite High
73.2%%
📄 https://deepmind.google/models/gemini/flash-lite/
Synteza informacji z złożonych wykresów.
Video-MMMU
accuracy · Gemini 3.1 Flash-Lite High
84.8%%
📄 https://deepmind.google/models/gemini/flash-lite/
Zdobywanie wiedzy z filmów wideo.
SimpleQA Verified
accuracy · Gemini 3.1 Flash-Lite High
43.3%%
📄 https://deepmind.google/models/gemini/flash-lite/
Wiedza parametryczna.
FACTS Benchmark Suite
accuracy · Gemini 3.1 Flash-Lite High
40.6%%
📄 https://deepmind.google/models/gemini/flash-lite/
Faktyczność: grounding, wiedza parametryczna, wyszukiwanie i MM.
MMMLU
accuracy · Gemini 3.1 Flash-Lite High
88.9%%
📄 https://deepmind.google/models/gemini/flash-lite/
Wielojęzyczne pytania i odpowiedzi.
LiveCodeBench
accuracy · UI: 1/1/2025-5/1/2025, Gemini 3.1 Flash-Lite High
72.0%%
📄 https://deepmind.google/models/gemini/flash-lite/
Generowanie kodu.
MRCR v2 (8-needle, 128k)
accuracy · 128k average, Gemini 3.1 Flash-Lite High
60.1%%
📄 https://deepmind.google/models/gemini/flash-lite/
Wydajność długiego kontekstu.
MRCR v2 (8-needle, 1M)
accuracy · 1M pointwise, Gemini 3.1 Flash-Lite High
12.3%%
📄 https://deepmind.google/models/gemini/flash-lite/
Wydajność bardzo długiego kontekstu (1M tokenów).
Cennik
Architektura techniczna
Rdzeń architektury (Core Architecture)
Forma modelu (Model Form)
Techniki trenowania (Training Techniques)
Wdrożenie i bezpieczeństwo
☁ Dostępny na platformach
🔒 Security / Enterprise
✓ Zweryfikowane informacje enterprise
Model card dostępny publicznie.
Aktualizacja: 1 maj 2026↗ Dokumentacja security
