Robocikowo>ROBOCIKOWO
Claude Opus 4.8

Claude Opus 4.8

4.8 · Rodzina: Claude
Najnowszy flagowy model Anthropic z rodziny Claude Opus, zoptymalizowany pod zadania agentyczne, kodowanie i długie sesje wieloetapowe.
✓ Aktywny✓ Publiczny dostępLLMModel multimodalnyModel rozumowaniaModel używający narzędzi📁 Claude
Okno kontekstowe
1M
tokenów
Data premiery
28 maja 2026
Dostęp:APIHostedWdrożenie:☁ Cloud

Przegląd

Claude Opus 4.8 to flagowy model rodziny Claude wydany przez Anthropic 28 maja 2026 roku, następca Claude Opus 4.7. Model utrzymuje standardową cenę poprzednika ($5/$25 za milion tokenów wejście/wyjście), a tryb fast mode jest trzykrotnie tańszy niż w Opus 4.7 i 4.6 ($10/$50 za milion tokenów) przy 2,5× wyższej prędkości generowania.

Anthropic raportuje, że Opus 4.8 jest około czterokrotnie rzadziej skłonny do przemilczania błędów we własnym kodzie niż poprzednik, a ocena alignment wskazuje znacząco niższy wskaźnik zachowań niepożądanych (np. decepcji) względem Opus 4.7. Premierze towarzyszą funkcje dynamic workflows w Claude Code (setki równoległych subagentów) oraz kontrola poziomu effort (low/medium/high/extra/max) w aplikacji claude.ai i Cowork.

Model jest dostępny przez identyfikator claude-opus-4-8 w Claude API, w aplikacjach claude.ai (plany Free, Pro, Max, Team, Enterprise) oraz na partnerskich platformach chmurowych.

Klasyfikacja
LLMModel multimodalnyModel rozumowaniaModel używający narzędzi
Rodzina: Claude
Dostęp i wdrożenie
APIHostowane
Chmura
Wagi: Zamknięte
Kluczowe parametry
📏 Kontekst: 1M
Narzędzia
📥 Wejście: tekst, obraz, dokumenty

Specyfikacja techniczna

Okno kontekstowe
1M
tokenów
Funkcje:Używanie narzędzi
Modalności
⬇ Wejście (Input)
textimagedocuments
⬆ Wyjście (Output)
textcodestructured_data

Możliwości i zastosowania

Natywne możliwości modelu
Rozumowanie
Zdolność modelu do logicznego wnioskowania, analizowania zależności i wyprowadzania odpowiedzi na podstawie przesłanek.
Kategoria: reasoning
Rozumowanie wieloetapowe
Zdolność modelu do rozwiązywania problemów wymagających kilku kolejnych kroków rozumowania.
Kategoria: reasoning
Długi kontekst
Zdolność modelu do pracy na długim kontekście i utrzymywania spójności przy dużej ilości danych wejściowych.
Kategoria: reasoning
Kodowanie
Zdolność modelu do generowania, analizowania, poprawiania i wyjaśniania kodu.
Kategoria: coding
Wyjście ustrukturyzowane
Zdolność modelu do generowania odpowiedzi w uporządkowanej formie, np. JSON, list, tabel lub schematów.
Kategoria: structured_generation
Rozumienie obrazów
Zdolność modelu do analizowania i interpretowania zawartości obrazów.
Kategoria: vision
Rozumienie wykresów
Zdolność modelu do rozumienia wykresów, trendów, osi, legend i danych wizualnych.
Kategoria: vision
OCR
Zdolność modelu do odczytywania i interpretowania tekstu znajdującego się na obrazach lub skanach.
Kategoria: vision
Wielojęzyczność
Zdolność modelu do rozumienia i generowania treści w wielu językach.
Kategoria: language
Planowanie
Zdolność modelu do układania planów, sekwencji działań i uporządkowanych kroków rozwiązania.
Kategoria: planning

Wyniki benchmarków

8 benchmarków
SWE-Bench Pro
agentic coding
69.2%%
📄 Anthropic, Introducing Claude Opus 4.8 (2026-05-28)
Terminal-Bench 2.1
Terminus-2 harness
74.6%%
📄 Anthropic, Introducing Claude Opus 4.8 (2026-05-28)
Humanity’s Last Exam (no tools)
49.8%%
📄 Anthropic, Introducing Claude Opus 4.8 (2026-05-28)
Humanity’s Last Exam (with tools)
57.9%%
📄 Anthropic, Introducing Claude Opus 4.8 (2026-05-28)
OSWorld-Verified
agentic computer use
83.4%%
📄 Anthropic, Introducing Claude Opus 4.8 (2026-05-28)
GDPval-AA
knowledge work
1890
📄 Anthropic, Introducing Claude Opus 4.8 (2026-05-28)
Finance Agent v2
53.9%%
📄 Anthropic, Introducing Claude Opus 4.8 (2026-05-28)
Online-Mind2Web
84%%
📄 Browserbase (Miguel Gonzalez quote, Anthropic blog 2026-05-28)

Architektura techniczna

Rdzeń architektury (Core Architecture)
Techniki trenowania (Training Techniques)