Robocikowo>ROBOCIKOWO
The AI Scientist
Aktywny

The AI Scientist

The AI Scientist to autonomiczny agent badawczy stworzony przez Sakana AI we współpracy z FLAIR (University of Oxford) i University of British Columbia, opublikowany w sierpniu 2024. System jako pierwszy realizuje pełny cykl badań naukowych w obszarze uczenia maszynowego całkowicie bez udziału człowieka — generuje nowe pomysły badawcze, projektuje i uruchamia eksperymenty w kodzie, analizuje wyniki, tworzy wizualizacje, pisze pełnoprawne artykuły naukowe w formacie LaTeX oraz przeprowadza zautomatyzowaną recenzję na wzór konferencji NeurIPS.

System wykorzystuje frontierowe modele językowe (Claude 3.5 Sonnet, GPT-4o, DeepSeek, o1) jako silnik rozumowania oraz integruje się z agentem programistycznym Aider do iteracyjnej modyfikacji kodu eksperymentów. Każdy artykuł wygenerowany w pełni autonomicznie kosztuje około 15 USD. W styczniu 2025 ukazała się wersja v2, w której artykuł napisany przez The AI Scientist-v2 został przyjęty na warsztat ICLR 2025 — był to pierwszy w historii recenzowany artykuł w pełni napisany przez AI.

Jak działa

  • Ideation: LLM generuje listę pomysłów badawczych na podstawie zalążka tematycznego (template) i przeszukuje Semantic Scholar, by odrzucić niepotrzebne duplikaty.
  • Eksperymenty: agent kodujący Aider modyfikuje kod, uruchamia trening / ewaluację, zbiera wyniki i iteruje hipotezy.
  • Pisanie: system generuje wykresy w matplotlib, opisuje wyniki i kompiluje kompletny artykuł w LaTeX wraz z bibliografią.
  • Automated Reviewer: druga instancja LLM ocenia artykuł zgodnie z formularzem recenzenta NeurIPS, osiągając zgodność z ludzkimi recenzentami zbliżoną do ludzkiego baseline.
CLIDarmowyPłatność za użycie
Wyd. 12 sie 2024Akt. 5 maj 2026Global
Napędza
GPT-4.1
GPT-4.1
1M tokens ctx
Profil modelu
Claude 3.7 Sonnet
Claude 3.7 Sonnet
200K tokenów ctx
Profil modelu
DeepSeek V3
DeepSeek V3
128K ctx
Profil modelu

Przegląd

Typ systemu
Wejście (input)
Tekstcode
Wyjście (output)
TekstKodObraz

Dostęp & Ceny

PUBLIC
Kanały dostępu
CLI
Narzędzie wiersza poleceń do integracji w skryptach i terminalach.
Zasięg dostępności
Globalny
Model subskrypcji
DarmowyPłatność za użycie

System jest open-source (Apache 2.0) i bezpłatny do uruchomienia lokalnie. Realny koszt to opłaty za API modeli LLM oraz infrastrukturę GPU — autorzy podają ok. 15 USD za jeden w pełni autonomiczny artykuł naukowy.

Możliwości

7 zdolności
Rozumowanie i planowanie
Działanie i agentowość
Specjalizacje zadaniowe

Integracje

Narzędzia systemowe

Ekosystem

Powiązane technologie
Zastosowania

Bezpieczeństwo & Enterprise

System wykonuje wygenerowany przez LLM kod lokalnie. Autorzy ostrzegają, że agent może modyfikować swój własny skrypt uruchomieniowy oraz importować dowolne biblioteki — zalecane jest uruchamianie wyłącznie w sandboksie / kontenerze.

Źródła

5 źródeł