AlphaEvolve

AlphaEvolve to ewolucyjny agent kodujący opracowany przez Google DeepMind, ogłoszony 14 maja 2025 r. System łączy zdolności kreatywne dużych modeli językowych z rodziny Gemini z automatycznymi ewaluatorami, które weryfikują i punktują proponowane programy. Ewolucyjny framework iteracyjnie ulepsza najbardziej obiecujące pomysły i pozwala przechodzić od pojedynczych funkcji do całych baz kodu i złożonych algorytmów.

AlphaEvolve wykorzystuje zespół modeli: Gemini Flash maksymalizuje szerokość eksploracji pomysłów, natomiast Gemini Pro dostarcza pogłębionych, krytycznych sugestii. Programy proponowane przez modele są uruchamiane, weryfikowane i oceniane automatycznie wedle obiektywnych, kwantyfikowalnych metryk, co sprawia, że agent jest skuteczny w dziedzinach, gdzie postęp da się jednoznacznie mierzyć, czyli przede wszystkim w matematyce i informatyce.

System został wdrożony wewnątrz infrastruktury obliczeniowej Google. Wykryta przez AlphaEvolve heurystyka dla planisty Borg od ponad roku odzyskuje średnio 0,7% globalnych zasobów obliczeniowych. AlphaEvolve zaproponował też przepisanie fragmentu układu mnożenia macierzy w Verilogu, włączone do nadchodzącego TPU, przyspieszył kluczowy kernel w architekturze Gemini o 23% (redukcja czasu treningu o 1%) oraz osiągnął do 32,5% przyspieszenia implementacji kernela FlashAttention w modelach transformerowych.

W matematyce AlphaEvolve znalazł algorytm mnożenia macierzy 4×4 o zespolonych elementach przy użyciu 48 mnożeń skalarnych, poprawiając wynik Strassena z 1969 r. Przetestowano go na ponad 50 otwartych problemach z analizy matematycznej, geometrii, kombinatoryki i teorii liczb: w ok. 75% przypadków odnalazł rozwiązania na poziomie stanu wiedzy, a w 20% poprawił najlepsze znane wyniki, m.in. ustanawiając nowe dolne ograniczenie dla problemu liczby pocałowań w 11 wymiarach (593 zewnętrzne sfery).

AlphaEvolve nie jest produktem publicznie dostępnym. Zespół przygotowuje Early Access Program dla wybranych użytkowników akademickich; szersze udostępnienie pozostaje przedmiotem eksploracji. Dokumentacja techniczna opublikowana jest w formie white paper.

Wyd. 14 maj 2025Akt. 17 maj 2026Invite only · Global

Odwiedź stronę

Przegląd

Typ systemu

Wejście (input)

Tekstcode

Wyjście (output)

TekstKod

Dostęp & Ceny

PUBLIC

Zasięg dostępności

Tylko na zaproszenie

Globalnie

Brak publicznej dostępności. Planowany Early Access Program dla wybranych użytkowników akademickich; rozważane szersze udostępnienie. Rejestracja zainteresowania przez formularz Google DeepMind.