Aktualności29 czerwca 2026 Kiedy AI powinno mówić? Tsinghua tworzy dwa benchmarki dla asystentów
Dwa zespoły z Tsinghua University opublikowały w maju 2026 roku zestawy testowe EgoIntrospect i IPIBench, mierzące zdolność dużych modeli multimodalnych do rozumienia stanów wewnętrznych użytkownika i proaktywnego działania w czasie rzeczywistym. Wyniki są jednoznaczne: żaden z testowanych modeli nie zdał obu egzaminów.