Otwarty model fundamentowy świata (omnimodel) NVIDIA dla fizycznej AI. Łączy rozumowanie wizualne, generację multimodalną i predykcję działań robotów.
✓ Aktywny✓ Publiczny dostęp⚖ Open weightsModel świataBazowy model robotycznyModel multimodalny📁 Cosmos
Parametry
65B (Super) / 16B (Nano)
parametrów
Data premiery
31 maja 2026
Dostęp:APIDownloadHostedWdrożenie:☁ Cloud💻 Lokalnie📱 Na urządzeniu
Przegląd
Zastosowania
Dostęp i wdrożenie
APIPobieranieHostowane
ChmuraLokalnieNa urządzeniu
Wagi: Open weights
Kluczowe parametry
🧩 Parametry: 65B (Super) / 16B (Nano)
✓ Fine-tuning
📥 Wejście: tekst, obraz, wideo, audio…
Robotyka
Robot controlRobot manipulationBimanual manipulationEmbodied task planningScene understandingSpatial reasoningSpatial predictionEnvironment modelingVisual grounding
Platformy
Specyfikacja techniczna
Parametry
65B (Super) / 16B (Nano)
parametrów
Licencja
OpenMDW 1.1 (Linux Foundation)
Funkcje:✓ Fine-tuning
Modalności
⬇ Wejście (Input)
textimagevideoaudiorobot_sensorsrobot_state_data
⬆ Wyjście (Output)
textimagevideoaudiorobot_actionsrobot_commandsmotion_trajectories
Możliwości i zastosowania
Natywne możliwości modelu
Generowanie danych syntetycznych
Generowanie syntetycznych zbiorów danych zachowujących statystyczne właściwości oryginału, używanych do uczenia modeli, testów i ochrony prywatności.
Kategoria: structured_generation
Rozumowanie
Zdolność modelu do logicznego wnioskowania i rozwiązywania złożonych problemów.
Kategoria: reasoning
Rozumienie wideo
Zdolność analizy wideo poprzez przetwarzanie sekwencji klatek.
Kategoria: video
Rozumienie multimodalne
Zdolność modelu do łączenia i interpretowania informacji z więcej niż jednej modalności, np. tekstu i obrazu.
Kategoria: multimodal
Planowanie
Tworzenie i realizacja planów działania dla złożonych zadań.
Kategoria: planning
Robotyka
Robot controlRobot manipulationBimanual manipulationEmbodied task planningScene understandingSpatial reasoningSpatial predictionEnvironment modelingVisual grounding
Dziedziny zastosowań
Architektura techniczna
Rdzeń architektury (Core Architecture)
Forma modelu (Model Form)
Wdrożenie i bezpieczeństwo
☁ Dostępny na platformach
Źródła i powiązane strony
6 źródeł
WebNVIDIA Cosmos — Physical AI with World Foundation ModelsBlogHow Cosmos 3 Helps Physical AI Think Before It Acts (NVIDIA Blog)RepoCosmos3 collection on Hugging FaceReponvidia/Cosmos on GitHubRaportCosmos 3 Technical ReportWebNVIDIA Launches Cosmos 3, the Open Frontier Foundation Model for Physical AI
