Cosmos 3 üç temel işlevi bir arada sunuyor:
- Robotlar ve otonom araçlar için VLM (Görsel Dil Modeli)
- Ortamları simüle eden ve gelecekteki durumları tahmin eden bir dünya modeli
- Belirli görevler için eğitilmiş dünya-eylem modelleri için temel yapı
Üç farklı seçenekle sunulan modelin detayları ise şöyle:
- Super (32B): En yüksek fizik doğruluğu ve üretim kalitesi gerektiren robotik modellerin eğitimi sonrası süreçler için.
- Nano (8B): Saniyenin çok küçük bir diliminde yüksek kaliteli video ve eylem muhakemesi için.