Cosmos 3 üç temel işlevi bir arada sunuyor:

- Robotlar ve otonom araçlar için VLM (Görsel Dil Modeli)

- Ortamları simüle eden ve gelecekteki durumları tahmin eden bir dünya modeli

- Belirli görevler için eğitilmiş dünya-eylem modelleri için temel yapı

Üç farklı seçenekle sunulan modelin detayları ise şöyle:

- Super (32B): En yüksek fizik doğruluğu ve üretim kalitesi gerektiren robotik modellerin eğitimi sonrası süreçler için.

- Nano (8B): Saniyenin çok küçük bir diliminde yüksek kaliteli video ve eylem muhakemesi için.