MiniMax M3, yeni Agent Arena liderlik tablosunda 18. sıraya yerleşerek en iyi 5 açık kaynaklı model arasına girdi. MiniMax M2.7'ye kıyasla önemli bir gelişim kaydeden model, 22. sıradan 18. sıraya yükseldi. En büyük kazanımı, doğrulanmış görev başarısı ve bash hatalarından kurtulma becerisinde görüldü. Araç halüsinasyonu oranı her iki sürümde de düşük seyrederek birinciliği paylaştı. Agent Arena'da modeller, milyonlarca gerçek dünya ve uzun vadeli otonom görev üzerinden değerlendiriliyor; ardından nedensel izleme metodolojisi kullanılarak modelin ortalama bir modele kıyasla sonuçları ne kadar iyileştirdiği ölçülüyor. Aşağıda, @MiniMax_AI tarafından geliştirilen MiniMax M3'ün, küresel kullanıcı topluluğu tarafından gönderilen görevlerden elde edilen 5 farklı sinyal üzerindeki performans analizi yer alıyor.