* Claude Opus 4.7, 1567 Arena Puanı ile zirvede yer alsa da 1 milyon token başına 20 dolarlık maliyetiyle rutin görevler için oldukça pahalı kalıyor.
* Qwen ve MiniMax, 1 milyon token başına 1,95 ile 3,13 dolar arasındaki fiyatlarıyla 1530-1540 puanlık performans sunarak orta segmentte güçlü seçenekler oluşturuyor; ancak bu modeller karmaşık muhakeme ve uzun vadeli planlama gerektiren işlerde zorlanıyor.
* Mimo ve Granite, 0,09 ile 0,76 dolar arasındaki maliyetleriyle oldukça ekonomik olsalar da, bu düşük fiyat performans kaybını beraberinde getiriyor ve puanları 1200-1450 aralığına geriliyor.
Buradan çıkarılacak ders, uzun vadeli geliştirme süreçlerinin tek tip olmaması nedeniyle hiçbir modelin her zaman doğru tercih olmadığıdır.