6 Model Karşılaştırması
OpenRouter verileri · Nisan 2026
Avantajlı
Orta
Pahalı / yavaş
Üstün özellik
Model Context Latency Throughput Input $/M Output $/M Zeka Kodlama Agentic Max çıktı Tools Cache
Tier 1 — Yüksek zeka, premium fiyat
Gemini 3.1 Pro
Google · 2 sağlayıcı · Reasoning
1.05M 3.30s 71 tok/s $2.00 $12.00
57.2
55.5
59.1
66K
Kimi K2.6
Moonshotai · 9 sağlayıcı · Reasoning
262K 2.24s 27 tok/s $0.95 $4.00
53.9
47.1
66.0
Tier 2 — Dengeli performans / fiyat
Gemini 3 Flash
Google · 2 sağlayıcı · Reasoning
1.05M 0.89s 80 tok/s $0.50 $3.00
46.4
42.6
49.7
66K
MiniMax M2.7
MiniMax · 3 sağlayıcı · Reasoning
197K 1.89s 57 tok/s $0.30 $1.20
49.6
41.9
61.5
131K
Tier 3 — Hız ve hacim odaklı, düşük maliyet
DeepSeek V3.2
DeepSeek · 12 sağlayıcı · Reasoning
131K 1.60s 22 tok/s $0.26 $0.38
41.7
36.7
52.9
164K
Grok 4.1 Fast
xAI · 1 sağlayıcı · Reasoning
2M 0.60s 102 tok/s $0.20 $0.50
38.6
30.9
49.3
30K
🏗️
Mimari / majör yeniden yazım
Büyük refactor, sistem tasarımı, karmaşık bağımlılık analizi — uzun bağlam + yüksek akıl yürütme gerekir.
1
Gemini 3.1 Pro Preview
En yüksek coding (55.5) + 1.05M context + reasoning. Tüm kod tabanını tek seferde görebilir.
2
Grok 4.1 Fast
2M context ile monorepoları da yutabilir; skoru düşük ama hacim avantajı bu senaryoda kritik.
3
Kimi K2.6
262K sınırlı kalabilir ama Gemini Pro'nun ~6× ucuzu — bütçe kısıtlıysa güçlü alternatif.
Gemini 3.1 Pro'nun $12/M output maliyeti bu senaryoda amortize olur; tek hatalı refactor'ın insan maliyeti çok daha yüksek.
📱
Hızlı mobil MVP çıkarmak
UI bileşeni, ekran akışı, API entegrasyonu — iterasyon hızı + tasarım kalitesi + makul fiyat dengesi önemli.
1
Kimi K2.6
Agentic zirvesi (66.0) + UI Component ELO 1375. Otonom çok adımlı iş akışlarında açık ara önde.
2
Gemini 3 Flash
0.89s latency ile en hızlı iterasyon. Tasarım görseli → kod için multimodal input desteği var.
3
MiniMax M2.7
Agentic 61.5, output $1.20/M — uzun oturumlu MVP geliştirmede maliyet avantajı belirginleşir.
Kimi K2.6 + Gemini Flash kombine kullanılabilir: ağır agent adımları Kimi'ye, hızlı iterasyon Flash'a.
Kolay görevleri ucuza & hızlı
Boilerplate, küçük bugfix, yorum ekleme, basit scriptler — hacim yüksek, kalite eşiği düşük.
1
Grok 4.1 Fast
$0.20/$0.50 en ucuz + 102 tok/s en hızlı. 1000 istek = ~$0.20–0.50 toplam maliyet.
2
DeepSeek V3.2
Neredeyse aynı maliyet; 12 sağlayıcı ile Grok'un tek sağlayıcı riskini taşımaz.
3
Gemini 3 Flash
Biraz pahalı ama 1.05M context ve multimodal ile daha karmaşık "kolay" görevleri de kapsar.
Grok 4.1 Fast'ın 30K max output sınırı var — uzun dosya üretiminde DeepSeek öne geçer.
🤖
Otonom agent / CI-CD pipeline
Test yazma, PR review, deployment script — çok adımlı, uzun süreli, yoğun araç çağrısı.
1
Kimi K2.6
Agentic 66.0 ile açık ara lider. 9 sağlayıcı güvenilirliği + stream cancellation desteği.
2
MiniMax M2.7
Agentic 61.5, 131K max output — uzun pipeline logları ve raporları da üretebilir.
3
Gemini 3.1 Pro
Agentic 59.1 + audio/video/file input — CI loglarını doğrudan dosya olarak besleyebilirsin.
Kimi K2.6'nın int4 quantization kritik pipeline'larda kaliteyi düşürebilir. Fallback olarak Gemini Pro tutulmalı.
📝
Kod review & dokümantasyon
PR inceleme, README yazma, API dokümantasyonu — orta uzunlukta, açıklama kalitesi önemli.
1
Gemini 3 Flash
$0.50 input + 1.05M context. Büyük PR'ları tek seferde okur, 0.89s ile hızlı dönüş sağlar.
2
MiniMax M2.7
$0.30/$1.20 ile günlük review döngüsü çok ekonomik. 131K output uzun dok. için yeterli.
3
DeepSeek V3.2
En ucuz alternatif; 12 sağlayıcı ile uptime güvencesi yüksek. Rutin review için yeterli kalite.
Bu senaryo için Gemini 3.1 Pro kullanmak overkill — Flash ile aynı context'i 4× daha ucuza alırsın.
🔍
Büyük repoda semantik analiz
Tüm repoyu bağlama yükleme, güvenlik açığı tarama, bağımlılık haritalama.
1
Grok 4.1 Fast
2M context ile bu listede rakipsiz. Tüm monorepo tek prompt'a giriyor, $0.20/M ile ekonomik.
2
Gemini 3.1 Pro
1.05M + yüksek zeka — sadece bağlam değil, analiz kalitesi de önemliyse burada önde.
3
Gemini 3 Flash
1.05M context + 0.89s latency; kalite ikinci planda ise Pro'nun 4× ucuzu.
Grok 4.1 Fast'ın coding skoru (30.9) düşük — "tarama" değil derin analiz isteniyorsa Pro veya Flash tercih et.