🏗️
Mimari / majör yeniden yazım
Büyük refactor, sistem tasarımı, karmaşık bağımlılık analizi — uzun bağlam + yüksek akıl
yürütme gerekir.
1
Gemini 3.1 Pro Preview
En yüksek coding (55.5) + 1.05M context + reasoning. Tüm kod tabanını tek
seferde görebilir.
2
Grok 4.1 Fast
2M context ile monorepoları da yutabilir; skoru düşük ama hacim avantajı bu
senaryoda kritik.
3
Kimi K2.6
262K sınırlı kalabilir ama Gemini Pro'nun ~6× ucuzu — bütçe kısıtlıysa güçlü
alternatif.
Gemini 3.1 Pro'nun $12/M output maliyeti bu senaryoda
amortize olur; tek hatalı refactor'ın insan maliyeti çok daha yüksek.
📱
Hızlı mobil MVP çıkarmak
UI bileşeni, ekran akışı, API entegrasyonu — iterasyon hızı + tasarım kalitesi + makul
fiyat dengesi önemli.
1
Kimi K2.6
Agentic zirvesi (66.0) + UI Component ELO 1375. Otonom çok adımlı iş akışlarında
açık ara önde.
2
Gemini 3 Flash
0.89s latency ile en hızlı iterasyon. Tasarım görseli → kod için multimodal
input desteği var.
3
MiniMax M2.7
Agentic 61.5, output $1.20/M — uzun oturumlu MVP geliştirmede maliyet avantajı
belirginleşir.
Kimi K2.6 + Gemini Flash kombine kullanılabilir: ağır
agent adımları Kimi'ye, hızlı iterasyon Flash'a.
⚡
Kolay görevleri ucuza & hızlı
Boilerplate, küçük bugfix, yorum ekleme, basit scriptler — hacim yüksek, kalite eşiği
düşük.
1
Grok 4.1 Fast
$0.20/$0.50 en ucuz + 102 tok/s en hızlı. 1000 istek = ~$0.20–0.50 toplam
maliyet.
2
DeepSeek V3.2
Neredeyse aynı maliyet; 12 sağlayıcı ile Grok'un tek sağlayıcı riskini taşımaz.
3
Gemini 3 Flash
Biraz pahalı ama 1.05M context ve multimodal ile daha karmaşık "kolay" görevleri
de kapsar.
Grok 4.1 Fast'ın 30K max output sınırı var — uzun
dosya üretiminde DeepSeek öne geçer.
🤖
Otonom agent / CI-CD pipeline
Test yazma, PR review, deployment script — çok adımlı, uzun süreli, yoğun araç çağrısı.
1
Kimi K2.6
Agentic 66.0 ile açık ara lider. 9 sağlayıcı güvenilirliği + stream cancellation
desteği.
2
MiniMax M2.7
Agentic 61.5, 131K max output — uzun pipeline logları ve raporları da
üretebilir.
3
Gemini 3.1 Pro
Agentic 59.1 + audio/video/file input — CI loglarını doğrudan dosya olarak
besleyebilirsin.
Kimi K2.6'nın int4 quantization kritik
pipeline'larda kaliteyi düşürebilir. Fallback olarak Gemini Pro tutulmalı.
📝
Kod review & dokümantasyon
PR inceleme, README yazma, API dokümantasyonu — orta uzunlukta, açıklama kalitesi önemli.
1
Gemini 3 Flash
$0.50 input + 1.05M context. Büyük PR'ları tek seferde okur, 0.89s ile hızlı
dönüş sağlar.
2
MiniMax M2.7
$0.30/$1.20 ile günlük review döngüsü çok ekonomik. 131K output uzun dok. için
yeterli.
3
DeepSeek V3.2
En ucuz alternatif; 12 sağlayıcı ile uptime güvencesi yüksek. Rutin review için
yeterli kalite.
Bu senaryo için Gemini 3.1 Pro kullanmak overkill —
Flash ile aynı context'i 4× daha ucuza alırsın.
🔍
Büyük repoda semantik analiz
Tüm repoyu bağlama yükleme, güvenlik açığı tarama, bağımlılık haritalama.
1
Grok 4.1 Fast
2M context ile bu listede rakipsiz. Tüm monorepo tek prompt'a giriyor, $0.20/M
ile ekonomik.
2
Gemini 3.1 Pro
1.05M + yüksek zeka — sadece bağlam değil, analiz kalitesi de önemliyse burada
önde.
3
Gemini 3 Flash
1.05M context + 0.89s latency; kalite ikinci planda ise Pro'nun 4× ucuzu.
Grok 4.1 Fast'ın coding skoru (30.9) düşük — "tarama"
değil derin analiz isteniyorsa Pro veya Flash tercih et.