AI ajan kurarken kaçınılması gereken 5 hata
Production'a ulaşmayan AI POC'larının ortak noktası, modelle değil mimariyle ilgili.
Demo iyi çalıştı diye herkes seviniyor, sonra üretime alıyorsunuz ve ajan ya halüsinasyon görüyor, ya patlıyor, ya da maliyeti uçuyor. Hep aynı beş hata, hep aynı yerden.
1. Tek dev prompt'la tüm işi yapmaya çalışmak
Bir LLM çağrısına on iş birden yüklediğinizde her biri daha zayıf gerçekleşir. Snipping → analysis → karar → yazma — bunları ayrı, iyi kapsamlı çağrılara dönüştürün.
Pratik test
Prompt'unuzu sesli okurken nefes kesilirse, bölün.
2. RAG'i "tüm dokümanları gömüp en yakını çek" gibi düşünmek
Naif RAG en kötü düşmandır. Lazım olan:
- Hibrit retrieval: vector + BM25 keyword, ikisini birleştir.
- Reranker: top 50'yi al, cross-encoder'la top 5'e in.
- Bağlam paketleme: alıntılarla beraber, kaynak meta'sıyla.
3. Eval'siz prod'a gitmek
Üretimde davranış değişimini görmenin tek yolu eval setiniz. 20-50 örnek vakadan oluşan bir altın küme:
- Prompt değiştirdiğinde → eval koş, regression görmeden push'lama.
- Model upgrade ettiğinde → eval koş, gerçekten daha iyi mi kontrol et.
// Basit bir eval runner
const cases = await loadEvalCases();
const results = await Promise.all(
cases.map(async (c) => ({
input: c.input,
expected: c.expected,
actual: await agent.run(c.input),
}))
);
console.table(results.map(scoreOne));
4. Tool calling'i "her bir endpoint bir tool" şeklinde tasarlamak
Bir ajan 50 tool'a bakarken kaybolur. Tool'ları kompoze edin: "find_customer" değil "search_customers(filter, fields)". Az ama esnek.
5. Human-in-the-loop'u sonradan eklemeye çalışmak
Onay katmanı ajan tasarımının ilk gününde olmazsa, sonra eklemek if ağacına dönüşür. Önemli aksiyonlar (e-posta gönder, ödeme yap, müşteri arşivle) için açık bir approval queue çıkartın.
Maliyet uyarısı
Kontrol katmanı olmadan bırakılan bir ajan, bir gecede aylık API bütçesini bitirebilir. Rate limit + per-task budget yazılım altyapısının değil, ajan altyapısının parçası.
Beş hata, tek tema: ajanı yazılım gibi kurun. Test, izleme, bütçe, geri alma. Tüm üretim sistemlerine uygulanan disiplin AI'a da gerek.