Skip to content
ORSEN
Tüm yazılar
Yapay Zeka1 dk okuma

AI ajan kurarken kaçınılması gereken 5 hata

Production'a ulaşmayan AI POC'larının ortak noktası, modelle değil mimariyle ilgili.

Demo iyi çalıştı diye herkes seviniyor, sonra üretime alıyorsunuz ve ajan ya halüsinasyon görüyor, ya patlıyor, ya da maliyeti uçuyor. Hep aynı beş hata, hep aynı yerden.

1. Tek dev prompt'la tüm işi yapmaya çalışmak

Bir LLM çağrısına on iş birden yüklediğinizde her biri daha zayıf gerçekleşir. Snipping → analysis → karar → yazma — bunları ayrı, iyi kapsamlı çağrılara dönüştürün.

Pratik test

Prompt'unuzu sesli okurken nefes kesilirse, bölün.

2. RAG'i "tüm dokümanları gömüp en yakını çek" gibi düşünmek

Naif RAG en kötü düşmandır. Lazım olan:

  1. Hibrit retrieval: vector + BM25 keyword, ikisini birleştir.
  2. Reranker: top 50'yi al, cross-encoder'la top 5'e in.
  3. Bağlam paketleme: alıntılarla beraber, kaynak meta'sıyla.

3. Eval'siz prod'a gitmek

Üretimde davranış değişimini görmenin tek yolu eval setiniz. 20-50 örnek vakadan oluşan bir altın küme:

  • Prompt değiştirdiğinde → eval koş, regression görmeden push'lama.
  • Model upgrade ettiğinde → eval koş, gerçekten daha iyi mi kontrol et.
// Basit bir eval runner
const cases = await loadEvalCases();
const results = await Promise.all(
  cases.map(async (c) => ({
    input: c.input,
    expected: c.expected,
    actual: await agent.run(c.input),
  }))
);
console.table(results.map(scoreOne));

4. Tool calling'i "her bir endpoint bir tool" şeklinde tasarlamak

Bir ajan 50 tool'a bakarken kaybolur. Tool'ları kompoze edin: "find_customer" değil "search_customers(filter, fields)". Az ama esnek.

5. Human-in-the-loop'u sonradan eklemeye çalışmak

Onay katmanı ajan tasarımının ilk gününde olmazsa, sonra eklemek if ağacına dönüşür. Önemli aksiyonlar (e-posta gönder, ödeme yap, müşteri arşivle) için açık bir approval queue çıkartın.

Maliyet uyarısı

Kontrol katmanı olmadan bırakılan bir ajan, bir gecede aylık API bütçesini bitirebilir. Rate limit + per-task budget yazılım altyapısının değil, ajan altyapısının parçası.


Beş hata, tek tema: ajanı yazılım gibi kurun. Test, izleme, bütçe, geri alma. Tüm üretim sistemlerine uygulanan disiplin AI'a da gerek.

İlgili yazılar

BİR ŞEYLER İNŞA EDELİM

Bir sonraki ürününüz, kazanan ürün olsun.

30 dakikalık keşif görüşmesinde kapsam, takvim ve yatırım netleşir.