
Bir agent’ın dış dünya ile etkili bir şekilde etkileşim kurabilmesi için doğru araçları (tools) kullanması gerekir. Bu araçlar, sadece dış sistemlere erişimi değil, aynı zamanda modelin sınırlı eğitim bilgisini genişletmesini ve görevlerini başarıyla yerine getirmesini sağlar. Agent mimarisinde en sık kullanılan üç araç tipi şunlardır:
- Extensions
- Function Calling
- Data Stores
Bu araçların hangi senaryoda ne şekilde tercih edileceğini anlamak için aşağıdaki tabloyu inceleyebiliriz:
Özellik / Kullanım | Extensions | Function Calling | Data Stores |
---|---|---|---|
Çalışma Yeri | Agent-Side Execution | Client-Side Execution | Agent-Side Execution |
Kullanım Senaryosu | – Geliştirici, agent’ın API endpoint’leriyle doğrudan etkileşime geçmesini ister. – Hazır Extension’lar kullanıldığında faydalıdır (örneğin: Vertex Search, Code Interpreter). – Çok adımlı planlama ve API çağrıları (ör. bir önceki adımın çıktısına göre sonraki API seçimi). | – Güvenlik veya kimlik doğrulama kısıtları nedeniyle agent API’ye doğrudan erişemez. – Gerçek zamanlı çağrıların mümkün olmadığı zamanlama kısıtları vardır (ör. batch işlemler, human-in-the-loop senaryoları). – API internet üzerinden erişilebilir değilse ya da Google sistemleri tarafından erişilemiyorsa. | – Geliştirici, RAG (Retrieval Augmented Generation) yaklaşımını uygulamak ister. – Aşağıdaki veri türleriyle çalışmak için uygundur: • Web sitesi içerikleri • PDF, Word, Excel, CSV gibi yapılandırılmış veriler • HTML, TXT gibi yapılandırılmamış metinler • İlişkisel/veritabanı sistemleri |
Agent’ların Geleceği: Karmaşık Görevler, Zincirleme Kararlar
Günümüzde agent’lar, dil modellerinin sınırlarını aşarak gerçek zamanlı bilgiye erişebilir, gerçek dünyada eylemler önerebilir, hatta karmaşık görevleri planlayıp otomatik olarak yürütebilir hale gelmiştir. Bu yalnızca bir başlangıçtır; gelecekte bu sistemler çok daha gelişmiş yeteneklerle donatılacaktır.
Özellikle dikkat çeken bir yaklaşım olan “agent chaining”, birden fazla dil modelinin veya agent’ın birbiriyle koordineli şekilde çalışmasını sağlayarak, görevler arasında geçiş yapmalarına ve görevleri parçalayarak yönetmelerine olanak tanır.
Orkestrasyon Katmanı:
Bir agent’ın karar alma ve hareket etme süreçlerinin merkezinde, orchestration layer yer alır. Bu katman; akıl yürütme, planlama, karar verme ve hareket etme süreçlerini yapılandıran bir tür bilişsel mimaridir.
Bu yapıyı destekleyen en önemli reasoning framework’leri şunlardır:
- ReAct: Akıl yürütme + eylem üretme
- Chain-of-Thought (CoT): Adım adım düşünce zinciri
- Tree-of-Thoughts (ToT): Paralel düşünce dalları ile problem çözme
Orchestration layer, bu framework’ler yardımıyla verileri işler, kararlar alır ve agent’ın aksiyonlarını yönlendirir.
Tools: Dış Dünyaya Açılan Kapılar
Agent’lar için araçlar (tools), dış dünyayla bağlantı kurmalarını sağlayan anahtar bileşenlerdir. Her bir araç farklı görevleri üstlenir:
- Extensions: Agent ile harici API’ler arasında köprü kurar, doğrudan API çağrıları ve gerçek zamanlı veri alma işlevi sunar.
- Function Calling: Fonksiyon parametrelerini model üretir, ancak çalıştırma işlemi istemci tarafında yapılır. Geliştiriciye esneklik ve kontrol sağlar.
- Data Stores: Yapılandırılmış veya yapılandırılmamış veri kaynaklarına erişim sağlar. Agent’ın bilgi tabanını genişleterek RAG tabanlı uygulamalarda kritik rol oynar.
Sonuç
Extensions, Function Calling ve Data Stores, her biri farklı amaçlara hizmet eden ve agent’ların yeteneklerini genişleten araçlardır. Doğru senaryoda doğru aracı seçmek, bir agent’ın performansı ile başarısı arasındaki farkı belirleyebilir. Geleceğin agent sistemleri; daha fazla araçla donatılmış, daha derin reasoning yeteneklerine sahip ve çok daha karmaşık görevleri otonom olarak yerine getirebilen sistemler olacak.