
Bir dil modelini dev bir kütüphane gibi hayal edin. İçinde eğitildiği verilerden oluşan milyonlarca sayfa bilgi bulunur. Ancak bu kütüphane zamanla güncellenmez; sadece başlangıçta sahip olduğu bilgiyle sınırlıdır. Oysa gerçek dünya sürekli değişmektedir. Yeni bilgiler, gelişen olaylar ve kullanıcı ihtiyaçları modele daha dinamik ve güncel veri kaynaklarına erişim gereksinimini doğurur. İşte bu noktada devreye Data Stores girer.
Dinamik Bilgiye Açılan Kapı
Örneğin bir geliştirici, modele destekleyici bilgi olarak bir Excel tablosu, bir PDF ya da şirket içi bir belge sunmak isteyebilir. Bu gibi durumlarda Data Store yapısı sayesinde:
- Veriler orijinal formatında sunulabilir.
- Zaman alıcı veri dönüştürme işlemleri gerekmez.
- Modeli yeniden eğitmeye veya fine-tuning yapmaya ihtiyaç kalmaz.
Data Store, bu belgeleri otomatik olarak vector embeddings şeklinde vektör veritabanına dönüştürür. Bu yapı sayesinde agent, bu gömülere dayalı olarak kullanıcı sorgusuyla ilişkili en doğru bilgiyi bulabilir ve bir sonraki eylemini veya cevabını bu bilgiyle destekleyebilir.

Data Store’un Mimarideki Yeri
Generative AI agent’ları bağlamında, Data Store, genellikle çalışma zamanında erişilen bir vektör veritabanı olarak işlev görür. Bu veritabanları, metinleri sayısal vektör temsillerine dönüştürerek bilgiye daha semantik bir düzeyde erişim sağlar.
Bu yaklaşım özellikle Retrieval Augmented Generation (RAG) tabanlı sistemlerde yaygın olarak kullanılır. RAG yapısı, dil modelinin yalnızca eğitildiği bilgiye değil, güncel ve görevle ilgili verilere erişmesini sağlar.
Veriler aşağıdaki gibi çeşitli kaynaklardan gelebilir:
- Web sitesi içerikleri
- Yapılandırılmış veriler (PDF, Word, Excel, CSV vs.)
- Yapılandırılmamış metinler (HTML, düz TXT dosyaları vs.)

Bir Data Store Sorgusunun Tipik Akışı
Aşağıda bir kullanıcı sorgusunun Data Store aracılığıyla nasıl işlendiğini adım adım görebilirsin:

- Kullanıcı sorgusu, embedding modeli aracılığıyla gömüye (embedding) dönüştürülür.
- Bu embedding, SCaNN gibi bir eşleştirme algoritması kullanılarak vektör veritabanındaki içeriklerle karşılaştırılır.
- Eşleşen içerik, metin formatında vektör veritabanından geri alınır.
- Agent, hem kullanıcı sorgusunu hem de eşleşen içeriği alır ve bir yanıt veya aksiyon üretir.
- Son olarak kullanıcıya nihai cevap iletilir.
Etkin ve Güvenilir Yanıtlar İçin
Bu yapı sayesinde, agent’lar kullanıcının sorgusunu bilinen bir bilgi kaynağı ile eşleştirerek, sabit eğitim verilerine takılı kalmadan, daha doğru, bağlama uygun ve güncel yanıtlar üretebilirler. Gerekirse bu döngü tekrarlanabilir ve agent, ikinci bir arama yaparak sonucu daha da rafine edebilir.
Sonuç
Data Stores, dil modellerinin durağan yapısını dinamik ve bağlama duyarlı bir bilgi erişim altyapısına dönüştüren kritik bir bileşendir. Agent mimarisinde bu yapı, kullanıcının gerçek zamanlı sorgularına güçlü ve kanıta dayalı yanıtlar üretme imkânı sunar. Özellikle doküman ağırlıklı sektörlerde (finans, hukuk, teknik destek, vb.) Data Store kullanımı, model performansını ciddi oranda iyileştirme potansiyeline sahiptir.
Kaynak: AI Agent Books – Authors: Julia Wiesinger, Patrick Marlow and Vladimir Vuskovic