Yerli Yapay Zeka Modeli Kumru Tanıtıldı: İşte Özellikleri | Goygoy Engine
https://cdn.goygoyengine.com/images/1760280462465-349d4c8b849ba006.jpg

Yerli Yapay Zeka Modeli Kumru Tanıtıldı: İşte Özellikleri

Yerli Yapay Zeka Modeli Kumru Tanıtıldı

Türkiye merkezli teknoloji şirketi VNGRS, sıfırdan geliştirdiği yerli yapay zeka modeli Kumru’yu duyurdu. Özellikle kurumsal kullanıma yönelik tasarlanan Kumru, Türkçe dil işleme yetenekleriyle öne çıkıyor.

Kumru’nun Teknik Özellikleri ve Performansı

7.4 milyar parametreye sahip olan Kumru, 500 GB boyutunda temizlenmiş ve tekilleştirilmiş bir veri seti ile 300 milyar “token” (kelime veya kelime parçası) işlenerek eğitildi. Modelin en dikkat çekici özelliklerinden biri, Türkçe için özel olarak geliştirilmiş “tokenizer” yapısı. Bu yapı sayesinde Kumru, metinleri işlerken LLaMA-3 ve GPT-4o gibi çok dilli modellere kıyasla %40 ile %90 arasında daha verimli çalışıyor ve bu da işlem hızını ve maliyetini olumlu etkiliyor.

VNGRS tarafından yapılan açıklamaya göre Kumru, Cetvel Türkçe LLM (Büyük Dil Modeli) testlerinde LLaMA-3.3-70B ve Gemma-3-27B gibi kendisinden çok daha büyük modellere kıyasla daha yüksek puanlar elde etti.

Güçlü ve Zayıf Yönleri

Kumru’nun en başarılı olduğu alanlar yaratıcı metin yazma, özetleme, soru-cevap, metinleri yeniden yazma, başlıklandırma ve sınıflandırma gibi görevler olarak belirtiliyor. Buna karşın, modelin ezbere dayalı bilgi gerektiren sorularda ve matematik işlemlerinde zayıf olduğu ifade ediliyor. Geliştirici ekip, bu durumun modelin henüz pekiştirmeli öğrenme aşamasından geçmemiş olmasından kaynaklandığını ve gelecekteki güncellemelerle bu alanlarda iyileştirmeler hedeflendiğini belirtiyor.

Kurumsal Odak ve Veri Güvenliği

Kumru, genel son kullanıcıya hitap eden bir ürün olmaktan ziyade, özellikle finans ve sağlık gibi veri güvenliği regülasyonlarının sıkı olduğu sektörlerdeki kurumlar için bir çözüm olarak konumlandırılıyor. Modelin, yüksek donanım maliyetleri gerektirmeden kurum içi sunucularda (on-premise) çalışabilmesi, bu stratejinin temelini oluşturuyor.

Gelecek Planları

VNGRS’nin yol haritasında, Kumru’nun hatalarını en aza indirmek için pekiştirmeli öğrenme sürecinden geçirilmesi ilk sırada yer alıyor. Ayrıca, modele görsel ve taranmış dökümanları işleme yeteneği kazandırılarak çok modlu (multimodal) bir yapıya kavuşturulması hedefleniyor. Şirket, daha büyük ve yetenekli modeller ürettikçe, Kumru’nun 7 milyar parametrelik versiyonundan başlayarak eski modelleri açık kaynak olarak yayınlamayı planladığını da duyurdu.