Türkiye’nin yapay zeka alanındaki en iddialı adımlarından biri hayata geçti. Yazılım şirketi VNGRS, tamamı Türkiye’de geliştirilen “Kumru” adlı yeni büyük dil modelini tanıttı. Kurum, Kumru’nun ChatGPT’ye alternatif değil, özellikle kurum içi kullanım (B2B) için tasarlandığını vurguladı.

Henüz 0.2.1 sürümünde olan model, 7,4 milyar parametreye sahip ve 500 GB’lık temizlenmiş Türkçe veri seti üzerinde eğitildi. Kumru, 8.192 token’lık bağlam (context) uzunluğuyla, Türkçe’ye özel geliştirilen tokenizer yapısı sayesinde yaklaşık 12 bin token’a kadar efektif işlem kapasitesi sunuyor.

Fotoram.io (77)

TAMAMEN SIFIRDAN TÜRKÇE EĞİTİLDİ

VNGRS ekibi, Kumru’nun Türkçe için sıfırdan geliştirilen ilk temel dil modeli (foundation model) olduğunu belirtiyor. Modelin LLaMA-3, Gemma-3, QWen-2 gibi çok dilli açık kaynak modellerle yapılan karşılaştırmalarda, Türkçe testlerde daha yüksek skorlar aldığı paylaşıldı.

Kumru’nun mimarisi, Mistral teknolojisi temel alınarak inşa edildi. Ancak şirket, modelin hiçbir hazır yapay zeka sisteminden türetilmediğini, “tamamen sıfırdan eğitildiğini” vurguladı. Bu yönüyle Kumru, yalnızca verileri değil, tokenizer yapısını da Türkçe’ye özel olarak tasarlayan ilk yapay zeka modeli oldu.

VERİ GÜVENLİĞİ AVANTAJI

VNGRS, özellikle finans ve kamu kurumları gibi veri gizliliği yüksek sektörlerin ChatGPT gibi küresel servisleri kullanmakta zorlandığını, bu nedenle Kumru’nun yerinde (on-premise) çalışacak şekilde tasarlandığını açıkladı.

Model, 16 GB VRAM kapasitesine sahip ekran kartlarında bile ek optimizasyon tekniklerine gerek kalmadan çalışabiliyor. Bu da kurumlara yüksek performans, düşük maliyet avantajı sunuyor.

Screenshot 2-4

"GPT'NİN İLK YILLARINDAKİ AŞAMADAYIZ"

Kumru ekibi, modelin henüz “pekiştirmeli öğrenme” (reinforcement learning) aşamasına geçmediğini, bu nedenle zaman zaman hatalı yanıtlar (halüsinasyonlar) üretebildiğini belirtti.

VNGRS’nin açıklamasında, “Şu anda OpenAI’ın GPT modellerinin 2022 başındaki davinci-001 sürümüyle aynı aşamadayız. GPT’nin geçtiği evrim sürecini biz de yakından takip ediyoruz” denildi.

AÇIK KAYNAK OLARAK DA PAYLAŞILACAK

Kumru’nun 7 milyar parametreli versiyonu kapalı test sürecinde. Ancak şirket, gelecekte daha büyük ve çok modlu (multimodal) sürümler geliştikçe mevcut modellerin açık kaynak olarak paylaşılacağını duyurdu.

VNGRS, kısa vadede Kumru’nun görsel verileri anlayabilen yeni bir versiyon üzerinde çalıştığını, uzun vadede ise modelin Türkçe’yi anlama ve üretme kabiliyetini derinleştirmeyi hedeflediğini bildirdi.

Kaynak: Kanal 6 Haber Merkezi