ChatGPT’ye Türkçe rakip: Yerli yapay zeka “Kumru” kullanıma sunuldu!


Türkçe doğal dil işleme alanında yeni bir dönem başlatacak olan Kumru LLM, tamamen Türkçe verilerle eğitilen ilk büyük dil modeli olarak duyuruldu.
VNGRS tarafından geliştirilen model, 7,4 milyar parametreye sahip yapısıyla Türkçe odaklı yapay zekâ çalışmalarında yerelleştirilmiş, verimli ve özelleştirilebilir bir çözüm sunuyor. Kumru’nun yalnızca Türkçe için eğitilen tokenizer yapısı sayesinde çok dilli modellere göre %90’a kadar daha verimli çalıştığı belirtiliyor.
Model, 300 milyar token ve 500 GB veri içeren geniş bir eğitim setiyle oluşturuldu. Böylece Kumru’nun Türkçenin yalnızca sözcük yapısını değil, dilin doğal akışını da anlayabildiği ifade ediliyor.
Araştırmadan kurumsal uygulamalara kadar geniş bir kullanım alanına sahip olan Kumru; RAG tabanlı sohbet sistemleri, doküman özetleme, çağrı merkezi analitiği ve sosyal medya içerik üretimi gibi pek çok alanda kullanılabiliyor.
YERLİ YAPAY ZEKA KUMRU’NUN ÖZELLİKLERİ
Türk mühendisler tarafından geliştirilen Kumru LLM, tamamen Türkçe için eğitilmiş ilk büyük dil modeli olma özelliğini taşıyor. Model, doğal dil işleme alanında yüksek performans, verimlilik ve yerelleştirme kapasitesiyle öne çıkıyor.
TEKNİK ÖZELLİKLER
Parametre sayısı: 7,4 milyar
Eğitim verisi: 300 milyar Türkçe token, 500 GB veri
Tokenizer: Yalnızca Türkçe için özel olarak eğitilmiş tokenizer (çok dilli modellere göre %90’a kadar daha verimli)
Model tipi: Büyük dil modeli (LLM)
Eğitim dili: Tamamen Türkçe
YETKİNLİKLER
Metin üretimi, özetleme, yeniden yazma
Soru-cevap sistemleri
Konuşma ve diyalog üretimi
Doküman analizi ve özetleme
Chatbot ve müşteri destek uygulamaları
Sosyal medya içerik önerisi ve üretimi
KULLANIM ALANLARI
Araştırma ve akademik çalışmalar
Kurumsal yapay zekâ çözümleri
Çağrı merkezi analitiği
RAG tabanlı bilgi yönetimi sistemleri
Türkçe odaklı içerik üretimi ve medya uygulamaları