ChatGPT, yapay zekâ destekli sohbetlerinin bot günümüze ulaştığı en yüksek seviyeyi son dolaşıyordu. ChatGPT’yi besleyen dil modeline meydan okuma olan dil modelleri de diğer teknoloji işletmelerinin yoğunlaştığı bir alan olmaya başlamıştı.
Bir yanda Google, kendi dil modeli LaMDA’yı deneyimlemeye devam ederken geçen hafta Meta’dan da büyük haber geldi. Meta, bilim çeşitliliği katkı sağlamayı amaçlayan dil modeli LLaMA’yı tanıtmıştı. Yalnızca genel bölümler açık olan dil modeli, ilk haftasında sızdırıldı.
LLaMA, göndermek isteyenler herkes tarafından kullanılabilir oldu:
‘llamanon’ adlı 4chan kullanıcı, LLaMA’nın 7 milyar ve 65 milyar parametreye sahip versiyonlarını torrent yoluyla sızdırdı. Halkın kullanımına açık olmayan dil modeli, GitHub’da yayımlanan bir kütüphane çapında erişilebilir oldu.
Kısa bir süre sonra ise GitHub’da ‘shawwn’ adlı bir kullanıcı tarafından, LLaMA’nın tüm mülklerinin edinimi ve kullanımına ilişkin bir kütüphane açıldı. LLaMA’nın tüm zırhlıları, toplam 219 GB’lık boyuta sahip.
Tabii dil verimliliği Verimli bir şekilde çalıştırmak için aşırı yüksek işlem gücüson derece tuzlu fiyat etiketine sahip ekran kartı donanımlarına sahip olmanız gerekiyor.
Meta, taramayı internetten almak için henüz bir eylem yapılmadı.
LLaMA, OpenAI’ın dil modellerine meydan okumalar olabilir mi?
LLaMA’nın sızdırılan sürümlerini indirerek testler gerçekleştiren bazı kullanıcılar, dil modelinin en az ‘da Vinci‘ modeli kadar gelişmiş olduğunu ifade etti. OpenAI’nın davinci modeli, geçmiş haftaya kadar herkesin erişebildiği ve kendi sohbet botlarını oluşturabildiği bir dil modeliydi.
Dil modelinin tam olarak ne kadar gelişmiş olduğunu henüz bilemiyoruz. Ama öyle görünüyor ki OpenAI, bugünün ChatGPT’sini oluşturan ‘gpt-3.5-turbo‘ dil modeli ise zirvede yer almaya devam ediyor.
Meta, bu dil modeli neden herkese açıktı?
ChatGPT’nin vereceği yanıtlar, dil modelinin bir şekilde kullanılabileceği (hatta görüşeceğin) da bir işaretti. Meta da devasa bir şirket olduğundan ve adı karalamak istemediğinden aslında bu kullanıcı kullanımı olarak tutulmak desteklenmek istemedi.
Şirket, bu nedenle dil yapısını yalnızca yapay zeka alanında çalışan insan bilimlerinin kullanımına açtı. Dil modelinin amacı, daha gelişmiş ailenin daha gelişmiş dil modellerinin özelliklerini elde etmek için bir temel olmak idi.
İLGİLİ HABER
Yorum Yaz