e
sv

Microsoft, Saniyeler İçerisinde Herhangi Bir İnsanın Sesini Taklit Edebilen Yapay Zekâsı VALL-E’yi Tanıttı

avatar

OyunHaberleri

  • e 0

    Mutlu

  • e 0

    Eğlenmiş

  • e 0

    Şaşırmış

  • e 0

    Kızgın

  • e 0

    Üzgün

Microsoft, yeni yapay zekâ modeli VALL-E’yi canlandırıyor. Sistem, yalnızca üç saniyelik örneklerden yola çıkarak bir insanın sesini taklit edebiliyor.

Son zamanlarda yapay zekanın ciddi oranda sahip olduğunu ve popülerlik kazandığını iddia ediyor. Midjourney, DALL-E gibi metinlerden görsel bileşen sistemler ve ne sorarsak soralım yanıt veren ChatGPT gibi modeller tüm dünyada ses getirmişti. Şimdi ise Microsoft’tan yepyeni bir yapay zekâ hamlesi geldi.

ABD’li teknoloji devi, metinden ses oluşturabilen yapay zeka modeli’VALLE’yi portre. Yapay zeka konusunda çığır açabilecek sistem, insan seslerini oldukça kolay bir şekilde taklit edebildiği ifade edildi. Tabii bu tarz bir teknoloji bazı endişeleri de beraberinde dile getirdi.

Yalnızca 3 saniyelik bir örnek kullanarak sesleri taklit edebiliyor

Ars Technica’nın bildirdiğine göre VALL-E, yalnızca saniye üçlük bir ses örneklemei kulanarak bir insanın sesini taklit edebiliyor. Hatta yapabildiklerinin sınırlı kalmadığı, yapay zekanın bakışının duygusuna göre çıkan ses tonuyla elde ettikleri sonuçları bile çıkarabildiği söyleniyor.

Microsoft, bir dil modeli olan VALL-E’nin Meta’nın Ekim 2022’de tanıttığı ‘EnCodec’ ismi verilen teknolojiden yararlandığını aktarıyor. Model, normalde gördüğümüz benzer sistemlerin aksine metinden ve seslerden faydalanarak sonuçlar çıkarıyor. Temel olarak, bir kişinin nasıl ses çıkardığını analiz ediyor, EnCodec sayesinde bu kullanıcı ayrı bir tesisate bölüyor ve eğitim karşılaştırması eşleştiriyor. Sonuç olarak bunun örneğindeki ses taklitleri farklı cümleler ortaya çıkarılıyor.

Yapay zekâya ilişkin ipuçları bir makale de araştırmacının VALL-E’yi, 7.000’den fazla bakıştan 60.000 İngilizce kullanmak dilindeki ses kayıtlarını ilettiğini aktarıyor. Sistemin iyi bir sonuç çıkarması için de kuşlardeki sesin, eğitim verilerindeki bir sese yakın olması gerektiği söyleniyor.

İLGİLİ HABER

Yaşam Yıllık Mumyalar, Yapay Zeka ile Canlandırıldı

Microsoft, VALL-E’den çıkan bazı Git örnekleriHub üzerinden yayınlandı. Örnekler taramak, yapay zekanın bazı yerlerde robot sesiyle gezinirken görülüyorse de bazılarında ise şaşırtıcı derecede yüksek gerçekçi olduğu görülüyor. Ayrıca resimlerde VALL-E’nin görüşmesinin tonunu koruduğu; hatta geçen hafta göre sonuç üretimi da görülebiliyor. Örneğin, asıl konuşma yankılayan bir yerden konuşuyorsa, sistem de buna göre ses veriyor.

Bu tarz bir yapacakları riskleri de yok değil

Tabii ki bu tarz bir teknoloji biraz endişe verici. Kötü niyetli kişiler, bir insanın söylemediği bir şeyi silmek gibi göstermesini sağlayabilir, onların kimliğine bürünebilir ve dolandırıcılık gibi birikim artışının nedeni olabilir. Son dönemlerde iyice popülerleşen deepfake’in barındırdığı riskler gibi düşünür. Microsoft, risklerden dolayı kodu açık kaynaklı yapmamayı Benzer teknolojilerin seçilmesiyle bu riskler beraberinde getirilebilir.

İLGİLİ HABER

Yapay Zekâ ChatGPT, içsel Eğitimine Zarar Verdiği Gerekçesiyle Okullarda Yasaklamaya Başladı

:
https://arstechnica.com/information-technology/2023/01/microsofts-new-ai-can-simulate-anyones-voice-with-3-seconds-of-audio/

etiketlerETİKETLER
Üzgünüm, bu içerik için hiç etiket bulunmuyor.
okuyucu yorumlarıOKUYUCU YORUMLARI

Yorum yapabilmek için giriş yapmalısınız.