OpenAI, Ses Klonlama Aracı Voice Engine'i Tanıttı: Yalnızca 15 Saniyelik Bir Örnekle İnsan Sesini Kopyalayabiliyor!

Yapay zekâ deyince akla gelen birinci şirket elbet OpenAI. Teknoloji devi, sohbet botlarından görsel üretmeye kadar birçok farklı alandaki modeliyle âdeta girdiğimiz yeni çağa öncülük ediyor. Son olarak kendisini herkesin ağzını açık bırakacak derecede gerçekçi görüntüler oluşturan “Sora” modeliyle görmüştük.

OpenAI, artık de yesyeni bir modelini duyurdu. “Voice Engine” ismi verilen bu araç, insan sesini gerçekçi bir formda kopyalıyor.

15 saniyede gerçek insan sesini klonlayabiliyor

Bu şirketin ses odaklı birinci atağı değil. Hâlihazırda yapay zekâ dayanaklı ses araçlarına sahipti. ChatGPT’yle konuşmamızı sağlayan özellik bunun en âlâ örneği. Voice Engine de şirketin metinden ses üretme gayretlerinin bir modülü. OpenAI’a nazaran bu araç, aslında 2022’den beri küçük bir küme üzerinde test ediliyor.

Voice Engine’in ne olduğunu kısaca açıklayalım. Bu araç, aslında bir ses klonlama modeli. Yalnızca 15 saniyelik bir örnekle gerçek bir insanın sesini ayırt edilemeyecek derecede kopyalayabiliyor. Bunun akabinde kullanıcı istediği bir metni girerek yapay zekânın ürettiği kopya sese istediği şeyi okutabiliyor. Ayrıyeten klonlanan sesi farklı lisanlara de çevirmek mümkün oluyor.

OpenAI, paylaştığı blog gönderisinde modelin nerelerde kullanılabileceğine dair bilgiler de verdi. Bunlar ortasında okuma yardımı, içerik çevirisi, konuşma bozukluklarına sahip şahıslara yardım etme üzere maksatlar yer alıyor.

OpenAI, güvenlik kaygıları nedeniyle şimdi Voice Engine’i kullanıma sunmuyor

Voice Engine, geniş çapta kullanıma sunulmadı. Şirket, bunun ana nedeninin bu türlü bir klonlama teknolojisinin getireceği riskler olduğunu tabir ediyor. Hatta en başta geliştiricilerin katılabileceği bir program oluşturmayı planladığı lakin oluşabilecek meselelerden ötürü iptal ettiğini bile ekliyor. Esasen şu an test edilen kümeye da isteği olmadan ses kullanımını yasaklayan mukaveleler imza atılmış.

Güvenlik konusu sahiden önemli bir sorun. Günümüzde deepfake teknolojilerin ne kadar geliştiğini biliyoruz. Her yerde geçersiz imajlar ve sesler görüyoruz. Ünlü isimleri taklit eden uygunsuz içerikler, dolandırıcılık amaçlayan imgeler ve selser bunların en uygun örnekleri. Bu yüzden OpenAI’ın Voice Engine modeli çok riskli. Şirket de bunun farkında. Bu yüzden şimdi geniş çapta çıkarma üzere bir planları yok. Yani ne vakit geleceğini bilemiyoruz.

OpenAI, Voice Engine ile oluşturulan ses kayıtlarını sitesinden paylaştı. Buradaki temasa tıklayarak örneklere ulaşabilrisiniz. İkili yahut üçlü olarak paylaşılan kayıtlarda üstte bulunanlar gerçek insanlara, “Generated audio” olarak paylaşılan alttakiler ise yapay zekâya ilişkin.

Bilişim Uzmanları

OpenAI, Ses Klonlama Aracı Voice Engine’i Tanıttı: Yalnızca 15 Saniyelik Bir Örnekle İnsan Sesini Kopyalayabiliyor!

OpenAI, Ses Klonlama Aracı Voice Engine’i Tanıttı: Yalnızca 15 Saniyelik Bir Örnekle İnsan Sesini Kopyalayabiliyor!

Bilişim Uzmanları