Teknoloji

Google, İnsan sesini çok net sentezlemeye başladı !

Yakın zamanda insan sesini ayrıt edemeyeceğiz gibi..

Google, üzün süredir üzerinde çalıştığı metinleri konuşmaya çeviren Tecatron 2. nesil teknolojinin geliştirmesini tamamlamış durumda.



Uzun süredir, Çeviri, Haritalar ve diğer pek çok uygulama üzerinde makine dilini geliştirmek için pek çok uğraş veren Google sonunda en iyi kalitede bir sonuç ortaya sunuyor.

Google mühendisleri, sentetik konuşmanın insan konuşmasından ayırt edilmesinin zor olduğu bir sonuca ulamış durumda.


Bu yeni teknoloji, doğru noktalama ve aksan sağlar. İsimler, şehir adları gibi birşey olmadığında en başa büyük harf koyar. Bu sonuçları elde etmek için 2 sinir ağı kullanılır.

İlki sıradan metni bir sesli programa dönüştürür, ses frekanslarının temsili görsel halidir. Elde edilen sonuç, yapay zeka çalışması ile uğraşan İngiliz şirketi DeepMind tarafından geliştirilen WaveNet adlandırılan ikinci ağa gönderilir. İkinci ağda ise şu işlemler uygulanır:

WaveNet‘in analoglar üzerindeki en büyük avantajı tamamen özerk modda çalışabilme yeteneğidir. Önceden kaydedilmiş seslerden oluşan geniş bir veritabanına erişimi gerekmez. Bunun yerine, ağ ilk sinir ağı tarafından sağlanan spektrogramlara dayalı kendi seslerini üretir.


Gerçekten başarılı işlere imza atan Google her geçen gün yeni işlerde bir adım daha ileriye gidiyor.

Google’ın yeni konuşma motorunun kalitesini dinleyerek değerlendirmek için Buraya tıklamanız yeterli.

İlgili Makaleler

Bir Cevap Yazın

Kapalı
Kapalı
%d blogcu bunu beğendi: