- 09:30Trump'ın Vergi Politikası: Amerikan Çıkarları ve Uluslararası Bağlantısızlık Arasında
- 09:18Fas, girişimcilik ekosisteminde ivme kazanıyor
- 08:53Fas, Japonya'ya ilk narenciye ihracatını gerçekleştirdi
- 08:43Sızıntılar Trump'ın Dışişleri Bakanlığı'nı yeniden yapılandırma planını ortaya koyuyor
- 08:32Papa Francis 88 yaşında öldü: dünya yas tutuyor
- 08:10Askeri Mahkeme, Katarlı üst düzey subaylar için hukuk eğitimi düzenliyor
- 07:34Pierre-Henri Dumont, Sahra'daki Fas özerklik girişimine açık destek çağrısında bulundu
- 23:27BMW, Çin'deki hizmetlerine yapay zekayı entegre etmek için ByteDance ile ortaklığını güçlendiriyor
- 20:15ABD'nin Fas Sahrası'nı Tanıması: Marco Rubio Net Bir Mesaj Gönderiyor
Facebook’ta Bizi Takip Edin
Meta, insan sesini taklit etmek için Spirit LM yapay zeka modelini başlattı
Meta, ses üretiminde yapay zekadaki multimodal modellerle ilgili zorlukları ele alan yeni açık kaynak modeli “Spirit LM”yi piyasaya sürdü.
Yeni model, daha karmaşık ve gerçekçi yollarla sesli iletişim kurabilen akıllı robotların geliştirilmesinde ileri bir adım olan, daha doğal ve etkileyici bir ses deneyimi sunmayı amaçlıyor.
"Spirit LM" modeli, 7 milyar parametre içeren, önceden eğitilmiş bir dil modeline dayanmaktadır ve otomatik konuşma tanıma (ASR) teknolojilerine dayanan geleneksel modellerden sesi farklı şekilde işleme yeteneğiyle öne çıkmaktadır.
Meta, geleneksel yaklaşımın sesin birçok doğal ifadesinin kaybolmasıyla sonuçlandığına dikkat çekiyor. Bu nedenle Spirit LM, bu sınırlamaların üstesinden gelmek için fonemlerin, tonların ve perdelerin kullanımına güvenerek, doğal sesler üretmesine ve konuşma tanıma, metinden metne dönüştürme ve ses sınıflandırması gibi yeni görevleri öğrenmesine olanak tanır.
Meta, bu modeli bir araştırma makalesinde ortaya koydu ve modelin ses performansı örneklerinin yanı sıra "Spirit LM"nin geliştirilmesine yol açan araştırmanın ayrıntılarına da değinerek gelecekteki yetenekleri hakkında net bir fikir verdi.
Model şu anda geliştiricilerin ve araştırmacıların kullanabileceği ve genişletebileceği açık kaynaklı bir proje olarak mevcut ve gelecekte WhatsApp, Instagram ve Facebook gibi meta uygulamalarda da kullanılması ve kullanıcıların doğal ses aracılığıyla yapay zeka ile etkileşime girmesine olanak sağlanması bekleniyor. . OpenAI tarafından yakın zamanda tanıtılan gelişmiş ses moduna benzer ifadelerle dolu konuşmalar.
Yorumlar (0)