Son Haberler

17:00

Tesla, Elektrikli Araç Pazarındaki Varlığını Güçlendirmek İçin Fas'a Güveniyor
16:15

Hong Kong: Yıkıcı yangında ölü sayısı 151'e yükseldi
15:30

Gazze'de Savaş, Çocukluğu Bir Hayatta Kalma Yüküne Dönüştürüyor
14:43

Majesteleri Kral'ın Yüksek Himayesinde: 19. Dünya Su Kongresi'nin Marakeş'teki Açılışı
14:00

Fas, NATO ile Kriz ve Doğal Afet Yönetimi Konusunda Uluslararası Çalıştaya Ev Sahipliği Yaptı
13:15

PKK'nın bir yöneticisi, "Öcalan serbest bırakılmadan Türkiye ile başka bir adım atmayacağız" dedi
12:15

Savunma Sanayii Küresel Çatışmalar Sırasında Rekor Gelirlere Ulaştı
11:30

Dakhla Limanı: Fas'ın Atlantik Deniz Ticaretindeki Etkisini Güçlendirme Hedefi
11:03

Trump, Maduro ile telefon görüşmesini doğruladı, Venezuela ABD'nin saldırı hazırlıklarını eleştirdi
10:44

Bangladeş: Mahkeme, Şeyh Hasina ve Tulip Siddiq'i yolsuzluk davasında mahkum etti
10:20

Honduras erken seçim sonuçları, Trump'ın desteklediği adayı önde gösteriyor
10:00

Etiyopya: DSÖ, 8 ölüm ve 12 Marburg ateşi vakasını doğruladı
09:35

Asya, Ölü Sayısı 1.000'e Yaklaşırken Felaket Sel Felaketi ile Sarsılıyor
09:15

Fas, Afrikalı Terör Mağdurlarına Adanmış İlk Uluslararası Zirveye Ev Sahipliği Yapacak
08:28

Trump, "Üçüncü Dünya" ülkelerinden göçü askıya aldığını duyurdu: Etkilenen 19 ülke açıklandı
08:19

ABD, Florida'da Ukrayna ile yapılan görüşmelerin ardından ilerleme kaydetti, ancak anlaşmaya varmak için daha fazla çaba gerekiyor
07:45

Hong Kong: Konut Kompleksi Yangını Sonrası 159 Kişi Güvende Bulundu

Namaz Saatleri

Fajr
Güneşin Doğuşu
Dhuhr
Asr
Maghrib
Isha

Diğer Şehirlerin Saatleri

Advertising

Facebook’ta Bizi Takip Edin

Walaw

Advertising

teknoloji

Meta, insan sesini taklit etmek için Spirit LM yapay zeka modelini başlattı

Salı 22 Ekim 2024 - 08:45

Meta, ses üretiminde yapay zekadaki multimodal modellerle ilgili zorlukları ele alan yeni açık kaynak modeli “Spirit LM”yi piyasaya sürdü.

Yeni model, daha karmaşık ve gerçekçi yollarla sesli iletişim kurabilen akıllı robotların geliştirilmesinde ileri bir adım olan, daha doğal ve etkileyici bir ses deneyimi sunmayı amaçlıyor.

"Spirit LM" modeli, 7 milyar parametre içeren, önceden eğitilmiş bir dil modeline dayanmaktadır ve otomatik konuşma tanıma (ASR) teknolojilerine dayanan geleneksel modellerden sesi farklı şekilde işleme yeteneğiyle öne çıkmaktadır.

Meta, geleneksel yaklaşımın sesin birçok doğal ifadesinin kaybolmasıyla sonuçlandığına dikkat çekiyor. Bu nedenle Spirit LM, bu sınırlamaların üstesinden gelmek için fonemlerin, tonların ve perdelerin kullanımına güvenerek, doğal sesler üretmesine ve konuşma tanıma, metinden metne dönüştürme ve ses sınıflandırması gibi yeni görevleri öğrenmesine olanak tanır.

Meta, bu modeli bir araştırma makalesinde ortaya koydu ve modelin ses performansı örneklerinin yanı sıra "Spirit LM"nin geliştirilmesine yol açan araştırmanın ayrıntılarına da değinerek gelecekteki yetenekleri hakkında net bir fikir verdi.

Model şu anda geliştiricilerin ve araştırmacıların kullanabileceği ve genişletebileceği açık kaynaklı bir proje olarak mevcut ve gelecekte WhatsApp, Instagram ve Facebook gibi meta uygulamalarda da kullanılması ve kullanıcıların doğal ses aracılığıyla yapay zeka ile etkileşime girmesine olanak sağlanması bekleniyor. . OpenAI tarafından yakın zamanda tanıtılan gelişmiş ses moduna benzer ifadelerle dolu konuşmalar.