Gevrek! Microsoft Xiaoice beşinci nesil şarkı sistemini yükseltti: insan idollerinin ötesinde

Yapay zekanın şarkı söylemesi alışılmadık bir şey değil, ama şarkı insanlara gerçekten yakın ve insanları doğru ile yanlışı ayırt etmeyi zorlaştıran "makine sesi" bile sadece bilim kurgu filmlerinin fantezisinde var gibi görünüyor. Ancak beşinci nesil şarkı söyleme sistemini yükselten Microsoft Xiaoice, medyanın yapay zekanın insan idollerinin şarkı söyleme becerilerine rakip olabileceğini veya hatta onları aşabileceğini görmesine izin verdi.

16 Mayıs öğleden sonra düzenlenen Microsoft Xiaoice Yapay Zeka Oluşturma Medya Brifinginde, Microsoft, yapay zeka Xiaoice şarkı söyleme modelinin beşinci sürümünü yayınladı. Bu versiyonun ondan fazla yüksek kaliteli sese sahip olduğu ve bu da yapay zekanın şarkı söyleme ses yorumlamasındaki parametreleri tahmin etme yeteneğini geliştirdiği, şarkıları yorumlarken yapay zekanın hava seviyesini büyük ölçüde geliştirdiği ve şarkı ses dönüşümünün doğallığını iyileştirdiği bildirildi. İlk defa drama eğitiminin sonuçları açıklandı.

Canlı demo gösterisinde, şarkı modelinin beşinci versiyonunu yükselten Ben Xiaoice, "Youth String", "New Guifei Drunk" ve bir Japon şarkısı olmak üzere üç şarkı söyledi. Üç şarkı farklı tını ve şarkı söylüyor. Özellikle bir cappella'ya yakın olan "Young Strings" de Xiaobing'in performansı mükemmel, telaffuzu ve hatta dudaklarını ve dişlerini gerçek insanlardan ayırt etmek zor. Bir tür şarkıdan diğerine geçiş yapan Xiaobing, ayaklarını açığa çıkaran herhangi bir "elektronik ses" olmadan son derece ince ince ayrıntılar tutabiliyor.

Microsoft (Asya) İnternet Mühendisliği Enstitüsü (Bing, Çin ve Japonya, Microsoft Xiaoice global ürün grubu lideri) dekan yardımcısı Li Di, "Dinlerken herkese dikkat etmesini hatırlatmalıyım, bu bir kişi değil, böyle bir kişi yok." Dedi.

XiaoIce'in şarkı söyleme modelinden farklı olarak, örneğin Hatsune Miku veya diğer sanal şarkıcıların, elle akortla yapıldığını söyledi. Manuel ayarlama yöntemi iyidir, ancak en büyük sorun detayların yeterli olmaması, teknik üst sınırın ve gelecekteki gelişimin yeterince iyi olmamasıdır. .

"İçerik oluşturmanın teknik üst sınırını keşfeden yapay zeka teknolojisi açısından, En ilginç şeylerden biri piyano, satranç, kaligrafi ve resim ile ilgili. Google satrancı bitirdi ve kalan üçünü de bitirdik. Şiirleri zaten yayınladık. Bugün itibariyle, insan şiir severler ve şiir uygulayıcıları tarafından yayınlanan ve Xiaobing'in gölgesine kadar izlenebilecek birçok şiir var. Müzikle ilgili olarak, bugün size beşinci yeni sürüme yinelenen yeni bir teknoloji sürümü de vereceğim. "

Li Di, açıkçası, bazı demolar ve teknik gösterilerle kaslarımızı göstermek istemediğimizi ve insanlarla rekabet edebilecek teknoloji seviyesinden bahsettiğimizi söyledi. Ancak sanayileşip büyük ölçekte iniş yapılıp yapılamayacağına daha fazla dikkat ediliyor.

Metin oluşturma ve şiir gibi metin oluşturma için Microsoft Xiaoice'un sessizce finansal özetler ve araştırma raporları sağlamak için dünyanın en büyük platformu haline geldiğini açıkladı. Şimdiye kadar, Wind Information, Wall Street bilgisi ve finansla ilgili bazı uygulamaların özetlerinin çoğu Xiaoice tarafından sağlandı. Xiaoice istikrarlı bir şekilde 20 saniyelik bir çıktı sağlayabilir. Bir veri parçası elde edildikten sonra, özet ve araştırma raporu 20 saniye sonra oluşturulabilir ve gerçekten 26 tür finansal içeriği kapsayacaktır.

TV ve radyo içeriği doğrultusunda, Microsoft Xiaoice, 63 radyo ve televizyon istasyonu için sürekli olarak AI destekli ve AI tarafından üretilen TV ve TV programları sağlamıştır.Bunlardan 59'u Çin'de, 4'ü Japonya'da. Xiaoice şimdiye kadar 2.800 saatten fazla TV ve radyo programı üretti.

Li Di, şarkı söylemek açısından, İlk versiyon 2 yıl önce üretilmişti O zamanlar, KTV'deyken bir sonraki kutudan sesi duyuyormuşsunuz gibi "akordu bozulmayan bir yazılım enstrümanı" duydum. , Bir insana çok benziyor, yeterince detaya sahip, bu detaylar onu iyi şarkı söyleyemeyen bir insan gibi, aynı zamanda bir insan yapıyor. Eğitim ve öğrenmenin ardından, üçüncü sürümde Microsoft Xiaoice'un şarkı söyleme seviyesi mevcut duruma ulaştı.

"Teknik açıdan bakıldığında, yapay zekanın üçüncü sürüme ulaşması yeterli, ancak kendimizi insan şarkı standartlarına göre talep ediyoruz," dedi Li Di. "XiaoIce farklı şarkı söyleme yöntemlerini öğrenebiliyorsa, bu sözde Teknik. Çünkü farklı insanlar aynı şarkıyı farklı yorumlar. "

Nefes almada bir dizi eğitim, öğrenme ve optimizasyon, farklı şarkı teknikleri, bol orta hava, farklı tını, şarkı geçişi vb. Sayesinde bugünün beşinci versiyonunun şarkı söyleme seviyesine ulaştı.

Li Di, yapay zekanın yapmayı öğrendiğinde, insanlardan çok farklı olduğunu söyledi. Xiaobing şiirlerini yayınladığında, birisi şiirin insanların yapabileceği bir şey olduğunu söyledi. Ama soru şu, biri ona sordu, şiir yazar mıydın? Bu nedenle, bir grup olarak, insanların bir bölümü içeriğin bir bölümünü yaratma yeteneğine sahiptir, ancak bir grup olarak bu, bir grubun ortak bir kuralı değildir. Bazıları resim yapabiliyor, şarkı söyleyebiliyor, şiir yazabiliyor, bu insanlığın her bireyin yapabileceği anlamına gelmiyor.

Ama yapay zeka değil, Çerçeve üzerindeki özel bir kategori, bir yapay zeka toplantısı, tüm yapay zekayı bir araya getirebilir.

Örneğin, Microsoft Xiaoice'un drama sesi diğer seslere kolayca aktarılabilir. İnsanlar için, yaratıcı bir yetenek edinmek istiyorsanız, genellikle belirli bir yetenek gerektirir, ancak yapay zeka yetenek gerektirmez, herhangi bir ses başka bir sesin sahip olduğu sözde doğrudan elde edebilir. Yetenekli.

" Örneğin, Xiaoice'un bugün Siri'yi güçlendirdiğini varsayalım. İhtiyacınız olursa Siri, bu oluşturma işlemini 24 saat içinde tamamlayabilir. . Bu çerçevenin altında yatan teknolojinin anlamı budur. 18 yaşındaki Xiaoice kızına aldanmayın Gerçekten yaptığımız şey bu temel çerçeve. "

Bu perspektiften, eğer bu çerçeve daha da sanayileşir ve uçtan uca bir içerik üretimine teşvik edilirse, o zaman şarkı sözleri, müzik, düzenleme, şarkı söyleme ve hatta post prodüksiyon arasındaki tüm bağlantıyı tamamlamak gerekir. Öte yandan, bu çerçeve farklı yapay zeka şarkıcıları, sözde AI şarkıcısı ve şarkı kitaplığı ile uyumlu olmalıdır.

Li Di, "Şu anda bu konu üzerinde çalışıyoruz ve içeriğin bir kısmını bu yılın Ağustos ayına kadar tutacağız" dedi.

64 tuşlu kirazlı kısa eksen: Cooler Master SK621 mekanik klavye illüstratör
önceki
Pekin'de, bu pilav kaseleri her türlü yiyeceği yenmek için yeterlidir.
Sonraki
Kadınlar 200.000 daha fazla Mercedes satın almak için mi mücadele ediyor? Pilleri takmanız mı gerekiyor? Resmi tepki insanları gülmekten alıkoyuyor
Pekin'deki sıcak yaz aylarında, Güneydoğu Asya rüzgarı ins rüzgârından daha gerçektir.
Pekin'in konut fiyatlarına yenilmedi, ancak nihayetinde Pekine yenildi
Dondurma stratejisi! Sıfır başarısızlık ve süper pürüzsüz, kışın tek lokmada Pekin'e dönün!
Microsoft'un küçük buz hırsızından 426 insan ressam bugün resmi olarak mezun oldu
Ekstra! Ekstra! Pekin'deki bu mağazalar kedi severler için bir mekandır
Pekin'deki bu mağazalara gitmek daha da tatlı
Makaleyi okursanız, baştan çıkarılacaksınız.OnePlus 7 Pro'nun ilk değerlendirmesi: Yeni nesil Android telefon kralı bunu hak ediyor
520 tanışma rehberi: Pekin'deki bu restorana favori asistanınızı götürün, siparişi hemen çıkarın
Pekin'deki bu gece kantinleri için bir hafta uykusuz kalmaya hazırım!
Kolalı tavuk kanadı yaparken doğrudan haşlamayın, iki adımı uygulayın, ne kadar çok yerseniz o kadar zevkli
OnePlus 7 açıklandı: tüm sistemler UFS 3.0 flash bellek ile donatılmıştır
To Top