Microsoft Xiaoice diyalog, şarkı söyleme ve metaforu nasıl öğrenir? Üç baş bilim adamı ilkelerden bahsetti

Microsoft'tan Guo Yipu Qubit Raporu | Genel Hesap QbitAI

"Şarap gibi aşk, programcılar için bir lükstür."

Bu, "benzetme" retoriğini öğrenirken Microsoft Xiaobing'in verdiği bir cümledir.

Şu anda, 450 milyon üçüncü taraf akıllı cihaz XiaoIce ile donatılmıştır ve XiaoIce'in çok yönlü diyalogu (CPS) en yüksek 23 tur sayısına ulaşmıştır.

Son 5 yılda, Xiaobing ekibi AAAI I JCAI ACL KDD EMNLP ve diğer önemli konferanslarda 48 makale yayınladı ve 72 patent için başvuruda bulundu. Bunların arasında 3 ACL, 4 EMNLP, 1 Interspeech ve 1 bu yıl yayınlandı. ACM MM uzun bir kağıt.

Yakın zamanda yapılan bir atölyede, Microsoft XiaoIce Baş Bilimcisi Song Ruihua, Microsoft XiaoIce Baş NLP Bilimcisi Wu Wei ve Microsoft XiaoIce Baş Ses Bilimcisi Luan Jian, XiaoIce'in son yıllardaki teknik başarılarını paylaştı.

Kendi kendini tamamlayan bir diyalog robotuna doğru

Bundan önce, XiaoIce, çoklu diyalog turlarının ritmini ve yönünü kontrol edebilen "garip sohbet" becerisinde ustalaştı.Microsoft XiaoIce'in baş NLP bilimcisi Wu Wei, adını verdiği bu sürecin arkasındaki teknolojiyi tanıttı. Kendi kendini tamamlayan bir diyalog robotuna doğru .

Kendi kendini tamamlayan, yani kendi kendini tamamlayan bir robotun üç beceriye ihtiyacı vardır:

1. Öğrenme yeteneği, sadece insan konuşmalarından öğrenme değil, aynı zamanda farklı robotların Ortak-öğretme modeli yardımıyla birbirlerinden öğrenmesine izin verme;

2. Bağımsız olarak yönetebilme İlk aşama, tek bir diyalog turunun nasıl ifade edileceğini bilmektir ve ileri aşama, tüm diyalog sürecini kontrol etmektir;

3. Dünyaya dağılmış multi-modal bilgiyi bağlama yeteneği.

Üç yeteneğin yanı sıra, alma modeli (Erişim Modeli), nesil modeli (Nesil Modeli) ve empati modelini (Empati Modeli) birleştiren Xiaoice, diyalog sürecini özerk bir şekilde kavrayabilir.

Xiaobing'in şarkı söyleme becerileri ortaya çıktı

Microsoft Xiaobing gülerek şarkı söylüyor Qubit'ten 00: 0001: 16

Microsoft Xiaobing'in baş ses bilimcisi Luan Jian, Xiaobing'in şarkı söyleme becerilerini ortaya çıkardı.

Her şeyden önce, şarkı söylemenin üç unsuru vardır: telaffuz, vuruş ve perde.

Peki, AI bir şarkıyı nasıl öğrenir?

İki yöntem vardır: Birincisi, insanlar tarafından söylenen şarkıları öğrenmek ve insan şarkıcıların orijinal şarkılarını dinlemektir.Bu aynı zamanda insanların şarkı söylemeyi öğrenmeyi tercih ettiği yöntemdir.Ama makinenin şarkı söylemeyi öğrenmek için melodiyi bu şekilde yargılaması gerekir ki bu, hatalara daha yatkındır.

İkincisi, şarkının müziğine bakmak ve doğrudan müzik notasından söylenen bir ses dosyası oluşturmaktır.Bu, insanlar için daha karmaşık, ancak makineler için daha kolaydır.

Bundan sonra, şarkı söyleyen bir sesi sentezlemenin iki yolu vardır.

Biri Birim ekleme , Tek tek sesleri bulmak ve bir araya getirmek için.

Perdeyi dikkate almazsanız, baş harflerden ve finallerden oluşan yaklaşık 400 tek hece vardır. Bu 400 hecenin farklı versiyonlarını önceden uzun ve kısa, tiz ve bas olarak kaydedin ve bir ünite kitaplığı oluşturun ve ardından belirli şarkının telaffuz gereksinimlerine göre Birleştirilecek birim kitaplığından birimi seçin.

Bununla birlikte, bu yöntem pürüzsüz olmayabilir ve kelime kelime atlama hissi olacak ve melodinin geçişi sertleşecektir.

Diğeri Parametre sentezi Bunu yapmak için Gizli Markov Modelini kullanma.

Bu yöntem, enerji spektrumu, süre ve aralık dahil olmak üzere akustik parametreleri büyük miktarda kayıt verisinden çıkarır ve ses dalga biçimini akustik parametreler ve bir ses kodlayıcı aracılığıyla yeniden oluşturur.

Bu yöntemle elde edilen sonuçlar çeşitlilik bakımından zengindir ve hiç var olmayan sesler yaratabilir, ancak ses kodlayıcının yeniden yapılandırılması sırasında ses kalitesi kaybına neden olabilir.

XiaoIcein şarkı söyleme becerileri, müzik notasından üç ana telaffuz, vuruş ve perdeyi toplayan ve ses spektrumu parametrelerini, ritim sırasını ve perde yörüngesini üç modelle ayrı ayrı modelleyen ve parametreleri tahmin etmek için sinir ağını kullanan parametre sentezi yöntemine dayanmaktadır. Daha sonra bu parametreler vocoder tarafından üretilir.

Sonraki yinelemelerde, modülerlik de kullanıldı ve üç model bir araya getirildi, böylece sentezlenen şarkı sesinin doğallığı ve akıcılığı iyileştirildi.

Xiaobing Metaforları Nasıl Öğrendi?

Microsoft Xiaoice'un baş bilim adamı Song Ruihua, Xiaobing'in metaforları öğrenme sürecini tanıttı.

Xiaobing'in metaforunun ilham kaynağı bir paragraftan geliyor:

Ne tür bir cümle olursa olsun, "aynısı aşk için de geçerlidir" demek mantıklıdır.

Örneğin, "insanların iki bacağı vardır ve aşk böyledir", "aşk her zaman gidecek" veya "aşk her zaman gelecek" olarak anlaşılabilir.

Bu mantık altında ontolojiyi, metaforu ve ara açıklamayı bulmak için birçok olasılık vardır:

Örneğin, "Şarap gibi aşk, programcılar için bir lükstür."

Bununla birlikte, büyülü metaforlar da üretebilir:

"Aşıklar güvenilir raporlar gibidir"

- Bitiş -

Qubit QbitAI · Toutiao İmzalı

Bize dikkat edin ve en son teknolojideki en son gelişmeleri alın

Şampiyonlar Ligi'nde tek bir maçta en az 4 gol attı, sadece Messi ve Lewandone iki kez attı
önceki
Toplam tahmin 490 milyon ve Qiaotou Ji South Road inşaatı ihaleye açık
Sonraki
56 yaşındaki Pan Shiyi Python öğrenmeye kararlı, 60 yaşındaki programlama dili babaları hala kod yazıyor, peki ya sen
Jining Tıp Fakültesi: "Orijinal kalbi aydınlatın, sağlam bir görev oluşturun ve güvenliği koruyun" yangın tatbikatı
Flying Paddle Uçtan Uca Geliştirme Kiti Ortaya Çıktı: Düşük Maliyetli Geliştirme İçin Dört Gizli Silah
son ilerleme! Guilin, Lingui Bölgesi'ndeki ilk ilkokulun yeni yerinde inşaat başladı ve 2020'de tamamlanması bekleniyor
Gökbilimciler Musk'ın uydu yayınından şikayet ettiler: uzayı kirletiyor, karanlık gece deneyimi gitti
Hassas kas haline gelirse "tıbbi güzellik izolatörü" olacak mı?
Boston Dynamics'in başkan yardımcısı, anlaşılmaz genişlememden sonra bana bir mektup yazdı.
Önce Gaye faul yaptı, hakem VAR'ı izledikten sonra külotlu çoraptaki kırmızı kartı iptal etti
Geçen hafta 914 yeni ev tescil edildi! 2 saf yeni diskin ortalama fiyatı 1.8000-19.000 yuan /
İlk yarı-Benzema golü VAR külotlu çorap kırmızı kartını iptal etti, Real Madrid evinde geçici olarak Paris'i 1-0 önde geçti
Google X çöp ayıklama robotu ortaya çıktı, artık kuru ve ıslak çöp arasında kafa karıştırmaktan korkmuyor
Tembel kadın! İşte kilo vermenin daha kolay bir yolu
To Top