Affect-LM Özel duyarlı metin üretimi için bir sinir dili modeli

Siz ve "AI'yı Anlamak" arasında yalnızca bir kağıt var

Pek çok okuyucu, nispeten basit AI bilimi ve AI metodolojisi hakkında daha fazla şey okuduklarını ve derinlik, kalınlık, vizyon ve ağır zevk içeren profesyonel makaleler okumak istediklerini söyleyerek Xinjun'un sahne arkasına mesajlar bıraktı.

Bu amaçla, AI alanındaki birçok uzman ve akademisyenin yardımıyla, bir dizi en iyi konferans belgesini yorumladık ve tercüme ettik. Her makalenin tercümesi ve redaksiyonu tamamlandıktan sonra Xinjun ve yazı işleri bölümündeki öğretmenler birlikte gülüp çökecekler, tabii bazı kağıtlar için ağlamalıyız.

Öğrencilerin şimdi okuyup anlayamaması önemli değil, ancak Xinjun bir gün yeni bir AI dünyasına aşık olacağınızı garanti edebilir.

Çekirdek okuyucuların tez değişim grubu için lütfen WeChat hesabımızı ekleyin: zhizhizhuji . Senin için bekleniyor.

Bu, temel okumanın ilk yorumu 5 Bildiriler

ACL 2017 Uzun Bildiriler

Affect-LM: Özelleştirilmiş Duygusal Metin Üretimi için Nöral Dil Modeli

Affect-LM: Özelleştirilebilir Duyuşsal Metin Üretimi için Sinirsel Dil Modeli

Güney Kaliforniya Üniversitesi

Güney Kaliforniya Üniversitesi

[Özet] İnsan sözlü iletişimi, duygusal bilgileri esas olarak duygusal kelimelerin kullanımı yoluyla iletir. Bilim adamları bu yönde birçok araştırma yaptılar, ancak en gelişmiş sinirsel dil modelini duygusal bilgiyle birleştirme sorunu hala araştırılması gereken bir alan. Bu makalede, konuşma metni oluşturmak için duygu kategorilerinden etkilenen genişletilmiş bir LSTM (Uzun Kısa Süreli Bellek) dil modeli öneriyoruz. Bu makalede önerilen Affect-LM modeli, ek tasarım parametreleri aracılığıyla üretilen cümledeki duygusal içeriğin derecesini özelleştirebilir. Amazon Mechanical Turk kullanılarak yapılan algısal araştırmalar, Affect-LM'nin dilbilgisi doğruluğundan ödün vermeden daha gerçekçi duygusal cümleler ürettiğini göstermektedir. Affect-LM ayrıca duyguları ayırt etme yeteneğine sahip kelime temsillerini öğrenir ve karmaşık deneyler, konuşma metnindeki ek duygusal bilgilerin, dil modelinin öngörü yeteneğini etkili bir şekilde geliştirebileceğini gösterir.

1. Giriş

Duygu, duyguları içeren ve ruh hali ve kişilik gibi uzun bir süre boyunca oluşması gereken bir terimdir ve bir duygu veya duygusal deneyimi ifade eder (Scherer ve diğerleri, 2010). Picard (1997), kişilerarası iletişim ve etkileşimde insan duygularının önemi hakkında ayrıntılı bir tartışma sağlar. Bu durumda, metindeki insan duygularının analizi, Twitter duygu analizi (Nakov vd., 2016), şiir duygu analizi (Kao ve Jurafsky, 2012) ve araştırma fonksiyonları dahil olmak üzere doğal dil anlayışında önemli bir konudur. Sözcükler ve sosyal / psikolojik süreçler arasındaki ilişki (Pen-nebaker, 2011). İnsanların ilettikleri sözlü bilgiler sadece gramer bilgisi içermez, aynı zamanda psikolojik ve duygusal durumlarını da aktarır. Örnekler arasında duygusal kelimelerin (öfke ve mutluluk gibi) ve küfürlerin kullanımı yer alır. İnsan dili iletişiminde duyguların otomatik olarak işlenmesi, özellikle diyalog sistemleri ve diyalog aracıları gibi yeni ortaya çıkan uygulamalar için konuşulan dil sistemlerini anlamak için çok önemlidir.

Şekil 1 Affect-LM, farklı etkilerle () beş özel etki kategorisinde (et-1) duygusal konuşma metni oluşturabilir. Şekil, üç farklı duygu düzeyinde mutlu duygular için otomatik olarak oluşturulan duygusal cümlelerin üç örneğini göstermektedir.

İstatistiksel dil modelleme, konuşma tanıma sisteminin, makine çevirisi ve bilgi erişimi gibi diğer uygulamaların ayrılmaz bir parçasıdır. Yinelenen sinir ağlarının dil modellemesi için (Mikolov ve diğerleri, 2010), araştırma çalışmalarının restorasyonu yeniden üretildi ve gramer modellerine dayanan bu temel dil modellerinin performansı, n-gram yönteminin performansını çok aşıyor. Bununla birlikte, duygusal bilgiyi kullanan metin sinir dili modellerinin inşası üzerine çok fazla araştırma çalışması yoktur. Dil anlayışı ile ilgili mevcut derin öğrenme literatürü temel olarak kelime anlamsal temsili (Mikolov vd., 2013), cümle gösterimi için kodlayıcı-kod çözücü modeli (Cho vd., 2015), dil modelleme ve sembolik bilgi ( Ahn ve diğerleri, 2016) ve sinir ağı altyazı üretimi (Vinyals ve diğerleri, 2015), ancak bildiğimiz kadarıyla, duygusal metin oluşturmak için sinir dili modellemesini geliştirmek için varlık bilgisini veya veriye dayalı bir yöntemi kullanmanın bir yöntemi yoktur.

Sinirsel dil modelleme ve metin duyarlılık analizindeki bu ilerlemeler nedeniyle, bu makale Duygu metninin ifade edilmesi ve üretilmesi için Affect-LM adını verdiğimiz bir model önermektedir. Modelimiz, konuşma tanıma uygulamaları için dil modellemede yaygın olan bir konuşma konuşma külliyatı üzerine eğitilmiştir (Bulyko ve diğerleri, 2007). Şekil 1, Affect-LM'yi ve birden çok duygusal kategoride duygusal renkli diyalog metni oluşturma yeteneğini özetlemektedir. Bu parametreler konuşma metni oluşturmak için manuel olarak ayarlanabilmesine rağmen, önceki bağlam sözcüğünden de otomatik olarak çıkarılabilir. Özellikle model eğitimi için duygu kategorileri, LIWC (Dil Sorgusu ve Kelime Sayma) aracı (Pennebaker ve diğerleri, 2001) gibi duygu sözlüğünde oluşturulan özelliklerden türetilir. Bu makalenin ana araştırma soruları:

S1: Özelleştirilebilir model parametreleri ayarlayarak farklı duygu yoğunluğu seviyeleri için hedef duyarlılık için duygu cümleleri oluşturmak mümkün müdür?

S2: Oluşturulan bu cümleler duygusal ifadeler olarak kabul edilebilir ve çok çeşitli popülasyon kaynaklarından algısal deneylerde dilbilgisi açısından doğru olabilir mi?

S3: Bağlam kelimelerine dayalı duygu kategorilerinin otomatik çıkarımı, Affect-LM'nin dil modelleme performansını iyileştirebilir mi?

Bu makalenin geri kalanı aşağıdaki şekilde düzenlenmiştir. Bölüm 2'de, sinirsel dil modelleme ve duygusal diyalog metni oluşturma alanındaki önceki çalışmaları tartıştık. Bölüm 3'te, temel LSTM modelini ve önerilen Affect-LM modelimizi açıklıyoruz. Bölüm 4 deneysel düzeneğin ayrıntılarını verir. Bölüm 5'te, özelleştirilebilir duyarlı metin oluşturmanın sonuçlarını, her bir duyarlılık kategorisinin algısal araştırmasını ve Bölüm 6'nın sonundan önce kıyaslama modeli karmaşıklığının iyileştirilmesini tartışıyoruz.

2. İlgili çalışma

Dil modelleme, konuşma dil sisteminin ayrılmaz bir parçasıdır.Geleneksel olarak n-gram yöntemi kullanılır (Stolcke ve diğerleri, 2002) Dezavantajı, eğitim setinde olmayan ancak bilinmeyen verilerde görünen kelime dizilerine genellenememesidir. Bengio ve diğerleri (2003) tarafından önerilen sinir dili modeli, kelime temsilinin genelleştirilmesi yoluyla bu eksikliği çözer. Mikolov ve diğerleri (2010) ve Sundermeyer ve diğerleri (2012), bağlamda önceki tüm kelimeler w1, w2, ..., wt-1'den LSTM (uzun kısa süreli bellek) sinir ağlarını kullanarak sinir dili modelini tekrarlayan bir mimariye genişletti. Hedef kelime wt tahmin edilmektedir. Son zamanlarda, diğer veri kalıplarına veya niteliklerine koşullanmış bir dil modeli oluşturmaya çalışan birçok çalışma vardır. Örneğin, Vinyals ve diğerleri (2015), CNN (Convolutional Neural Network) tarafından bir giriş görüntüsünden öğrenilen bir temsilin, görüntü başlıkları oluşturmak için bir LSTM dil modeline beslendiği bir sinirsel görüntü resim yazısı oluşturucuyu tanıttı. Kiros ve diğerleri (2014), iki uygulama için LBL modelini (logaritmik çift doğrusal dil modeli) kullandı: cümle sorguları ve görüntü başlıkları verdi. Yalnızca metin üzerinde eğitilen dil modeli yerine görseldeki metin için daha düşük karmaşıklık elde edilir.

Buna karşılık, duygusal dil üretimi üzerine önceki literatür, duygusal metin oluşturmak için özelleştirilebilir son teknoloji sinir ağı teknolojisine yeterince dikkat etmedi ve çoklu duygusal renk yapılarını nicel olarak değerlendirmedi. Mahamood ve Reiter (2011), tıbbi bakım alan yeni doğan bebeklerin ebeveynleri için duygusal tıp raporları üretmek için birkaç NLG (Doğal Dil Üretimi) stratejisi kullandı. Duygusal ve duygusal olmayan raporlar arasındaki farkı araştırsalar da, çalışmaları sezgisel tabanlı sistemlerle sınırlıdır ve konuşma metinlerini içermez. Mairesse ve Walker (2007) boyutsal genişleme için bir diyalog oluşturma sistemi olan PERSONAGE'ı geliştirdi. Modellerinde seçilen hangi cümlelerin uygun ek özellikleri gösterdiğini otomatik olarak belirlemek için regresyon modelini kullanıcının seçimine göre eğittiler. Keshtkar ve Inkpen'de (2011), yazar duygu cümleleri oluşturmak için sezgisel ve kural tabanlı yöntemler kullanır. Oluşturma sistemleri, büyük bir külliyat eğitimi yerine basit duygusal cümleler oluşturmak için ek fonetik gramer bilgisini kullanır. Aksine, önerdiğimiz yöntem en gelişmiş sinir dili modelleme yöntemine dayanmaktadır, sözdizimsel ön bilgileri kullanmaz ve etkileyici duygusal metinler üretir.

3 model

3.1 LSTM dil modeli

Bu makalede önerilen modeli tanıtmadan önce, LSTM dil modelini kısaca tanıtıyoruz. Bu modeli karşılaştırma ölçütü olarak seçtik çünkü gelişmiş karmaşıklığı Kneser-Ney yumuşatmaya dayalı n-gram modeli gibi diğer yöntemlere kıyasla kanıtlandı (Jozefowicz ve diğerleri, 2016). Sıradan tekrarlayan sinir ağlarının aksine, LSTM ağları, uzun diziler için daha belirgin olan kaybolan gradyan problemiyle karşılaşmayacaktır (Hochreiter ve Schmidhuber, 1997). Biçimsel olarak, zincir olasılık kuralı aracılığıyla, bir dizi M kelime w1, w2, ..., wM için, tüm kelimelerin ortak olasılığı şu şekilde verilir:

Kelime haznesi V kelimelerden oluşuyorsa, o zaman wt kelimesinin koşullu olasılığı ct-1 = (w1, w2, ..., wt-1) bağlamının bir fonksiyonu olarak verilir:

f (.), w1, w2, ..., wt-1 bağlam sözcüklerini tek sıcak temsil yoluyla girdi olarak alan LSTM ağının çıktısıdır, U, bulduğumuz konuşmanın POS bölümleriyle ilgili görsel sözcük temsil matrisidir, Ve bi, i kelimesinin tek dilbilgisini yakalayan sapma terimidir. Denklem 2, herhangi bir ek duygusal bilgi kullanmayan LSTM dil modeli bağlamının bir fonksiyonu olarak wt kelimesini temsil eder.

3.2 Önerilen model: Affect-LM

Önerilen Affect-LM modeli, kelime tahmininde ek bir enerji terimine sahiptir ve aşağıdaki denklemle tanımlanabilir:

et-1, eğitim sırasında bağlam kelimelerinden elde edilen duygu kategori bilgilerinden oluşan bir girdi vektörüdür ve g (.) et-1 üzerinde çalışan ağın çıktısıdır. Vi, model tarafından öğrenilen kelime dağarcığındaki i. Kelimenin kelime vektörüdür ve her kelimenin duygusal bilgisini farklı ifade etmesi beklenir. Şekil 4'te, bu duygusal temsillerin görsel bir temsilini sunuyoruz.

Eşitlik 3'te tanımlanan parametresi, biz buna duygusal güç diyoruz, duygusal kategori bilgisinin (duygusal olarak renklendirilmiş kelimelerin ortaya çıkma sıklığı), bağlama göre hedef kelime wt'nin genel tahmini üzerindeki etkisini tanımlar. Bu formülü, ek bir enerji teriminin tahmin edilen kelime ile duygusal girdi arasındaki korelasyon derecesini tahmin edebildiği bir enerji modeli (EBM) olarak düşünebiliriz (Bengio ve diğerleri, 2003).

3.3 Duygu kategorisi bilgi tanımlayıcısı

Önerdiğimiz model, bir sonraki kelime wt'nin üretken modelini öğrenir, sadece önceki w1, w2, ..., wt-1 kelimelerini değiştirmekle kalmaz, aynı zamanda duygu içeriği ile ilgili olan duygu kategorisi et-1'e de dikkat eder Ek bilgi. Model eğitimi sırasında duygu kategorisi, bağlam verilerinin kendisinden çıkarılır. Bu nedenle, bağlam içinde duyguları çıkarmak için duygusal kelime dağarcığını kullanabilen uygun bir özellik çıkarıcı tanımlıyoruz. Deneyimiz için, anahtar kelime tanıma yoluyla özellikleri çıkarmak için dil sorgusu ve kelime sayma (LIWC) metin analizi programını kullanıyoruz. Pennebaker ve diğerlerinin (2001) girişinde, LIWC, her kelimenin önceden tanımlanmış bir LIWC kategorisine atandığı bir sözlüğe dayanmaktadır. Bu kategoriler, sosyal, duygusal ve bilişsel süreçlerle olan ilişkilerine göre seçilir. Örneğin, sözlük sözcüğündeki endişe sözcüğü, LIWC'nin kaygı kategorisine atanmıştır. Çalışmamızda, duygusal süreçlere karşılık gelen tüm sözcük kategorilerini kullanıyoruz: olumlu, kızgın, üzgün, endişeli ve olumsuz. Bu nedenle, tanımlayıcı et-1, LIWC'den çıkarılan özelliğin ikili eşiği ile elde edilen, her biri belirli bir duygunun varlığını veya yokluğunu temsil eden beş özelliğe sahiptir. Örneğin, "savaşta savaşacağım" cümlesinin duygusal temsili et-1 = {"üzgün": 0, "ciddi": 1, "kaygı": 0, "negatif": 1, "pozitif": 0} .

Tablo 1 Bu makalede kullanılan külliyatın bir özeti. CMU-MOSI ve SEMAINE'in Fisher ve DAIC corpus'a göre daha yüksek duygusal içeriğe sahip olduğu görülmektedir.

3.4 Affect-LM: Duygusal metin oluşturma

Duygu-LM girdi duygu kategorisine, duygu gücüne ve bağlam kelimelerine dayalı cümleler oluşturmak için kullanılabilir. Deneyimiz için aşağıdaki duygu kategorilerini seçtik - olumlu, öfke, üzüntü, kaygı ve olumsuz (öfke, üzüntü ve kaygı üst sınıfı). Bölüm 3.2'de bahsedildiği gibi, duygusal güç relatively, görece bağımsız enerji teriminden, dil modelindeki kelime tahminine üstünlük derecesini tanımlar. Bu nedenle, model eğitiminden sonra, değerini "duygusal renk" derecesini kontrol etmek için değiştirebiliriz, = 0 (nötr, temel model) ila = (oluşturulan cümle yalnızca duygusal sözcüklerden oluşur ve gramer yapısı yoktur).

Cümle oluşturmak için Affect-LM kullanıldığında, duygu kategorisi (1) LIWC kullanılarak bağlamdan çıkarılabilir (cümlenin başında duygusal rengin kendisini sağladığımızda) veya (2) girdi duygu tanımlayıcısı e ( Bu, e'nin, nötr bir cümlenin başında bile kullanılabilen, istenen duyguyu kodlayan ikili bir vektöre ayarlanmasıyla elde edilir). M kelimesi verildi

İlk başlangıç seti, duygusal güç ve kelime numarası N aracılığıyla i-inci üretici kelimeyi üretmek için

, I {M + 1, M + 2, ..., M + N} örnekleme elde etmek için.

4 Deneysel kurulum

Bölüm 1'de, önerilen Affect-LM modelinin gramer doğruluğunu etkilemeden duygusal renkli diyalog metni üretme ve duygusal renk bütünlüğü değerlendirmesinde bir karşılaştırma elde etme becerisiyle ilgili üç ana araştırma sorusu sunduk. Temel LSTM dil modeli daha düşük karmaşıklığa sahiptir. Bu bölümde, bu sorunları çözmek için deneysel kurulumumuzu tartışacağız ve Affect-LM mimarisini ve dil modellerini eğitmek ve değerlendirmek için kullanılan külliyatı tanıtacağız.

4.1 Konuşma Derlemi

Fisher English eğitim konuşma külliyatı, bu makalede önerilen modeli eğitmek için kullanılan ana külliyattır.Ayrıca, duygusal olarak renklendirilmiş üç diyalog külliyatı seçtik. Her bir külliyatın kısa bir açıklaması aşağıda verilmiştir: Tablo 1'de, her bir derlemedeki toplam kelime sayısı ve duygusal kelime sayısı (LIWC duygusal kelime kategorisine ait) gibi ilgili istatistiksel bilgileri rapor ediyoruz.

Fisher English Training Speech Corpus Part 12 : Fisher English veri seti (Cieri ve diğerleri, 2004) her 10 dakikalık telefon görüşmesinden gelen konuşmalardan ve ilgili konuşma dönüştürme transkriptlerinden oluşur. Her konuşma, rastgele seçilmiş konular arasından konuşmaları istenen iki yabancı arasında gerçekleşir. Konuşma konularına örnek olarak Asgari Ücret, Zaman Yolculuğu ve Komedi verilebilir.

Tehlike Değerlendirmesi Görüşme Corpus (DAIC) : Gratch (2014) tarafından tanıtılan DAIC külliyatında, insan nesneler ve sanal karakterler arasında 70 saatten fazla iki boyutlu görüşmeler yer almaktadır. Sanal insanlar, deneklerin depresyon veya TSSB (travma sonrası) gibi psikolojik sıkıntı semptomlarını teşhis etmeyi amaçlayan sorunlar önermektedir. Stres bozukluğu).

SEMAINE veri seti : SEMAINE (McKeown ve diğerleri, 2012), SAL'ı (hassas yapay dinleyiciler) simüle eden konular ve operatörler arasındaki etkileşimlerden oluşan büyük bir görsel-işitsel külliyattır. Her biri yaklaşık 5 dakikalık toplam 959 konuşma yazıya döküldü ve duygusal bir boyutla açıklandı.

Çok modlu görüş düzeyi duygusal yoğunluk veri seti (CMU-MOSI) : (Zadeh vd., 2016) Bu, çok modlu, açıklamalı bir video görüş topluluğudur.Her videoda, bir konuşmacı ticari ürünler hakkındaki görüşlerini ifade eder. Kitap, 89 farklı konuşmacının (41 erkek ve 48 kadın konuşmacı) 93 film konuşmasından türetilmiştir. Bu külliyat, diyalog yerine monologlar içerdiği için diğer külliyatlardan farklıdır.

Tüm cisimlerin konuşma dili içerdiğini bulmamıza rağmen, Fisher külliyatından farklı aşağıdaki özelliklere sahiptirler: (1) Tablo 1'de gözlemlenen duygusal içerik daha fazladır çünkü bunlar, insan deneklerin kendiliğinden tepkileriyle duygusal tepkiler veya duygular oluşturmak için tasarlanmıştır. Teşvik edici konular üzerine konuşmalar (2) Kayıt ortamının neden olduğu alan uyuşmazlıkları (örneğin, zihinsel sağlık alanında DAIC korpusu oluşturulurken, CMU-MOSI korpusu çevrimiçi olarak yüklenen fikir videolarından oluşur). (3) Fisher külliyatından önemli ölçüde daha küçüktür, diğer külliyatın toplam boyutunun 25 katı. Bu nedenle, Fisher corpus'un temel ve Affect-LM modelini eğitmek olmak üzere iki farklı aşamada eğitim veriyoruz ve ardından her bir duygusal rengin gövdesini uyarlayıp ince ayar yapıyoruz.

4.2 Affect-LM sinir ağı yapısı

Deneylerimiz için, Tensorflow'da (Abadi ve diğerleri, 2016), Zalmba ve diğerleri (2014) tarafından açıklanan düzensizleştirme uygulamasını takip eden bir karşılaştırmalı LSTM dil modeli uyguladık. Affect-LM uygulamasına duyguları etkileyen ayrı bir enerji öğesi ekledik. 10.000 kelimelik bir kelime dağarcığı ve her gizli katmanda 2 gizli katman ve 200 nöron içeren bir LSTM ağı kullandık. Ağ, 20 zaman adımını genişletir ve her küçük sunucunun boyutu 20'dir. Etki kategorisi et-1, tek bir gizli 100 nöron katmanı ve g (et-1) oluşturmak için sigmoid aktivasyon işlevi olan çok katmanlı bir algılayıcı tarafından işlenir. F (ct-1) ve g (et-1) çıktı katmanı boyutunu 200 olarak ayarladık. Temel ve Affect-LM arasındaki karşılaştırmayı kolaylaştırmak için ağ mimarisini değiştirmeden tuttuk.

4.3 Dil modelleme deneyi

Affect-LM aynı zamanda bağlam sözcüğünden sonraki tahmin edilen sözcüğü ve bağlam sözcüğünden çıkarılan duygu kategorisini (üretildiğinde harici olarak kodlamak yerine) tahmin etmek için bir dil modeli olarak da kullanılabilir. Diğer duygusal bilgilerin tahmin etkisini iyileştirip iyileştiremeyeceğini değerlendirmek için, aşağıda Bölüm 4.1'de ayrıntılı olarak açıklanan iki aşamada derlemeyi listeleyeceğiz:

(1) Fisher veri kümesinde dil modelinin eğitimi ve doğrulanması -Fisher corpus 75:15:10 oranına göre eğitim, doğrulama ve değerlendirmeye karşılık gelir ve Zaremba ve diğerlerinin (2014) yöntemine göre dil modelini (başlangıç ve Affect-LM dahil) 13 kez, ilk dört kez eğitiyoruz Eğitim öğrenme oranı 1.0'dır ve sonraki her eğitim 1/2 oranında azaltılır. Tüm modellerin öğrenme hızı ve nöron yapısı aynıdır. Modelin duygusal gücünü doğrularız. Fisher doğrulama setindeki en iyi modeli seçin ve onu sonraki uyarlanabilir duygusal renk külliyatı için tohum olarak kullanın.

(2) Diğer külliyatın tohum modelinde ince ayar yapın - Eğitim, doğrulama ve değerlendirme alt kümelerini oluşturmak için CMU-MOSI, DAIC ve SEMAINE'den her biri 75:15:10 oranında üç şirket tahsis edilmiştir. Taban çizgisi ve Affect-LM için, ilk aşamadan (tohum modeli) en iyi performans gösteren model, her eğitim topluluğunda ince ayarlanmıştır, öğrenme oranı 0.25 ve 'de değişmeden kalır. Derlemede uyarlanan her model için, Affect-LM ile elde edilen karmaşıklığı ve topluluk üzerinde değerlendirildiğinde temel modelle karşılaştırdık.

4.4 Cümle Oluşturma Algısı Üzerine Araştırma

Affect-LM'nin farklı derecelerde gramer doğruluğunu sağlama öncülüğünde duygusal olarak renkli metin üretme yeteneğini değerlendirmek için Amazon'un Mechanical Turk (MTurk) platformunda kapsamlı bilişsel araştırma yaptık. MTurk platformu geçmişte çok çeşitli bilişsel deneylerde başarıyla kullanılmış ve büyük ölçekli araştırmalarda insan derecelendirmelerini toplamak için mükemmel bir kaynak olduğu kanıtlanmıştır (Buhrmester ve diğerleri, 2011). Spesifik olarak, beş duygusal kategoride 200'den fazla cümle oluşturduk, yani beş duygusal kategoriyi içeren dört cümlenin başlangıcı mutlu (olumlu), öfke, üzüntü, kaygı ve olumsuz (Tablo 2'de listelenen üçü) Bir cümlenin başlangıcı ve cümle işaretinin sonu, modelin yeni bir cümle oluşturması gerektiğini gösterir). Fisher corpus ile eğitilmiş Affect-LM modeli cümleler oluşturmak için kullanılır. Her cümle, en az% 98 onay derecesi ile Amerika Birleşik Devletleri'nde bulunan iki değerlendirici tarafından değerlendirilir. İnsanlar bu cümlelerin yazılı içerikten ziyade diyalogdan çıkarılması gerektiğini belirtiyorlar: tekrarlama ve doldurmayı duraklatma (örneğin, uh, uh) yaygındır ve noktalama işareti verilmemiştir. İnsan değerlendiriciler, beş duygusal kategoriyi, genel duygusal değeri ve cümle dilbilgisi doğruluğunu yedi puanlık Likert ölçeği ile değerlendirdi ve her cümle için 0,05 USD ödedi. Değerlendiriciler arasındaki uyumu ölçmek için Krippendorffs'yı kullandık ve tüm kategorilerdeki değerlendiriciler arasında önemli bir uzlaşma olduğunu gözlemledik (örneğin, değerlik = 0.510 ve dilbilgisel doğruluk = 0.505).

Tablo 2 Farklı etki kategorilerinin modelleri tarafından oluşturulan örnek cümleler

Her hedef duygu için (yani, oluşturulan cümlenin beklenen duygusu), bir MANOVA'yı başlatıyoruz, insanlar tarafından değerlendirilen duygu kategorisi DV (bağımlı değişken) ve duygu yoğunluğu parametresi IV'tür (bağımsız değişken). Daha sonra hangi DV'nin ile önemli ölçüde değiştiğini belirlemek için rastgele tek değişkenli varyans analizi yaparız. Toplamda, Bonferroni düzeltmesinden sonra anlamlılık düzeyini p olarak güncellememizi gerektiren 5 MANOVA ve 30 takip ANOVA gerçekleştirdik. < 0.001.

5. Sonuç

5.1 Duygusal metin oluşturma

Bölüm 3.4'te, girdi duyarlılık bilgisi modeline dayalı olarak metin örnekleme sürecini açıklıyoruz (Araştırma Sorusu S1). Tablo 2, modelin girdi cümlesinden başlayarak ürettiği üç cümleyi göstermektedir.Öyle hissediyorum ... neden ... Ona beş etki kategorisinin her biri için söyledim - mutluluk (olumlu duygular), öfke, üzüntü Kaygı ve tarafsızlık (duygu yok). Her kategorinin ve cümlenin başında oluşturulan 20 cümle arasından seçim yaparlar.

5.2 MTurk algı deneyi

Aşağıda, MTurk çalışmamızın temel istatistiksel bulgularını bildirerek araştırma sorusunu ele alıyoruz, bu bulgular Şekil 2 ve Şekil 3'te gösterilmektedir.

Şekil 2 Amazon Mechanical Turk'ün pozitif, negatif, kızgın, üzgün ve kaygı (a) - (e) gibi hedef duygu kategorilerine yönelik araştırma sonuçları. Oluşturulan her duygu için en alakalı insan puanı eğrisi kırmızıyla vurgulanırken, ilgili puan eğrisi siyah renkle gösterilir. Duygu kategorileri farklı türlere göre kodlanmıştır ve şekildeki lejanda listelenmiştir.

Şekil 3 Üretilen tüm hedef duyguların dilbilgisi doğruluğu üzerine Mechanical Turk çalışmasının sonuçları. Her duygu kategorisinin algısal dilbilgisel doğruluğu renk kodludur.

Olumlu duygusal cümle . Çok değişkenli sonuçların olumlu duygu cümleleri oluşturmada anlamlı bir etkisi vardır (Pillai'sTrace = .327, F (4,437) = 6.44, p < .0001). ANOVA'lar "kızgın" p hariç tüm DV'ler için önemli sonuçlar gösterir < .0001, hem duygusal değerin hem de "mutlu" DV'nin Şekil 2 (a) 'da gösterildiği gibi ile başarılı bir şekilde çalıştırılabileceğini gösterir. Dilbilgisel doğruluk aynı zamanda duygusal yoğunluk parametresinden önemli ölçüde etkilenir ve sonuçlar, arttıkça doğruluğun azaldığını gösterir (bkz. Şekil 3). Ancak, daha sonra Tukey testi, yalnızca en yüksek değeri p olduğunda dilbilgisi doğruluğunun önemli ölçüde azaldığını göstermiştir. < .05.

Olumsuz duygu cümlesi . Çok değişkenli sonuçların olumsuz duygu cümlelerinin oluşturulması üzerinde önemli bir etkisi vardır (Pillai'sTrace = 0.130, F (4,413) = 2.30, p < .0005). ANOVA'lar "duygusal değeri" gösterir p < .0005 ve "mutlu" DV'lerin önemli sonuçları, Şekil 2 (b) 'de gösterildiği gibi, "duygusal değer" DV'sinin tarafından başarılı bir şekilde manipüle edildiğini gösterir. Ek olarak, DV gibi, "kızgınlık", "üzüntü" ve "kaygı" arasında önemli bir fark yoktur, bu da olumsuz duygu DV'nin belirli olumsuz duygulardan ziyade daha genel ilişkili duygu kavramlarını ifade ettiğini gösterir. Bu bulgu, LIWC kategorisinin beklenen olumsuz duygu kategorileriyle uyumludur ve ebeveyn kategorisinin üzerinde öfke, üzüntü ve kaygı gibi daha spesifik duygular oluşturur (Pennebaker ve diğerleri, 2001). Dilbilgisel doğruluk, kuvvetin önemli etkisinden de etkilenir ve sonuçlar, arttıkça doğruluğun azaldığını gösterir (bkz. Şekil 3). Olumlu duygular için, Tukey testi daha sonra sadece en yüksek değerinin gramer doğruluğu p'de anlamlı bir düşüş gösterdiğini gösterdi. < .05.

Kızgın cümle . Çok değişkenli sonuçlar öfkeli duygusal cümleler oluşturmak için kullanışlıdır (Pillai'sTrace = .199, F (4,433) = 3.76, p < .0001) önemlidir. ANOVA'lar "duygusal değeri" gösterir p < .0001, "mutlu" ve "kızgın" DV'lerin önemli sonuçları, hem "duygusal değer" hem de "kızgın" DV'lerin Şekil 2 (c) 'de gösterildiği gibi tarafından başarılı bir şekilde manipüle edildiğini gösterir. Dilbilgisel doğruluk, öfkeli cümlelerin geniş bir aralığında oldukça kararlı olduğunu gösteren yoğunluk parametresi 'nin önemli etkisinden etkilenmez (bkz. Şekil 3). Bununla birlikte, insan değerlendiricilerin öfke, üzüntü ve kaygı etki kategorilerini başarılı bir şekilde ayırt edemediği görülmektedir, bu da oluşturulan cümlelerin genel olumsuz etki boyutunu takip edebileceğini göstermektedir.

Üzücü cümle . Çok değişkenli sonuçlar üzücü cümlelerin oluşturulması için önemlidir (Pillai'sTrace = .377, F (4,425) = 7.33, p < .0001). ANOVA'lar sadece "üzüntü" gösterir p < .0001 DV'nin önemli sonuçları göstermektedir ki (, Şekil 2 (d) 'de gösterildiği gibi "üzgün" DV'yi başarılı bir şekilde işlemek için kullanılabilmektedir. 'nin dilbilgisel doğruluğu önemli ölçüde azaltılır. Spesifik olarak, gerçeğin ardından Tukey testi, yalnızca en yüksek iki değeri görüntülendiğinde dilbilgisi doğruluğunun önemli ölçüde azaldığını gösterdi. < .05 (bkz. Şekil 3). "Üzgün" olay sonrası Tukey testi için, = 3 DV için en iyisidir, çünkü p'de üzüntü skoruna yol açar < .005, {0,1,2} 'de önemli bir sıçrama var.

Kaygı cümlesi . Çok değişkenli sonuçlar anksiyete cümleleri oluşturmak için önemlidir (Pillai'sTrace = 2.89, F (4,421) = 6.44, p < .0001) ANOVA'lar "duygusal değeri" gösterir p < .0001'de, "mutluluk" ve "endişe" DV'lerinin önemli sonuçları, Şekil 2 (e) 'de gösterildiği gibi, hem "duygusal değer" hem de "endişe" DV'lerinin by tarafından başarılı bir şekilde manipüle edildiğini gösterir. Dilbilgisel doğruluk, duygusal yoğunluk parametresinden önemli ölçüde etkilenir ve sonuçlar, arttıkça doğruluğun azaldığını gösterir. Benzer şekilde, "üzüntü" için, Tukey testi daha sonra sadece en yüksek iki değeri görüntülendiğinde dilbilgisi doğruluğunun önemli ölçüde azaldığını gösterdi. < .05 (bkz. Şekil 3). Yine, "endişeli" ölüm sonrası Tukey testi, = 3'ün bu DV için en iyisi olduğunu gösteriyor çünkü < .005, algılanan "kaygı" puanında {0,1,2} önemli bir sıçrama.

Tablo 3: Fisher eğitimine dayalı olarak ve daha sonra DAIC, SEMAINE ve CMU-MOSI corpus'a uyarlanmış, başlangıç ve Affect-LM modeli elde edilen değerlendirme karmaşıklık puanı

5.3 Dil modelleme yapısı

Tablo 3'te, temel model ve Affect-LM ile elde edilen karmaşıklık puanını tanıtarak araştırma problemi Q3'ü çözüyoruz.Fisher corpus eğitildiğinde, üç duygu topluluğu ayarlanır (her bir adaptasyon modeli CMU-MOSI içindedir. , DAIC ve SEMAINE eğitimi ayrı ayrı). Fisher tarafından eğitilen model tüm kurumlarda değerlendirilir ve uyarlanan her model yalnızca kendi külliyatında değerlendirilir. Tüm kurumlar için, Affect-LM'nin ortalama olarak temel modelden daha düşük karmaşıklık elde ettiğini bulduk, bu da bağlamdan elde edilen duygusal kategori bilgisinin dil modeli tahminini geliştirdiği anlamına gelir. Fisher tarafından eğitilen model için, ortalama karmaşıklık artışı 1.44 (% 1.94 nispi artış) iken, uyarlanabilir model 0.79 (% 1.31) idi. Duygusal kelime içeriği yüksek olan corpora için karmaşıklıkta gözlemlenen iyileşmenin daha büyük olduğunu fark ettik. Tablo 3'te gösterildiği gibi, Affect-LM, Fisher corpus'a göre sırasıyla% 2.76 ve% 2.75 daha fazla duygusal kelime ile CMU-MOSI ve SEMAINE korpusunun karmaşıklığında daha büyük bir azalmaya sahiptir.

5.4 Kelime gösterimi

Eşitlik 3'te, Affect-LM, tahmin edilen kelime wt ile etki kategorisi et-1 arasındaki korelasyonu yakalayan bir ağırlık matrisi V öğrenir. Bu nedenle, Vi matrisinin her satırı, kelime haznesindeki i-inci kelimenin duygusal olarak anlamlı kelime vektörüdür. Şekil 4'te, her veri noktasının ayrı bir kelime olduğu ve LIWC sözlüğünde görünen kelimelerin ait oldukları duygusal kategoriye göre renklendirildiği bu kelime vektörlerinin bir t-SNE görselleştirmesini öneriyoruz (sadece kategoriyi işaretliyoruz) Kelimeler: olumlu, olumsuz, kızgın, üzgün ve endişeli, çünkü bu kategoriler en yaygın kelimeleri içeriyor). Gri renkli sözcükler LIWC sözlüğünde bulunmamaktadır. Şekil 4'te vektör kelime vektörünün, olumlu ve olumsuz (üzüntü, öfke, kaygı) bir araya getirilen yüksek oranda ayrıldığı duygusal bilgiler içerdiğini gözlemliyoruz.

Şekil 4: Affect-LM aracılığıyla kelime temsilini öğrenme

6 Sonuç ve gelecekteki çalışma

Bu makalede, bağlam kelimeleri, duygusal kategoriler ve duygusal yoğunluk parametrelerine dayalı duygusal diyalog metni oluşturmak için kullanılan yeni bir dil modeli olan Affect-LM'yi tanıtıyoruz. MTurk algısal araştırması, modelin gramer doğruluğunu etkilemeden farklı seviyelerde temsil metni üretebileceğini göstermektedir. Ayrıca Affect-LM'yi bir dil modeli olarak değerlendiriyoruz ve bağlamdaki kelimelerden duygu kategorilerini elde ederken temel LSTM modelinden daha düşük bir karmaşıklık elde ettiğini gösteriyoruz. Gelecekteki çalışmalar için, yüz görüntüleri ve ses gibi diğer modlara dayalı dil oluşturma ve sanal aracı diyaloğu oluşturma gibi uygulamaları araştırarak bu modeli genişletmeyi umuyoruz.

Kağıt indirme bağlantısı:

Yorum bırak Arkadaş çevresi gönder

AI inişinin son milini tartışalım

Dikkat çekmek için QR kodunu tanımlamak için uzun basın

Çekirdek okuyucu seni seviyor

Buick'in yeni kompakt SUV'si Angkola GX olarak adlandırılabilir
önceki
Pekin Pinggu çiçeklenme mevsimine giriyor, kayısı çiçeği ilk kez misafirlerini ağırlıyor
Sonraki
Asya Kupası bireysel ödülleri: Katarlı genç Ali iki ödül kazandı
BMW 3 Serisi'nden bahsetmek için 310.000 indi, 5.000 kilometreden fazla yol katetti, sahibi otomobil deneyimini söyledi
Samsung S10 Lite ön panel pozu: her yerde aynı genişlik ve dar kenarlıklar
Taobao'da seksi güzellik mi ortaya çıkıyor? AI ile tacize uğramaktan korkmazsınız!
Sagitar satın almaya değer mi? Sahibi arabayı bir aylığına aldı ve duygularını dile getirdi
Zheshang'ı tanıyın Başarılı dönüşüm! Gan Wen Shang'da bu insanların mücadelelerinin hikayelerini dinleyin
Katar, Asya Kupası'nı ilk kez kazandı
Life-iNet ağ tabanlı yapılandırılmış yaşam bilimleri alan bilgisi keşif ve analiz sistemi
49.800 satıldı 2019 Baojun 310 yeni model piyasaya sürüldü / 50.000'den daha ucuza satın alınabilen otomatik şanzıman
Zhejiang City Affairs | Muhabir Soruşturması: Çevrimiçi araç karşılama kaydında boşluklar var, yolcu bilgileri neredeyse şeffaf
Zhejiang şehir işleri Çete lideri "bırak beni" tutuklandı, çetedeki öğrenci mahkum edildi ve "Longgang Dilenci Çetesi" kapandı mı?
Bu yapay zeka meslekleri en çok "cesur ve şefkatli" genç bayanlar için uygundur.
To Top