EMNLP 2017 Bar Ilan Üniversitesi: Etkinlik haberleri tweetlerinin etkileşimli özet üretimi

EMNLP 2017 Sistem Gösterileri

Etkinlik haber tweetlerinin etkileşimli özet üretimi

Etkinlik Haber Tweetleri için Etkileşimli Soyutlayıcı Özet

Baylan Üniversitesi

Bar-Ilan Üniversitesi

[Özet] Son zamanlarda çok metinli birleşik bilgi sunumundan türetilen soyut üretime dayalı yeni bir etkileşimli soyut oluşturma sistemi öneriyoruz. İlk önce en önemli bilgileri elde etmenize ve ardından etkileşimli olarak belirli ayrıntılara inmenize olanak tanıyan madde işareti tarzı bir özet yöntemi sağlamak için çeşitli etkileşim mekanizmalarını birleştiriyoruz. Etkinlik haberleri tweetlerinin kullanılabilirliği üzerine yapılan çalışma, metin araştırması yöntemimizin pratikliğini göstermektedir.

1. Giriş

Çoklu belge özetleme (MDS) teknolojisi, okuyucuların bir konuyla ilgili birden çok metni okurken en önemli bilgileri elde etmesine yardımcı olabilir. Ana MDS yöntemi, belirli bir uzunluğun kısa bir özetini oluşturmaya, en önemli bilgileri yakalamaya ve el yapımı "statik" bir özeti taklit etmeye odaklanır. Alternatif olarak, çok az makale etkileşimli soyut üretimi ele almaktadır. Bu yöntemde kullanıcılar, sağlanan bilgileri kendi ihtiyaçlarına ve ilgi alanlarına göre etkileşimli olarak keşfedebilirler (Christensenet ark., 2014; Leuski vd., 2003; Yan vd., 2011).

Bu makale, etkileşimli soyut oluşturma ile ilgili olarak bu yönteme daha fazla katkı sağlamaktadır. Çıkarılan "atomik" gerçeklere dayanarak, özet oluşturma yönteminin özellikle etkileşimli ayarlar için uygun olduğuna inanıyoruz çünkü daha esnek bilgi sunumuna izin veriyor. Sezgisel olarak konuşursak, kullanıcılar için bilgiyi orijinal cümlenin tamamına dayalı olarak bir önceki kadar kaba değil, bireysel gerçekler düzeyinde keşfetmek daha anlamlıdır (bkz.Bölüm 6).

İki yararlı etkileşim modunu desteklemek için soyut yöntemler kullanıyoruz. İlk olarak, bilgileri, en önemli bilgilerin başlangıçta madde işaretli cümlelerde görüntülendiği ve ek madde işaretlerini genişleterek daha fazla ayrıntı elde edilebileceği madde işareti tarzı bir özet halinde sunuyoruz. Spesifik olarak, bu yöntemi bir haber tweetindeki belirli bir olay için bir zaman çizelgesine göre bir özet oluşturmak için kullanırız (bkz.Şekil 2). İkinci etkileşim modumuz, kavramın tamamlayıcı bilgilerinin bahsettiği alternatif terimler aracılığıyla görüntülenmesine ve özetteki kavramın oluşumunun izlenmesine izin veren kavram genişletmedir (bkz. Şekil 3). Bu bilgi, orijinal cümle (özet) veya tek bir kelime / kavram (özet) kullanılarak statik bir özette gizlenir.

İnteraktif özet oluşturmanın modüler yapısını kolaylaştırmak için, özellikle Witie ve diğerleri (2017) tarafından yapılan son Açık Bilgi Temsilciliğinde (OKR) girdi olarak metnin birleştirilmiş temsilini kullanıyoruz. Kısacası, bu temsil, cümle modelinde belirtilen orijinal bağlantıyı korurken birlikte referans kavramlarının ve argümanlarının sıkıştırıldığı metinsel cümle modelini yakalar (bkz. Bölüm 2). OKR yapısını, otomatik bilgi düzeyinde bilgi çıkarmak, ayrık sözlerden bilgileri genişletmek ve elde edilen soyut cümlelerden kaynakları almak için kullanıyoruz.

Etkileşimli programımızın yeni kullanımı, etkinliğini ve kullanıcılar için kullanışlılığını doğrulamaktır. Bu amaçla, yöntemimizi bir prototip sistemde uyguladık (Bölüm 3-3). Sistem, girdi OKR verilerinden otomatik olarak etkileşimli bir özet oluşturur; burada girdi verilerinin orijinal metinden harici bir kara kutu aracı tarafından ayrıştırıldığını varsayarız. Sistemimizi altın standart OKR veri setinde (Brooke, 1996; Lund, 2001) bir dizi standart kullanılabilirlik testi aracılığıyla kontrol ediyoruz, böylece izolasyondaki katkısını inceleyebiliriz (Bölüm 5). Sonuçlarımız, bu makalede önerilen sistemin okuyucular için çok değerli olduğunu ve standart statik özetlere çekici bir alternatif sunduğunu göstermektedir.

2 Hazırlık

Yukarıda bahsedildiği gibi, etkileşimli özet oluşturma sistemimiz, çok metinli bilgilerin birleşik temsiline dayanmaktadır. Daha sonra, bu temsilin arka planını gözden geçireceğiz ve ardından kullandığımız belirli açık bilgi temsilini açıklayacağız.

2.1 Kombine gösterim

Soyut üretim ve metin keşfinden motive edilen son araştırmalar, metin bilgisinin farklı yapılarda entegrasyonunu ele almaktadır. Öne çıkan bir örnek olarak, Liu ve diğerleri (2015) ve Li ve diğerleri (2016) 'nin araştırması, düğümleri tahminler veya yüklemler olan, orijinal metinden çıkarılan ve kenarlarla yakalanan grafik tabanlı temsiller oluşturdu. Kelime argüman ilişkisi ve aynı veya ortak alıntı kavramı tek bir düğüme küçülür.

Rospocher ve diğerleri (2016), şekildeki kavramların DBPedia ( girişiyle bağlantılı olduğu daha fazla denetim yöntemi önermiştir. Bu, ortak alıntıları tespit etmek ve kavramları netleştirmek için diğer meta verilerle birlikte kullanılır.

Bu çalışmaların hiçbiri etkileşimli özetler olarak değerlendirilmedi, özellikle hiçbiri kullanıcı etkileşim kalıplarımız için yeterli veriyi birleştirmedi. Ardından, Witie et al. (2017) tarafından sunulan ve sistemimizde kullanılan açık bilgi temsilini kısaca gözden geçireceğiz.

2.2 Açık Bilgi İfadesi OKR

OKR yapısının bileşenlerini göstermek için Şekil 1'deki örneği kullanıyoruz (ayrıntılı bir açıklama için Witie ve diğerleri (2017) 'ye bakın) Bu bileşenler, özet oluşturma yöntemimizin temel parçasıdır. En üstte dört orijinal tweet var. En altta, bu tweetlerden türetilmiş iki birleşik cümle önerisi (P1 ve P2 olarak etiketlenmiş) ve dört öğe (E1-E4 olarak etiketlenmiş) var. Bu şekil, aşağıda açıklandığı gibi OKR'de yakalanan üç bağlantı türünü açıklamaktadır.

Şekil 1 Bir olayın dört tweet'i ve OKR yapısı

Bahsedilen bağlantılar, her cümle örüntüsünü veya varlığı belirtilen terimler dizisiyle birleştirir, yani metnin tamamında, her bir referans biçimi varlık / cümle kalıbı hakkındadır. Örneğin, tweet'te bahsedilen E1 "kişi", "topçu" veya "radcliffe Howden" dir. Bahsedilen cümle kalıbı, "a2, a3'ten öldü" gibi parametre yer tutucularla birlikte bir şablon olarak saklanır. Varlıklar ve cümle kalıpları, sözleriyle, orijinal metinde göründükleri olaylarla daha da bağlantılıdır (şekilden çıkarılmıştır).

Argüman bağlantıları, varlıklar veya (iç içe geçmiş) cümle kalıpları olabilen, cümle kalıplarını argümanlarıyla birleştirir. Bir cümle örüntüsü farklı bağımsız değişkenlere sahip birkaç şablona sahip olabileceğinden, bağımsız değişken kimliği (P1'de a1-a3 olarak işaretlenmiştir), aynı cümle kalıbındaki ortak alıntı argümanlarını yakalamak için kullanılır. Örneğin, a2 ve a3, sırasıyla E2 öğesini ve P2 önermesini göstererek P1'in iki şablonunda bağımsız değişkenler olarak görünür.

Örtülü bağlantılar, Şekil 1'de yönlü kenarlarla işaretlenmiş bağlantılı bağlantılar, farklı OKR bileşenleri türleri arasındaki anlamsal ilişkiyi (bağlamı) izler. Örneğin, E1'de, "RadcliffeHaughton", "insanları" veya "topçuları" gerektirir, yani ilki, belirli bir bağlamda daha spesifik ve bilgilendiricidir.

3 Kapsamlı özet bilgi

Sistemimizin mimarisi iki ana adımdan oluşur: (1) kapsamlı özet bilgileri ürettiğimiz bir ön işleme adımı ve (2) seçilen bilgilerin etkileşimli gösterimi. Bu bölümde, giriş OKR yapısına dayanan ilk adımı açıklayacağız. Toplu bilgileri etkileşimli olarak keşfetmek için kullanıcı arayüzümüz bir sonraki bölümde açıklanacaktır.

Özet bilgi üretme sistemimizin genel şeması aşağıdaki gibidir.

1. OKR cümlelerini gruplara ayırın;

2. Her bir cümle kalıpları kümesi için temsili özet cümleler oluşturun, bunların tümü madde işareti tipi özet cümleler üretir;

3. Her temsili cümle için meta veriler oluşturun: bilgi puanı, kavram genişletme ve zaman damgası.

Mevcut sistem için, her adım için bir temel yöntem uyguladık Buna rağmen, kullanılabilirlik araştırmasında hala yüksek derecede memnuniyet elde ediyoruz (bkz. Bölüm 5).

Cümle kalıplarını OKR yapısında farklı gruplara ayırıyoruz, böylece her bir cümle kalıbı grubu kağıt bağlantıyla bağlanır (bağlantı yönünü göz ardı ederek). Örneğin, Şekil 1'de P2, P1'de yuvalanmıştır, bu nedenle ikisi birlikte gruplandırılmıştır.

İkinci olarak, bir gruptaki cümle örüntüsünün "kökü" için (yani: iç içe geçmeme), alternatif aday cümleler üreteceğiz. Bu, şablondaki ilgili argüman bahseden ve yinelemeli iç içe geçmiş cümle kalıplarının olası tüm kombinasyonlarını doldurarak yapılır. Örneğin, P1 için, "içinde", "içinde", "içinde" vb. Üreteceğiz (toplamda 22 aday cümle var).

Her aday kümesinden temsili bir cümle seçiyoruz. Önemli olarak, bu, uzunluk sınırları olan özet paragrafların aksine, kapsamlı özet bilgilerimizin orijinal metindeki tüm cümle kalıplarını etkili bir şekilde kapsadığı anlamına gelir. Daha az önemli bilgilerin beklenen filtrelemesinin aksine, başlangıçta yalnızca kullanıcı arayüzünde gizlidir ve kullanıcı tarafından genişletilebilir (bkz. Bölüm 4). Temsili cümleler için, yüksek dil modeli puanları, yüksek bilgi puanları ve küçük uzunluğa sahip bir aday seti seçiyoruz (dil modelleri için, 100M tweet setinde bir LSTM modeli eğittik (https://github.com/ yandex / daha hızlı-rnnlm)). Bu, bu faktörlerin ağırlıklı toplamını optimize ederek yapılır.

Her cümlenin bilgi puanı, orijinal metinde ne kadar yaygın olarak bahsedildiğini ve bilgilerin (özellikle) OKR tarafından ima edilen bağlantılara göre ne kadar büyük olduğunu sezgisel olarak yansıtır. Örneğin, Şekil 1'e dönüp baktığımızda, "Spa çekiminde Threedead" tweet'lerinde "üç", "ölü" ve "spashooting" kavramları iki tweet'te göründüğü için ödüllendirilmeli, ancak "üç" Daha anlamlı bir mesaj olan "3 kişi" den daha fazla ödül yok.

Oluşturulan her cümlenin puanını hesaplamak için aşağıdaki sezgisel formülü kullanırız:

Bunların arasında, cümledeki yüklem ve varlıklardan bahsedenler vardır. derinlik (m), OKR'nin ilgili kelime dağarcığındaki belirli bir kelimenin derinliğini belirtir. = 1, = 0.1 ayarlama deneyimimiz var.

Özet cümledeki her kavram (varlık veya önerme), OKR tarafından bahsedilen ve orijinal metni ile bağlantılıdır. Bu bahsetme seti, tekrarlamayı (küçük bir düzenleme mesafesine sahip dizeler) ortadan kaldırır ve 1'den büyük farklı bahsetme grupları için kavramsal genişleme sağlar. Bu, aksi takdirde gözden kaçabilecek olan konsept hakkında ek bilgi sağlar. Örneğin, Şekil 3'te "şüpheli silahlı adam" da "Jamaikalı" olarak tanımlanmaktadır. Tweet özeti oluşturma senaryosu için, her bir temsili cümlenin zaman damgasını, ilk tweetin kök cümlesinden bahsettiği zaman olarak da hesaplarız.

4 Etkileşimli kullanıcı arayüzü

Şimdi, belirli bir olaydaki birden çok mikro bloğun etkileşimli keşfi için uyguladığımız web uygulamasını ( tanımlıyoruz. Arka ucumuz Python 2.7'de uygulanmıştır ve bir CentOS sunucusunda çalışır. Ön uç, AngularJS kitaplığı kullanılarak gerçekleştirilir. JSON, veri alışverişi için kullanılır.

Şekil 2, koşu örneğimizden elde edilen Wisconsin spa çekimi hakkındaki 109 twitter mesajının başlangıç ekranını göstermektedir. Madde işareti tarzı cümleler (Bölüm 3'te açıklandığı gibi oluşturulmuş) zaman damgasına göre azalan sırada düzenlenmiştir. Her cümlenin sağında, bir pasta grafik, normalleştirilmiş bilgi puanına göre kapsadığı bilginin "yüzdesini" gösterir. En üstteki pasta grafik, o anda görünür olan cümlenin içerdiği tüm bilgileri gösterir.

Şekil 2 Wisconsin'deki bir kaplıcada silahlı saldırıya ilişkin 109 Twitter raporunun ilk görünümü Oluşturulan 10 cümle, olayların kronolojik sırasına göre bu tweetlerdeki en önemli bilgileri kapsıyor.

Başlangıçta, yalnızca belirli bir bilgi puanı eşiğini aşan cümleler kısa bir madde işareti tarzı olay özeti olarak görüntülenir. Diğer cümleler katlanır (örneğin: Şekil 2'de, 01:07 ve 22:55 zaman damgaları arasında), kullanıcı (a) zaman eksenindeki zaman aralığına; (b) satırdaki gibi katlanmış cümlelerin sayısına göre Gösterildiği gibi; (c) genişletilmesi gereken ek bilgi; (c) genişletilip genişletilmeyeceğini ve hangi cümlelerin genişletileceğini belirlemek için genişletilecek ek bilgi miktarı ve daraltılmış cümlenin üzerine gelindiğinde en üstteki pasta grafiği vurgulanır. Sürekli genişleyen cümleler sayesinde kullanıcılar, etkinliğin tüm zaman çizelgesini kademeli olarak keşfedebilir ve Twitter'daki tüm entegre verileri kullanabilir.

Bilgiyi keşfetmenin başka bir yolu, kavram genişletme yoluyladır: vurgulanan kavramın (örneğin: "şüpheli silahlı adam") üzerine gelindiğinde, soyutta aynı kavramdan farklı sözler içeren bir açılır pencere açılır (Şekil 3); Özette, üzerine tıklamak tüm ortak alıntılarını daha fazla vurgulayacaktır. Son olarak, kullanıcılar kaynak tweet'i görüntülemek için Twitter simgesine de tıklayabilirler (Şekil 4).

Şekil 3 "Şüpheli silahlı adam" ile aynı kişiden bahsetmeyi içeren ve daha fazla bilgi veren (örneğin "Jamaikalı") "genişletilmiş açılır pencere" kavramı.

Şekil 4 Açılır tweet, oluşturulan cümle için bir kaynak tweet ile kaydırılabilir bir panel gösterir.

5 Sistem Kullanılabilirlik Testi

Sistemimizin değerini değerlendirmek ve iyileştirmek için standart kullanılabilirlik testlerini kullanarak iki kullanılabilirlik çalışması yaptık. Bu testler, Witie ve diğerleri (2017) tarafından yayınlanan insan açıklamalı OKR yapılarının (Şekil 1 şeklinde) bir veri kümesi üzerinde gerçekleştirildi. Her biri yaklaşık 100 tweet içeren en büyük 6 etkinlik tweet koleksiyonunu kullandık. Bu altın standart veri seti, yeni sistemimizin avantajlarını bağımsız olarak incelememizi sağlar. Aşağıda bildirdiğimiz olumlu sonuçları göz önünde bulundurarak, sistemimizi gelecekteki çalışmalarda tam otomatik bir boru hattına entegre etmeyi ve incelemeyi planlıyoruz.

5.1 İlk Kullanılabilirlik Çalışması

İlk kullanılabilirlik çalışması iki hedefle gerçekleştirildi: fikirlerimizin yararlılığını kontrol etmek ve kullanıcı ihtiyaçlarını anlamak.

Yöntem Basit kullanılabilirlik testi ilkesine göre (Nielsen, 1993), prototipin değerlendirme aşaması için sadece birkaç değerlendiriciye ihtiyaç vardır. Bu nedenle, projemize aşina olmayan 6 öğrenci değerlendirici olarak işe alındı. Onlardan, seçilen altı olaydan birinde bir dizi zamanlanmış görev gerçekleştirmelerini istedik. Sistemin kullanımı sırasında kullanıcı aktivitelerini gözlemliyoruz ve kullanıcı yorumlarını almak için "kendi kendine konuşma" teknolojisini kullanıyoruz. Her ekrandaki etkinliği yakalamak için "ilk video yakalama yazılımını" ( kullanın. Tüm görevleri yerine getirdikten sonra, kullanıcıdan öznel kullanılabilirlik değerlendirmesi için Sistem Kullanılabilirlik Ölçeği (SUS) anketini (Brooke, 1996) doldurması istenmiştir.

Sonuç Tablo 1, 10 SUS sorusunun her biri için 1'den 5'e kadar bir ölçekte ortalama puanı listelemektedir. Genel olarak, kullanıcılar bu prototipi kullanımı kolay buluyor ve sık sık kullanmak istiyorlar. SUS anketi, içinde sistemin genel kullanılabilirliğini temsil eden önemli bir tek sayı üretir. Bu sayı, 10 sorunun puanlarına göre hesaplanır. Tablo 2'de gösterildiği gibi, memnun olmayan bir kullanıcı haricinde (bu kullanıcı, bir yazılım kalite güvence geçmişine sahiptir ve çok küçük yazılım ve kullanıcı deneyimi hatalarını kontrol etmiş gibi görünüyor, bu sorunu daha sonra tartışacağız). Sistem puanları 70 ile 95 arasında değişmektedir. Test sırasında yapılan gözlemler ve sözlü raporlar, prototipimizi geliştirmemize yardımcı olan bir dizi gereksinim ortaya çıkardı.

Tablo 1 Kullanılabilirlik çalışmasından sonra sorulan on SUS sorusu ve 1'den 5'e kadar olan ölçekte ortalama yanıt puanları

Tablo 2 Her kullanıcı için bir SUS sorusunun puanına göre hesaplanan SUS puanları

5.2 Kullanılabilirlik testinin karşılaştırılması

Sistemimizi ön çalışmadan iyileştirmek için güncelledikten sonra, sistemimizin göreceli etkinliğini test etmek için başka bir karşılaştırmalı çalışma yaptık.

Yöntem IAS tarafından temsil edilen (etkileşimli özet özet oluşturma için) sistemimizi karşılaştırdık ve iki temel yöntem var:

  • Tweetler: Bir etkinlik veri kümesindeki tüm orijinal tweetlerin listesi.
  • Statik: Sistemimiz tarafından (Bölüm 3), etkileşimli özellikler ve meta veriler (konsept genişletme, bilgi puanları vb.) Olmadan oluşturulan tam bir sıralı cümleler listesi.

Daha önce de belirtildiği gibi Witie ve diğerleri (2017) tarafından yayınlanan 6 olaylı altın standart OKR yapısını kullandık. Altı kullanıcı, her arayüzde (IAS, Tweet, Statik) iki olay görüntüler ve olayların arayüzlere atanması ve arayüz sırası her kullanıcı için farklıdır. Kullanıcı, belirlenen arayüzdeki her bir olayın açıklama bilgilerini araştırdı ve sonunda kullanım anketini doldurmasını istedi (Lund, 2001).

Anket, kullanıcıların 3 arayüzü 1'den 3'e kadar 33 cümle aralığına göre sıralamalarını gerektirir. İlk 30 KULLANIM ifadesi dört boyutu temsil ediyordu: kullanışlılık, memnuniyet, kullanım kolaylığı ve öğrenme kolaylığı. Kullanıcıların bilgi keşfetme deneyimlerini sıralamak için üç ifade ekledik (diğer üç ifade şunlardır: sistem beni aktif olarak daha fazla bilgiyi keşfetmeye motive ediyor; bu sistem, bu olayın önemli noktalarını bildiğimi hissettiriyor; sistem olayları fark etmeme yardımcı oluyor Önemli detaylar).

Sonuç Tablo 3, kontrol edilen her boyutta her arayüzün ortalama sıralamasını göstermektedir. Sistemimiz temelden daha karmaşık olsa da, yalnızca okumayı gerektirir, ancak kullanışlılık, memnuniyet ve bilgi keşfi açısından her zaman en yüksek sistem olmuştur. Bu, özet cümle ne olursa olsun, etkileşimin kullanıcılara çok fazla değer sağladığını gösterir (temel statik ile karşılaştırıldığında açıktır).

Tablo 31 ila 3 aralığındaki üç sistemin USE anketinin her bir boyutunun puanlarının karşılaştırılması

Diğer ana hatlarla karşılaştırıldığında, sıralı KULLANIM beyanı, özetimizin kalitesinin bir göstergesi olarak da kullanılabilir. Standart özet üretme metriği, statik özetler için tasarlanmıştır (ROUGE ve piramit yöntemleri, özetlerin değerlendirilmesi için ortak göstergelerdir) İçeriği dinamik olduğundan ve kullanıcı tarafından işletildiğinden, bu, etkileşimli sistemimiz için yeterli değildir. . Etkileşimli özetlerin yararlı olduğu burada gösterilmiştir.Etkileşimli özet oluşturma için özel kalite testleri tasarlamak ve yürütmek, gelecekteki odak noktamızdır.

6 İlgili çalışma

Çok metinli özet oluşturma sorununu çözmek için çok fazla çalışma yapılmıştır. Burada, kullanıcı etkileşimlerinin özet oluşumunu geliştiren çok az sayıda çalışmaya odaklanıyoruz.

İNeATS sistemi (Leuski ve diğerleri, 2003) uzunluk ve katılan öğeler gibi parametrelerin açık bir şekilde kontrolüne izin veren erken bir etkileşimli özet oluşturma sistemidir. Yan ve diğerleri (2011), kullanıcı tıklamaları aracılığıyla temalar ve bağlam gibi kullanıcı tercihlerini keşfetmeye çalışan daha örtük bir yöntem üzerinde çalışmışlardır. Bu yöntemlerin her ikisi de, kullanıcı geri bildirimlerine göre özetin sürekli güncellenmesini gerektirir.

Son SUMMA sistemi (Christensenet diğerleri, 2014) hiyerarşik özet oluşturmayı destekleme açısından bizimkine benzer. Öne çıkan özet cümleler hiyerarşide çok yüksektir ve daha alt seviyelere inilerek daha fazla ayrıntı keşfedilebilir.

Yukarıdaki yöntemlerin tümü, orijinal metindeki cümlelerden oluşan özetleri hesaplar ve çıkarır. Aksine, ekstraksiyon yöntemimizin bazı çekici avantajları vardır. En önemlisi, birkaç farklı atomik gerçeği birleştirebilen veya metinsel bağlam gerektirebilen mevcut cümlelerle sınırlı olmadığı için, yöntemimiz esnek madde işareti tarzı özetler oluşturmaya yardımcı olur. Bu şekilde, kullanıcılar verilere atomik gerçekler düzeyinde göz atabilir, böylece kullanıcı geri bildirimlerini dahil etmek için özetleri yeniden oluşturmaktan kaçınabilir.

7 Sonuçlar ve gelecekteki çalışma

Bu makale, özet özet bilgilerinin etkileşimli olarak araştırılması için yeni bir sistem önermektedir. Sistemimiz, birden çok metin bilgisini entegre etmek ve bu bilgileri tam olarak yakalayan bir özet oluşturmak için açık bilgi temsili OKR (Witie ve diğerleri, 2017) üzerine inşa edilmiştir. Etkileşimli kullanıcı arayüzü, en belirgin gerçeklere odaklanmanıza ve farklı etkileşim modları aracılığıyla kademeli olarak daha fazla ayrıntı elde etmenize olanak tanır. Kullanılabilirlik araştırmamız, yöntemimizin etkinliği için destekleyici kanıtlar sağlar.

Araştırma sonuçlarımız gelecekteki araştırmalar için birkaç önemli yönü açıklığa kavuşturuyor. Genel olarak konuşursak, etkileşimli soyutlama yöntemimiz diğer alanlara ve diğer türden külliyatlara aktarılmalıdır. Örneğin, haber tweetleri söz konusu olduğunda, cümlelerin sırası kronolojik sırayla tamamlanır ve birleştirilmiş özet cümlelerin sıralaması genellikle önemli bir görevdir. Ek olarak, özet açıklama oluşturma yöntemimiz geliştirilebilir. Makine öğrenimi teknolojisini kullanarak en temsili cümleyi seçin. Değerlendirme için, etkileşimli bir özetin kalitesini değerlendirmek için yeterli sayıda test tasarlayacağız ve bunları kullanıcı araştırması için entegre tam otomatik bir boru hattında daha yaygın olarak kullanacağız (örneğin, bir OKR ayrıştırıcısı).

Kağıt indirme bağlantısı:

Beijing Shijingshan District, 2019'da 143,42 hektar yeşil alan eklemeyi planlıyor
önceki
İlk Yarı Real Betis 0-0 Atletico Madrid, Oblak uçuyor
Sonraki
Zhejiang Tüccarlarını Tanıyın | Yeni Çağa Saygı: Wen Tüccarları "Shanxi'yi Geçiyor" Kömür Madenlerini Kazmayın
Manchester United, Leicester City'yi 1-0 yendi, Rashford kazandı
Dünyanın bir numaralı süper bilgisayarına sahibiz, neden hala Çin'in çekirdeğinin iyi olmadığını söylüyoruz?
Yerli "Xiaoxingmai" geliyor mu? Yeni Land Rover Aurora 14 Nisan'da görücüye çıkıyor
10,73 milyar! Metrekare başına 55,285 yuan taban fiyat tarihteki en yüksek değerdir .. Henglong'da Baijingfang arsası düştü. Henglong Plaza geliyor mu?
MSI amiral gemisi sunucusu Trident X tushang: Küçük bir gövde 2080Ti'yi barındırabilir
KDV indirimleri, Mustang size bir adım daha yakın
İleri teknoloji cep telefonlarının kavisli ekranları neden ortadan kaldırılıyor? "Sözde" tam ekrana geç
Hala BT döneminden mi bahsediyorsunuz? DT zaten arkanızda duruyor
WeChatin yeni özelliği dün arkadaş çevrelerine çarptı, bunu deneyimlediniz mi?
Bugünün Temel Sesi AI tarafından mı hedefleniyor? Kaçamazsın!
Bugün, Jack Ma'nın üç büyük katkısı yayınlandı ve dünya lideri sıralamasında ikinci oldu! Papa'yı bastırın!
To Top