SMP 2018 sona eriyor, bkz. Hesaplama + adalet, hesaplama + tarih yeni kıvılcımlar getiriyor

Çin Çin Bilgi Toplumu Sosyal Medya İşleme Komitesi ev sahipliğinde ve Harbin Teknoloji Enstitüsü tarafından üstlenilen 7. Ulusal Sosyal Medya İşleme Konferansı (SMP 2018), 2-4 Ağustos 2018 tarihleri arasında Harbin'de düzenlendi. Leifeng.com, özel bir stratejik medya olarak işbirliği raporları getiriyor.

SMP, sosyal medya işleme temasıyla bilimsel araştırma ve mühendislik geliştirmeye odaklanır ve sosyal medya işlemenin en son akademik araştırmalarını ve teknik başarılarını yaymak için geniş kapsamlı bir iletişim platformu sağlar ve sosyal medya işleme alanında bir endüstri-üniversite-araştırma ekosistemi oluşturmayı hedefler, Çin ve hatta Çin olur. Dünya sosyal medya işlemenin rüzgar gülü.

Bu SMP konferansının başkanları Harbin Teknoloji Enstitüsü'nden Profesör Liu Ting ve Chicago'daki Illinois Üniversitesi'nden Profesör Philip S. Yu'dur Program komitesinin başkanları, Harbin Teknoloji Enstitüsü'nden Profesör Qin Bing ve Tsinghua Üniversitesi'nden Doçent Liu Zhiyuan'dır.

Konferans sırasında Akıllı Finans Forumu, Hesaplamalı Sosyoloji Forumu, Duygu Analizi Forumu, Veri Madenciliği Forumu, Hesaplamalı İletişim Forumu, Akıllı Yargı Forumu, Hesaplamalı Tarih Forumu ve Akıllı Eğitim Forumu da dahil olmak üzere sekiz tematik forum paralel olarak düzenlenecek. Hem Akıllı Yargı Forumu'nun hem de Hesaplamalı Tarih Forumu'nun bu yıl yeni eklendiğini ve birçok tanınmış akademisyenin de değiş tokuşa katılmaya davet edildiğini belirtmekte fayda var.

4 Ağustos sabahı, Uluslararası Dostluk Sarayı Salonunda Akıllı Yargı Forumu başladı. Bir sosyal davranış normları sistemi olarak hukuk, modern uygarlığın temel taşıdır. Doğal dil işleme teknolojisinin gelişmesiyle ve ulusal "akıllı adalet" stratejisine yanıt olarak, SMP 2018 konferansı ilk kez bir akıllı adalet forumu kurdu.

Akıllı Adalet Forumu'na Dalian Teknoloji Üniversitesi'nden Profesör Lin Hongfei başkanlık etti ve temayı paylaşmak üzere beş açılış konuşmacısı davet edildi.

SMP konferansı başkanı ve Harbin Teknoloji Enstitüsü Yapay Zeka Araştırma Enstitüsü dekan yardımcısı Profesör Liu Ting, Akıllı Yargı Forumu'nun açılış konuşmasını yapmak üzere davet edildi ve SMP'nin bu yıl düzenlediği sekiz forumdan altısının beşeri bilimler ve sosyal bilimlerle yakından ilgili olduğunu ve toplumu gösterdiğini söyledi. Medya işleme konferansı, bilgi teknolojisi ve sosyal bilimin kesişme noktasıdır ve bu akıllı adalet forumu, bu alana ayak basan ilk yerel gündem olarak kabul edilebilir. Yapay zeka akademik ve hukuk çevrelerinde akıllı adaletin odağıyla, bu forumda öğretmenlerin paylaşımları ile daha fazla aydınlanmanızı umuyorum.

Sahnede ilk konuşan konuk Zhao Zhigang, Lider Ağ Güvenliği ve Yüksek Halk Savcılığı Bilgilendirme Grubu Ofisi Direktör Yardımcısı, Procuratorial Teknoloji Bilgi Araştırma Merkezi Direktörü , Konuşma konusu "Procuratorial Enformasyonun Dünü, Bugünü ve Yarını" .

"Bu en iyi zaman ve en kötü zamandır," dedi. Teftiş dairesi, İnternet tarafından temsil edilen yeni bir teknolojik devrimin ortasında. Provatoryal bilişimde iyi bir iş yapmak için bilim ve bilgeliğin kullanılması haline geldi. Zamana ayak uyduran zorunlu sorular.

1991'de Digital Procuratorate 1.0'ın otomatik ofisinden 2000'de Internet Procuratorate 2.0'a, 2009'da Information Procuratorate 3.0'a ve Temmuz 2015'teki dönüşüm ve yükseltme döneminden sonra, Supreme People's Procuratorate, " "Akıllı Kovuşturma" stratejisi, akıllı kovuşturma 4.0'ın yeni bir çağına girdi. Şu anda, bir adli dava işleme platformu, bir vekillik ofisi platformu, bir savcı karar destek platformu, bir ekip yönetimi platformu, bir tedarik koruma platformu ve çekirdek olarak bir vekaletname ifşa ve hizmet platformu oluşturdu. E-tedarik platformu.

Ayrıca, birden çok seviyeden denetim bilgilerini tanımladı:

  • Teorik sistem perspektifinden bakıldığında, Eylül 2017'de yapılan akıllı denetim toplantısı, akıllı Kenwood teorisinin temel oluşumunu belirledi. Planlama sistemi perspektifinden, "Akıllı Kovuşturmayı Derinleştirmeye İlişkin Görüşler", "Tedarikçilere Yönelik Büyük Veri Eylemi Yönergeleri" (Tek Merkez ve Dört Sistem) ve "Procuratorial Yapay Zeka için İnovasyon Kılavuzu" tarafından temsil edilen belgeler, genel stratejik planlama kademeli olarak iyileştirildi. Fikirler ve ilgili sistem yapısı.

  • "Bir ana, çoklu, yardımcı ve çoklu" tarafından yönlendirilen uygulama sistemi seviyesinden, başlangıçta muayene bilgileri uygulama sistemi oluşturulmuştur. Procuratorial organlar için birleşik bir iş uygulama sistemi inşasını başlattı ve SPAA'ların temsil ettiği akıllı yardımcı vaka işleme sistemlerini araştırdı. Ayrıca, Supreme People's Procuratorate'nin çeşitli tedarik gereksinimlerini karşılamak için büyük veri karar analiz platformu gibi bir görselleştirme platformu da oluşturdu.

  • İnovasyon sistemi perspektifinden, üniversiteler, işletmeler ve savcıların işbirliği ile deneysel yönetim merkezlerinin, bilimsel araştırma yönetim merkezlerinin ve eğitim yönetim merkezlerinin kurulması, ilgili laboratuvarların inşası ile birlikte sıfırdan bir bilgilendirme süreci yaşamıştır.

Akıllı kovuşturmanın uygulama katmanı, destek katmanı ve veri katmanı etrafında, savcılık bilişiminin gelecekte akıllı savcılık araştırmalarını keşfetmeye devam edeceğini söyleyerek sözlerini bitirdi.

Doçent Liu Zhiyuan ve Tu Cunchao Doktora Sonrası Araştırma Görevlisi, Bilgisayar Bilimleri Bölümü, Tsinghua Üniversitesi Unvanı getirdi "Yasal İstihbarat için Doğal Dil İşleme" Konuşma.

Liu Zhiyuan, doğal dilin hukukun taşıyıcısı olduğunu söyledi.Yasal metinlerin çeşitli ihtiyaçlarına dayanan yüksek kaliteli ve zengin metin verilerinin yardımıyla, doğal dil işleme, hukuk alanında akıllı vaka alma ve otomatik belge oluşturma gibi birçok uygulama olasılığına sahip. Ancak daha sonra, mevcut araştırmaların çoğunun hukuk fakültesinin ilgili araştırmasından geldiğini de belirtti.

Daha sonra Tu Cunchao, yasal zekayı gerçekleştirmek için doğal dil işleme teknolojisini kullanmanın çeşitli araştırma içeriğini tanıttı.

  • Vaka belgeleri için yargı tahmini: davanın açıklamasına dayalı olarak nihai karar sonucunu tahmin edin.

  • Topoloji tahmininin karar tahmini: hakemin karar mantığı aracılığıyla alt görevler arasındaki bağımlılığı bulun.

  • Düşük frekanslı suçların ve kafa karıştırıcı suçların karşılık gelen tahminleri de dahil olmak üzere, suç tahmininin ayırt edici niteliklerinin tanıtılması: Açık özellikler getirilerek, düşük frekanslı suçlar niteliklere göre yargılanabilir ve kafa karıştırıcı suçlar ayırt edilebilir; ayrıca, çok görevli öğrenme ve dikkat kullanılabilir Kuvvet mekanizması, nitelik temelli bir suç tahmin modeli geliştirir.

  • Hiyerarşik yapıya dayalı neden tahmini: Suç sebebi (suç) ve medeni nedenin hiyerarşik yapısı aracılığıyla, eylem nedeninin metin bilgisi ile birleştirildiğinde, ilgili modeli eğitmek için nedenin adına dayalı bir dizi tahmini ve bir dikkat mekanizması kullanır.

  • Hukuki okuduğunu anlamaya dayalı yargı tahmini: Hukuk davasıyla ilgili kararın davacının özel talepleri ile birleştirilmesi gerektiğinden, dava kararlarını tahmin etmek için "insanların soruları cevap bulmak için getirmelerinin" okuduğunu anlama davranışını taklit etmek için bir okuduğunu anlama mekanizması kurulabilir.

Yasal istihbarat teknolojisinin bilgi alma, yardımcı karar ve diğer yönler dahil olmak üzere zengin araştırma ve uygulama olanaklarına sahip olduğunu söyledi. Oldukça uzmanlaşmış ve bilgi açısından zengin bir araştırma yönü olarak, yasal istihbaratın geleceği hala zorluklarla doludur. Gelecekte, daha fazla senaryo ve uygulama yürütmek için "veriye dayalı + hukuki bilgi" kombinasyonuyla başlayabiliriz.

Sonraki Feng Yansong, Doçent, Bilgisayar Bilimi ve Teknolojisi Enstitüsü, Pekin Üniversitesi Unvanı getirdi "Hukuk Metinlerinde Doğal Dil Analizi ve Anlayışı" Konuşma.

Hukukun ve yapay zekanın kökeninin 1970'lere kadar uzanabildiğini, 1980'lerde ve 1990'larda uzman sistemlerin yükselişi ile kural temelli uzman sisteme dayalı karar alma yardımı, kanun ve yönetmeliklerin formülasyonunun iyileştirilmesi gibi araştırma çalışmalarının da başladığını söyledi. dikkat çekmek.

Ancak yapay zeka ve hukukun birleşimi patladığında, "uzman sistem" soğuk ortamı da bu kombinasyon alanına eskisinden daha az dikkat çekiyor. Bununla birlikte, erken dönem uzman sistemi, hukukçuların yerini alamayan makineler de dahil olmak üzere hala çok değerli deneyimler bıraktı, bunlar bilişimin önemli bir parçası haline gelmeli ve teknoloji de ana araştırma nesnesi olarak yasal belgeleri almalıdır.

Hukuki belgelerin araştırılması etrafında, araştırmacıların esas olarak pratiklikten başladığını ve akademi ve endüstriden geniş ilgi gören istihbarat tarafından yönlendirildiğini belirtti. Tipik görevler arasında bilgi edinme ve alma, akıllı karar verme yardımı ve diğer temel destek (dosya yönetimi, görüntü, konuşma ve metin tanıma vb.) Bulunur.

Temel uygulamalardan, temel teknolojilerden ve yasal metin kaynaklarından başlayarak, metin analizine dayalı hukuki istihbarat kamu güvenliği, savcılık, mahkemeler ve avukatlarda kapsamlı bir şekilde incelenmiştir. Örnek olarak ICAIL temsili konferansını ele alalım. Bu konferans 1987'de ortaya çıktı ve iki yılda bir düzenleniyor. 2013'ten bu yana son yıllardaki sunum yönü açısından, akıl yürütme, muhakeme ve tartışma konularındaki makale sayısı nispeten azalırken, temel NLP analizi, QA , IE, IR ve yargı tahmini giderek daha fazla ilgi gördü, ancak genel araştırma yönü yasal belgelerin analizidir.

Ayrıca uygulama alanında metin ve hukuki muhakemenin yanı sıra metin ve argüman analizinin dikkatini güçlendirme ihtiyacını vurguladı.

Genel olarak, yasal alanın karmaşıklığının yanı sıra AI ve NLP teknolojilerinin sınırlamaları göz önüne alındığında, büyük ölçekli uygulamalar için ilgili teknolojileri kullanmanın hala büyük zorlukları vardır. Örneğin, görev performansının hala iyileştirilmesi, modelin yorumlanabilirliği ve gerekçelendirme ile nasıl yapılacağı.

Ayrıca keşif için ilgili üç araştırma yönünü tanıttı:

  • Anlamsal analizin yapısal amacına dönüştürmek için hukuk alanındaki bilgiyi kullanmak, derinlemesine analiz için bilgiyi okumak ve anlamak ve kullanmak;

  • Araştırmacılar, pekiştirmeli öğrenme gibi yöntemlerle birleştiğinde belgelerden karar verme için destekleyici nedenler bulabilir ve tahmin sonuçlarını açıklayabilir;

  • Ayrıca, yöntemi sınırlı açıklama verileriyle çözebilir ve uzmanların girişini kolaylaştırabilir.

Teknik bir bakış açısıyla, hukuki metinleri derinlemesine anlamak için bölüm anlayışı, çok kaynaklı bilgi entegrasyonu, yorumlanabilir algoritmalar, çok modlu veri entegrasyonu, ek açıklama veri genişletme vb. İle ilgili yukarıdaki konular için olası keşif yönlerini paylaştı. .

Son konuşmacı Li Jianfeng, iFlytek AI Araştırma Enstitüsü araştırma direktörü, adli bilişsel istihbarat başkanı ve kıdemli araştırmacı , Konuşma konusu "Adli Bilişsel Zeka Araştırma ve Uygulaması" .

HKBTÜ iFLYTEK'in yaklaşık 20 yıllık bir gelişimin ardından dinleme ve konuşma dan anlama ve düşünmeye kadar konuşma sentezi, tanıma ve değerlendirmede lider bir performans elde ettiğini söyledi. Faz tanıma da sağlandı. HKUST iFlytek, "platform + yol" geliştirme stratejisine bağlı kalarak, açık yapay zeka platformu aracılığıyla eğitim, tıbbi bakım, adalet, hükümet ve diğer alanlarda küçük ve orta ölçekli işletmelerle derinlemesine işbirliği yürütmüştür.

HKUST iFLYTEK'in yargı sektöründeki iş düzenini ve ilgili teknik araştırmaları ve zorlukları paylaştı.

  • Keşif ve vaka yönetimi, transkriptlerin transkripsiyonu

Telefon dolandırıcılığı önleme uyarı sistemini kullanan iFLYTEK, dolandırıcı aramaların otomatik sınıflandırmasını ve zarar derecesinin doğru bir şekilde değerlendirilmesini gerçekleştirmek için büyük arama faturaları, arama sesi, uygulamalı ses tanıma ve niyet anlama teknolojisine dayanmaktadır. Transkript oturumunda, karmaşık çok kişili sorgulama, uzaktan ses tanıma ve sorgulama ve incelemenin "olanaklı kılma" problemi gibi "verimlilik" problemlerini çözmek mümkündür.

  • Grafik tanıma, otomatik kataloglama

Grafik tanıma alanında, Harbin Teknoloji Enstitüsü IFLYTEK Ortak Laboratuvarı, kamu güvenliği, savcılar ve mahkemeler gibi elektronik dosyalar için ekipman girişi, belge görüntüleri, görüntü ön işleme, düzen analizi, metin tanıma ve sonuç çıkışı yoluyla adli belgelerin grafik olarak tanınmasını gerçekleştirir. Standartlaştırılmış ve okunabilir elektronik dosya belgeleri oluşturmak için malzemeler.

  • Kanıt analizi, yardımcı ceza

Kanıt analizi, doğrulama maddelerinin çıkarılmasını, soru ve cevap kümesinin sorgulanmasını, vb. İçerir. Yardımcı cezalandırmada, ceza verme optimizasyonu, model optimizasyonu ve iyileştirmesi, dava unsurlarının çıkarılması, hukuki bilginin birleştirilmesi ve bir bilgi haritası oluşturulması yoluyla gerçekleştirilir.

  • Otomatik ceza incelemesi

Harbin Teknoloji Enstitüsü IFLYTEK ortak laboratuvarı, konvolüsyon çekirdeğini Tekrarlayan monomer ile değiştirerek DRNN modelini önerdi. Konum değişmezliğini CNN'e benzer şekilde muhafaza etme öncülü altında, pencere, aşırı uydurma sorununu ortadan kaldıran, parametre sayısını artırmadan uzun mesafeli bilgileri yakalamak için genişletilir. Bu çalışma ACL 2018'de yayınlandı.

İFLYTEK, yorumlanabilirliği artırmak ve modelin etkisini daha da iyileştirmek için vakanın unsurlarını çıkarmak için bazı girişimlerde bulundu, bu da vakanın tespit hata oranını bir dereceye kadar azaltabilir.

Harbin Teknoloji Enstitüsü IFLYTEK Ortak Laboratuvarı ayrıca hakimin ceza verme adımlarını birleştirerek karşılık gelen bir ceza verme bilgi haritası oluşturdu. Şu anda, iFLYTEK, otomatik grafik elemanı çıkarımına dayalı bir kural ölçüm cihazı geliştirmiştir.

  • Hukuki Danışmanlık Mini Programı

Genel halk için, Harbin Teknoloji Enstitüsü Xunfei Ortak Laboratuvarı, ortak sorunlar ve hukuki bilgiler için içerik referansı sağlayan ve avukat tavsiyesi, vaka analizi ve yargı tahmini ve kategori vakası itme gibi hizmetler sağlayan küçük bir hukuki danışmanlık programı geliştirmiştir.

Yargı bilişinin entelektüel meydan okumasına gelince, mevcut birkaç soruna da işaret etti.

İlk olarak, yorumlanabilirliğe, önceki yargıların tutarsızlığına ve veri dağılımının neden olduğu model sapmasına dayalı olarak, mevcut adli bilişin istatistiksel modelin içsel kusurlarını kırması gerekir.

İkinci soru, endüstri bilgisinin nasıl etkili bir şekilde kullanılacağıdır?

Makinelerin endüstri bilgisini kullanması için, keşfetmenin iki yolu olduğunu, birinin sembolojiye dayalı bir kural sistemi olduğunu; diğerinin istatistiksel bir bilgi temsili modeli elde etmek için makine öğrenimini kullanmak olduğunu söyledi. Pratik uygulamalarda iki yöntem esnek bir şekilde kullanılmalıdır.

Farklı görevler için bilgi talebi de farklıdır. Görevleri, algoritmaları ve bilgiyi birleştirerek, gelecekte üç açıdan çok çalışabiliriz:

1) Verileri etiketlemek ve veri bilgisini biriktirmek için endüstri uzmanlarıyla işbirliği yapın; 2) Algoritmik yetenekleri daha da iyileştirin; 3) Görev tanımını basitleştirin; bunlardan biri, düşük teknik gereksinimleri ve yüksek kullanıcı değeri olan uygulamaları keşfetmek ve ardından görevleri ayrıştırmak, rafine etmek ve bölmek ve fethetmektir.

Üçüncü zorluk, teknik seviye ile hakemin beklentileri arasındaki mesafedir. Bu süreçte insan-makine işbirliği uygulama senaryosu oluşturulabilir, böylece insanlar ve makineler sorunları birlikte çözebilirler.

Son olarak, Profesör Lin Hongfei bu SMP 2018 Akıllı Yargı Forumu'nu özetledi. Beş misafirin doğal dil işleme ve diğer teknolojileri akıllı adalet alanına uygulamak için kullandıklarını, araştırma yöntemlerini ve karşılaştıkları zorlukları tartıştıklarını söyledi.Gelecekte hakim ve savcıların bilgeliğinin nasıl artırılacağı ve teknolojinin nasıl daha iyi kullanılacağı İnsanlığa hizmet etmek ve bilgi teknolojisi ile sosyal bilimi entegre etmek, akıllı adaletin sürekli keşfi için de önemli bir hedef haline gelecektir.

Sabah gündemi sona erdikten sonra, öğleden sonra Hesaplamalı Tarih Forumu başladı. Bilgisayar teknolojisinin beşeri bilimler ve sosyal bilimler büyük veri araştırmalarına uygulanması, akademik toplulukta zaten bir fikir birliğine varmıştır, bu nedenle SMP, Hesaplamalı Tarih Forumu'nu ilk kez düzenledi. Bu forum, bilgisayar ve tarih alanlarından beş uzman konuşmacıyı davet etti. Forum raporunun içeriği, hesaplamalı sosyal bilimlerdeki doğal dil işleme teknolojisindeki en son gelişmeleri, metin madenciliği teknolojisine dayalı modern Çin düşünce tarihi araştırmalarını ve Çin ticaretini kapsıyor. Çin'in modern toplumunun reklam veri tabanı ve Çin'in tarihsel biyografik veri tabanının (CBDB) oluşturulması ve kullanılmasıyla modellenmesi. İlgili alanlarını ve araştırma uzmanlığını birleştirerek, bilgi işlem teknolojisi ve tarih arasındaki olası çarpışmaları tartıştılar.

Liu Zhiyuan, Doçent, Bilgisayar Bilimleri Bölümü, Tsinghua Üniversitesi Temayı şu şekilde yaptı: "Dil Temsili Öğrenme ve Hesaplamalı Sosyal Bilimler" Konuşma.

Bilgisayar perspektifinden tarihe ve hesaplamalı sosyal bilimlere doğal dil işlemenin yardımı hakkında daha fazla bilgi vereceğini söyledi. İnsan toplumu çalışması için önemli bir perspektif olarak dilden bahsetti.Sosyodilbilim ve sosyal psikoloji alanları, toplumu dil aracılığıyla analiz etmek için aralarında iyi bilinen LIWC (Dilbilimsel Araştırma ve Kelime Sayımı) sözlüğünün de bulunduğu bir dizi teori önermiştir.

Anahtar kelime tabanlı hesaplamalı sosyal bilim araştırmalarından bahsetti. Bunlar arasında, Google Kitaplar'daki "Amerika Birleşik Devletleri" ve "Amerika Birleşik Devletleri" istatistik trend grafiklerini kullanarak Amerika Birleşik Devletleri'ni nicel olarak analiz etmek gibi birkaç tipik durum vardır. Birleşik ülke kavramı yavaş yavaş nasıl oluştu? Ek olarak, Cornell Üniversitesi gibi akademisyenler, çevrimiçi topluluklarda kullanıcıların dil kullanımının değişen modellerini incelediler. WWW 2013'ün en iyi makalesinden "eski üyeler için ülke yok: kullanıcı yaşam döngüsü" nden bahsetti. ve çevrimiçi topluluklarda dilsel değişim ".

Daha sonra, sembolik istatistiğe dayalı hesaplamalı sosyal bilim araştırmalarını başlattı. Tsinghua Üniversitesi ve Xinhua Haber Ajansı, 2013 "İki Oturum" raporunu anahtar kelime çıkarma ve görselleştirme tekniklerini kullanarak analiz etmek için bir işbirliği kurdu. Ek olarak, sosyal etiketlerden de bahsetti.Örneğin, kullanıcılar çevrimiçi kaynakları rastgele etiketlerle etiketleyebilirler, etiketler kullanıcılar tarafından rastgele seçilse de, bir bütün olarak zengin anlamsal bilgiyi yansıtırlar. Buradaki uygulamalar arasında Weibo kullanıcı kariyeri tahmini, Weibo kullanıcısı büyük olay izleme vb. Yer alır.

Önceki durumları temsil öncesi öğrenme dönemi yani sembol temelli temsil olarak özetledi.Bu yöntemin çok basit ve verimli olduğunu ancak önemli bir kusuru olduğunu, yani herhangi iki nesne arasındaki ilişkiyi ayırt edememe olduğunu söyledi. Araştırma esnekliğini sınırlar.

Şimdi, nesnelerin yoğun, gerçek değerli, düşük boyutlu vektörler olarak temsil edildiği, derin öğrenmeye dayalı yeni bir dağıtılmış temsil öğrenme çağını başlattığını söyledi.Kelimedeki anlamsal değişikliklerin çalışmasından ve kelime beyinlerini çizmek için dağıtılmış temsilin kullanılmasından bahsetti. Harita ve ardından kelime temsiline dayalı insan önyargısı araştırmasından bahsetti. 2017'deki son Science makalesi, metin külliyatının tekrarlanabilir ve doğru önyargı baskıları içerdiğine ve makineler tarafından öğrenilebileceğine işaret etti.

Ek olarak, depresyona yatkın kullanıcıları çevrimiçi sosyal medyada otomatik olarak tespit etmek için sinir ağı modellerini kullanan EMNLP2017 en iyi makalesi gibi sinir ağı modellerine dayalı depresyon tespitinden de bahsetti.

Konuşmanın sonunda, dağıtılmış temsilin avantajlarını özetledi - sembolik temsilden daha güçlü hesaplama gücü sağlar ve daha güçlü ve daha derin içgörülere sahiptir. Anahtar, yaratıcı bir şekilde nasıl kullanılacağıdır.

İkinci konuşmacı Qiu Weiyun, Yardımcı Araştırmacı, Tarih ve Kültür Okulu, Shandong Üniversitesi , Konuşma konusu "Kelime Bilgisi, Kavram, Söylem: Metin Madenciliği Teknolojisine Dayalı Modern Çin Düşüncesi Tarihi Üzerine Araştırma" .

Konuşmanın başında düşünce tarihinin tanımından bahsetti.Ünlü İngiliz tarihçi ve siyaset bilimci Schwartz, düşünce tarihinin bir bütün olarak insan bilincinin yaşamı, yani düşünce, duygu, hayal gücü ve çeşitli duyguların yaşamı olduğunu; düşünce tarihinin odaklandığını söyledi. Fikirlerin ortaya çıkışı ve etkisi, fikirler ve çevre arasındaki ilişkiyi vurgular.

Daha sonra metin madenciliği teknolojisinin düşünce tarihi çalışmalarını nasıl birbirine bağladığından bahsetti. Çalışmanın neden modern Çin ile ilgili olduğuna gelince, modern zamanlardan önce, nispeten az külliyatla klasik Çince'de olduğunu ve modern zamanlardan sonra, nispeten daha fazla külliyatla yerelde olduğunu söyledi. Yukarıdaki düşünceler altında, bilim adamları beşeri bilimler araştırma teorilerini ve bilgisayar hesaplama yöntemlerini birleştirerek düşünce tarihinin incelenmesine uygun bir veri tabanı - modern Çin düşünce tarihinin profesyonel veri tabanı - oluşturdular. Bu veritabanı, öncesi ve sonrası üç evrime uğramıştır ve içeriği tarih, edebiyat ve estetiği kapsamaktadır.

Bu veri tabanını oluşturmak için, toplanan materyaller arasında Qing Hanedanlığı'nın sonları ve Ming Hanedanlığı'nın son dönemlerine ait modern süreli yayınlar, geç Qing Hanedanlığı arşivleri ve geç Qing Hanedanlığı ve erken Ming Hanedanlığı'ndaki akademisyen-resmi yazılar yer alıyor. Jin Guantao ve Liu Qingfeng, anahtar kelimelerin araştırma yöntemlerini ve beşeri bilimler alanındaki fikirlerin tarihini ve bilgi işlem alanındaki veri madenciliği yöntemlerini ödünç alıp kötüye kullandılar. Veritabanının içerik ve hesaplama işlevlerini anahtar sözcükler, dilbilim ve anlambilimsel analiz perspektiflerinden ayarladılar.

Ayrıca, "Yeni Gençlik" dergisinin modern Çin düşüncesinin gelenekten modernliğe dönüşümünü nasıl teşvik ettiğinin analizi gibi, bilgisayar yöntemlerini ve düşünce tarihi veri tabanlarını kullanan, cumhuriyetçiliğin yerini alan demokrasi ve aksiyomların yerini alan hakikatin incelenmesi gibi bir dizi çalışmadan da bahsetti.

2008'de veriye dayalı araştırmaya döndüler.İki anahtar faktör var: Birincisi, 2008'den önce araştırma yapmak için hala nispeten basit dijital hümanist yöntemler kullandıklarını fark ettiler.Hümanistlerin önce öznel belirlemeler yapması ve yalnızca gözlemleyebilmesi hala kaçınılmaz. Araştırmacının önemli olduğunu düşündüğü anahtar kelime analizi sonuçları. İkincisi, 2008'den sonra bilgisayar bilimcileri ve matematikçilerin düşünce tarihi araştırma ekibine katılmasıdır.

Bundan sonra, manuelden veriye dayalı sonuçlara odaklandı: İlk olarak, geçiş aşamasında ekip, geçmişte yapay olarak yönlendirilen teorik varsayımların neden olduğu önyargılardan kaçınan, araştırma için veriye dayalı perspektiflere geçti; İkincisi, veri yapısının kavram sistemini veriye dayalı olarak veri yapısından otomatik olarak bulmak ve kavram sistemindeki değişimi ideolojik bakış açısıyla objektif olarak sunmaktır.Bu, geçiş dönemindeki kavram tarihinin araştırma veritabanı yönteminin özelliği ve gücüdür.

Gelecekte, hesaplama tarihinin 1911 Devrimi / Dördüncü Mayıs Hareketi'ne egemen olan ana baskın duyguları bulup bulamayacağı, zamanı tetikleyen duygusal hacmin ağırlığını bulup bulamayacağı ve olayları tahmin edip edemeyeceği gibi bu temelde duygu analizi ve düşünce tarihi araştırması yapacaklar. Salgın noktası.

Li Mengqi ve Zhao Yinzhou, Chen Jing'in iki öğrencisi, Nanjing Üniversitesi Sanat Okulu'nda doçent. tanıtıldı CCAA Çin Ticari Reklam Veritabanı Ve veritabanına dayalı bir dizi analiz getirin.

Raporlara göre Çin Ticari Reklam Veritabanı (CCAA), 1880'lerden 1940'lara kadar Çin'in beş ticari anlaşmalı liman şehrinde yayınlanan gazetelerdeki ayrı reklamlar için genişletilmiş bir meta veri işleme ve profesyonel görüntü çıkarma koleksiyonudur. Tarihsel metin / resimdir.

Ekipleri, veritabanının kültür bilimcileri, tarihçiler vb. İçin yararlı reklam verileri sağlayabileceğini ve ticari kültürel yaşamın Çin'e nasıl girdiğini ve 19. yüzyılın sonu ile 20. yüzyılın başında tarihe nasıl girdiğini anlamayı teşvik edeceğini umuyor. Reklam, günlük toplumsal ve bilimsel metinlerin bir karışımı olan yeni bir yazı dili kullanıyor, tarihsel meta-insan ilişkisini tasvir ediyor ve meta odaklı bir dünyada modern insanların imajını görselleştiriyor.

Araştırmalarında üç ana sorun buldular: Biri birçok gazetenin sayısallaştırılmaması; diğeri dijitalleştirilmiş gazete ve veri tabanlarının özgür ve açık olmaması; üçüncüsü, sayısallaştırılan gazetelerin haberler kadar önemli olmaması, bu yüzden genellikle tam metin transkripsiyon yapmıyorlar (hariç Başlık ve tarih).

Bunlar arasında üç nokta dikkate alınır:

  • Birincisi, modern Çin dilinde yeni kelimelerin yaygınlaşması ve yaygın kullanımının reklam görselleriyle ilgili olup olmadığı;

  • İkincisi, Çin'de yeni bir satış dili türü ne zaman ve nasıl ortaya çıkmaya başladı;

  • Üçüncüsü, istatistiksel yöntemlerin ticari metinlerde / görüntülerde pikojeneze hangi yeni keşifler getirebileceği.

Araştırma üç konuya odaklanmıştır: Biri görüntünün nasıl okunabilir hale getirileceği, diğeri görüntünün o sırada sosyal ve kültürel bağlama nasıl bağlanacağı; üçüncüsü görüntünün nasıl bilgi üreteceği ve izleyicinin anlayabildiğini fark etmesini sağlama ve Bu bilgiyi edinin.

Bundan sonra dijitalleşmeden bilgiye dört aşamadan söz ettiler; biri dijitalleşme, diğeri etiketleme, üçüncüsü metin madenciliği ve dördüncüsü görsel sunum. Daha sonra, Tianjin "Ta Kung Pao" daki tıbbi reklamların tanımı ve analizi gibi bu veri tabanı kullanılarak yapılan ilgili araştırmalardan söz ettiler ve "Shen Bao" daki reklam görüntüleri aracılığıyla modern Şangay yol alanının biçimini ve gelişimini araştırdılar.

Sahnede son konuşan konuk Hu Bin, Peking Üniversitesi Ortaçağ Tarihi Merkezi'nde doktora öğrencisi , Konuşma konusu "Çin Biyografi Veritabanının (CBDB) Oluşturulması ve Kullanımı" .

Konuşmanın başında isimler, zamanlar, adresler, eserler, aile ilişkileri, sosyal ilişkiler vb. Birçok farklı varlığı kapsayan ilişkisel bir veritabanı olan CBDB'nin temel durumunu tanıttı. İlişkisel veritabanlarında, çeşitli varlıkların etkileşiminde karakter verilerinin var olduğunu söyledi. Veritabanına erişmek için https://projects.iq.harvard.edu/cbdb tıklayabilirsiniz.

CBDB'nin gelişim tarihinden bahsetti:

  • Profesör Hao Ruobei 1980'lerde veri toplamaya başladı ve 1996'daki ölümünden sonra bunları Harvard-Yenching Enstitüsü'ne bağışladı;

  • 2004'te Profesör Junmai Fu veri tabanının yapısını yeniden yazdı;

  • 2005 yılında Harvard / Academia Sinica / Peking Üniversitesi ortak geliştirmeye başladı;

  • Bundan sonra, veritabanı projesi birçok yerli ve yabancı vakıftan destek aldı.

CBDB şu anda 417.382 kişinin verilerini içeriyor ve Tang ve Song hanedanlarının verileri daha yüksek kalitede. Bu veritabanının özelliği karakter ilişkileridir.Karakterlerin temel niteliklerinin yanı sıra kişilerarası ilişkileri de kaydeder.10 tip ilişki, 34 tip ilişki alt kategorisi ve 241 tip ilişki girişi içerir.

Veritabanı, bilginin üç yönünü kapsar; biri biyografik biyografiler, kitabeler, mezar tabloları vb. Dahil olmak üzere orijinal malzemelerdir; ikincisi biyografik veri dizini, ilçe muhafızlarının kronolojisi ve Fangzhen kronolojisi vb. Ve üçüncüsü diğer kaynaklardandır. Veritabanındaki Ming ve Qing Dynasty Women's Works (McGill), Name Authority (Shiyu Institute) gibi karakter verileri.

Bu veri tabanının sayılar ve beşeri bilimler alanında derinlemesine bir işbirliği olduğunu, veri tabanının temelde beş aşamaya ayrıldığını, biri optik karakter tanıma (OCR), diğeri yarı manuel veri düzeltme, üçüncüsü ise işlenecek veri noktalarının bölümlendirilmesi olduğunu söyledi. Dördüncüsü, belirsizliği gidermek ve beşincisi, verileri kodlamaktır.

Daha sonra, CBDB kullanan bazı uygulamalardan bahsetti.Aşağıda, bu veri seti kullanılarak yapılabilecek üç analiz türü vardır:

İlki, grup analizi ve istatistiksel analizdir.İlgili vakalar, CBDB veri setindeki 32.270 kişinin ölüm yaşı ve CBDB verilerinde 3119 kadının ölüm yaşı hakkındaki istatistikleri içermektedir.

İkincisi, sosyal ağ analizi ve üçüncüsü, Song Hanedanlığı'ndaki 4730 akademisyenin yerel yerlerini analiz etmek gibi coğrafi mekansal analizdir.

Sonunda, Tang Hanedanlığı'ndaki figürlerin göç haritalarını ve ilgili keşiflerini yürütmek için yakın zamanda Pekin Üniversitesi Bilgi Yönetimi Bölümü DH grubu ile işbirliği yaptıklarını belirtti.

Hesaplama tarihinin beşeri bilimler araştırmalarına şu yardımı sağladığını söyledi: göreceli olarak karmaşık ve belirli tarihsel soru ve cevapları önermeye, doğrulamaya ve sunmaya yardımcı olmak ve büyük miktarda veriyi hızla ve tekrar tekrar analiz etmek ve sunmak. Bu aynı zamanda belgeleri açmanın, aramanın ve sunmanın yeni bir yoludur.

Harika forum sona erdi ve herkesin düşüncesini ve ilhamını her yerde bıraktı. SMP 2019, Pengcheng Shenzhen'de düzenlenecek ve yeni yılda herkese daha fazla heyecan getireceğine inanıyorum. Leifeng.com ayrıca size anında gerçek zamanlı raporlar getirecektir.

Bu makalenin resim kaynağı: Harbin Teknoloji Enstitüsü SCIR Li Jiaqi Feng Zhangyin, teşekkür ederim.

Lei Feng

"Gençsin" fotoğrafları ortaya çıktı, Yi Yang Qianxi hala yakışıklı ve hapishane üniformaları içinde patlıyor
önceki
Song Jia ve Xiao Song Jia aynı kişi mi? Song Jia ve Xiao Song Jia kimlerdir?
Sonraki
Nubia akıllı telefon aksesuarları alanında ve Wanmo ile birlikte gerçek kablosuz kulaklıkları piyasaya sürmek için çaba harcıyor!
Buzdolabının sırrını kesmek Meiling, buzdolaplarının "ince" çağını yaratıyor
Bu askeri tarz Nike React Hyperdunk 2017, popüler trend ayakkabılara yakın bir değer değerine sahiptir.
Genel test Borgward BX7'ye meydan okuma
Nubia üst düzey pazara girmek istiyor, yeni türler akıllı saatleri değil akıllı telefonları hedefliyor!
Han Geng'in "Detective Hawthorne" adlı filmi, MV tema şarkısını ortaya koyuyor ve "Chinese First Wave Detective" efsanesini yazıyor.
Otoriter! Chongqing SWV yeni sezona başlıyor, sponsorlar takıma 20 araba gönderiyor
Mijia masa lambası Pro bugün satışa çıkıyor, Mijia / HomeKit için titreşimsiz sadece 349 yuan
OnePlus Teknolojisinin yeni amiral gemisi yakında geliyor: OnePlus 6 stokta yok ve OnePlus 6T doğrudan bırakma modunu açıyor!
Meiling Yeni Ürün Lansman Konferansı Kesme buzdolabında yenilik mi yoksa abartı mı?
Babama uzun süre diz çökmesi için yalvarıyor, sonunda geliyor! Meizu Pay resmen başlatıldı
Gece Okuması | Çin'in kaz tüyü ceketleri, New York'un zengin bölgelerinde popüler olan satış şampiyonu oldu
To Top