Veri savaşı: NLP'nin pratik aşamasının özü

Leifeng.com AI teknolojisi yorum notu: Yapay zeka teknolojisi işimize ve günlük yaşamımıza giderek daha fazla uygulandığından, insanlar bilgisayarlarla etkileşim için daha yüksek gereksinimler ortaya koydu. Açıkçası, insanlar artık basit insan-bilgisayar diyalogundan memnun değiller, ancak hayal gücüyle insanlar arasındaki içten ve içten iletişimi sağlayabilirler, tıpkı bilim kurgu filmlerinin insanlara gösterdiği gibi.

Ancak insanlar arasındaki iletişim, kelimelerin veya cümlelerin ifade edebileceği şey değil, hassas ve karmaşık bir süreçtir. Hayatta tonunuzu güçlendirmek, zevkinizi, öfkenizi veya can sıkıntınızı ifade etmek için çok sayıda ton parçacığı kullanabiliriz. Bilgisayarların insanın günlük iletişim terimlerini gerçekten anlaması için, yalnızca kelimelerin tanımlarını anlamak yeterli olmaktan uzaktır.Bilgisayarlar ayrıca insan duygularını ve hatta alt metni de anlamalıdır.

NLP, aslında son derece zengin insan dili ile makine dili arasında engelsiz bir iletişim köprüsüdür. Yeni AI teknolojisinin gelişmesiyle birlikte, farklı senaryoları desteklemek için büyük miktarda veriye giderek daha fazla ihtiyaç duyulmaktadır.

Yapay zeka devi Shen Xiangyang, Tsinghua'daki son konuşmasında şunları söyledi: Yapay zekayı inşa etmek her zaman verilerden ayrılamaz. Sorumlu yapay zekanın nasıl tasarlanacağı ve oluşturulacağı veri kaynağına bağlıdır.

Mevcut NLP uygulama senaryolarının çoğu yeterli açıklama verisinden yoksundur ve ek açıklama maliyeti de çok yüksektir. Bu nedenle, doğruluk oranı genellikle ideal değildir.

Peki ASR / TTS / NLP motorunu düşük maliyetli, hızlı zamanlı yüksek kaliteli verilerle nasıl hızlı bir şekilde başlayabilir ve NLP'nin pratik aşamasına nasıl girebiliriz?

Bu soruna yanıt olarak Leifeng.com AI Technology Review, Appen Çin Müşteri Hizmetleri Başkan Yardımcısı Danny Duan ile derinlemesine bir diyalog kurduğu için şanslıydı. Danny, "bitmiş veri tabanının akıllıca bir seçim olduğunu" belirtti.

Aşağıdaki tam diyalog içeriğidir

Duan Yang Danny Duan, Appen Çin Müşteri Hizmetleri Başkan Yardımcısı. Daha önce Pactera'nın müdürü, başkan yardımcısı ve yapay zeka veri hizmetleri departmanı başkanı olarak görev yaptı.

1.

Başarılı bir NLP motoru için temel faktörler algoritmalar ve yüksek kaliteli verilerdir. Algoritmalar genellikle herkese açıktır. Farklılaşma, doğru ve büyük miktarlarda eğitim verilerinden gelir. Özelleştirilmiş veri toplama uzun zaman alır ve maliyetlidir.

S: Şu anda insan-bilgisayar etkileşiminin yapay zekasında neredeyse her çözümün NLP kullandığı iddia ediliyor Bu cümlenin anlamını nasıl anlıyorsunuz?

Danny: İnsan-bilgisayar etkileşiminde birkaç adım var. İlk olarak, makinenin ne söylediğini anlamasını sağlamalısın. Örneğin, akıllı konuşmacılar veya sesli asistanlar tipik bir durumdur. Sesli asistana bir kelime söylediniz, bilgisayarda karşılık gelen metne dönüştürülebilir, çünkü bilgisayar metin bilgilerini işlemek için daha kolay, bu ses tanıma teknolojisidir.

Metin dönüştürüldükten sonra, mesele, makinenin nasıl yanıt vereceğini bilmek için ne yapmak istediğinizi anlaması gerektiğidir. Bu, doğal dil anlayışının veya NLP'nin görevidir.

Örneğin akıllı bir konuşmacıya "Klimayı açmama yardım et" dedim. Birincisi, ses tanıma teknolojisi söylediklerimi metne dönüştürür. Daha sonra metni analiz ederek, amacımın klimayı açmak olduğunu biliyorum Bir sonraki adım, doğal dil anlama (NLP) görevidir. Yapmak istediğim şeyin klimayı açmak olduğunu bilerek anlıyor, böylece klimadaki alıcıyı belirli bir sıcaklığa ayarlamak da dahil olmak üzere onu açmak için yönlendiriyor. Şimdi temelde her tür doğal dil anlama motoru, her türden girdi bilgisini işleme, analiz ve kesme ve duygu çıkarma da dahil olmak üzere anlamsal çıkarma için metne dönüştürür. Bunun insan-bilgisayar etkileşimini gerçekleştirmenin temeli olduğu söylenebilir.

Tabii ki tüm interaktif zincirde başka bir adım daha var, yani makine sizinle konuşabilir Burada kullanılan teknoloji, makinenin sesine eşdeğer olan konuşma sentezidir (TTS). İnsanların konuştuğu kelimeleri metne ve daha sonra başka bir hedef dile çevirerek ilerlemeden önce bir makine çeviri bağlantısı gerektiren sesli etkileşim-sesli çeviri ile ilgili bir şube de bulunmaktadır. NLP işleme ve insan-makine diyaloğu.

S: Başarılı bir NLP nasıl tanımlanır?

Danny: Başarılı NLP aslında son kullanıcı açısından çok basit, yani ne söylemek istediğimi ve ne yapacağımı gerçek bir insan gibi bilmek ve doğru eylemler yapabilmek veya doğru yanıtlar verebilmek. Sözde yapay zeka, referans nesnesi aslında insandır, burada esas olarak sınırlı insan-bilgisayar etkileşimi alanını ifade eder. Ve AlphaGo'nun Go oynaması gibi yapay zeka, insan-bilgisayar etkileşimi dediğimiz şeyden iki farklı yön. İnsan-bilgisayar etkileşimi, insan davranışını bir kıyaslama olarak kullanmaktır, Siri'nin ses asistanı veya Baidu hoparlörler. Bir konuşma sırasında, sizi görmezsem, bir makine olduğunuzu hissedebilir miyim, yoksa size söyleyemem Makine hala gerçek bir kişi. Ayırt edemezseniz, bu NLP'nin çok başarılı olduğu ve sahtekarlığın gerçek olmadığı anlamına gelir.Tabii ki, mevcut teknoloji seviyesi hala çok uzakta.

S: NLP'nin zorluğu esas olarak dönüştürme sürecine, yani ses ve görüntüyü metne dönüştürme kısmına mı yansıyor?

Danny: Aslında asıl zorluk dönüşüm sürecinde değil, analiz sürecinde yatıyor. Çünkü metni analiz etmek, sadece bazı kelimelerin veya cümlelerin içeriğini tanımlamak anlamına gelmez, çünkü amacı belirlemek istersiniz. En sıkıntılı şey, insan niyetlerinin farklı olmasıdır. "Klimayı 26 dereceye çevirin" dedim. Bu kesin ve sınırlı bir set ... İster akıllı bir ev aleti, ister akıllı bir hoparlör olsun, uğraşması görece kolay. Ancak daha fazla durumda, söylediğim şey belirsizdir, birçok olası anlamı vardır ve ek arka plan bilgisi ile genellikle bağlamsaldır. Bu kendi içinde açık bir settir. Bu senaryoda, NLP motoru yapabilir Doğru analiz etmek ve doğru yanıt vermek çok zordur.

Yukarıdaki nedenlere dayanarak, çeşitli üreticiler NLP motorları veya uygulamaları ürettiklerinde, genellikle en yaygın alarm saatlerinden bazıları, takvimler, genel sorulara verilen müşteri hizmetleri yanıtları veya bazı yaygın aramalar gibi bazı uygulama senaryolarını önceden tanımlarlar. İçerik, isteğe bağlı video veya restoran bulma. Bu şekilde, nispeten sınırlı senaryolarda ortak niyetleri anlayabilir, analiz edebilir ve bunlara yanıt verebilir. Motor eğitimi kapsamı dışındaki içerikler için üzgünüm diyecek, ne dediğini anlamadım.

Bu nedenle, ses asistanıyla konuştuğunuzda, genellikle benim onu anlamadığımı söyleyeceğini ve sonra söylediklerinizi metne çevireceğini ve size çevrimiçi aramaya eşdeğer bir bağlantı verdiğini göreceksiniz.Aslında bunun nedeni NLP'dir. Motorun bu tür içerikle başa çıkma yolu yoktur.

Soru: Ton gibi şeyleri ayırt etmenin bir yolu yok, çünkü farklı tonlar duygusal açıdan tamamen zıt anlamlara sahip olabilir Aslında, duygusal analizin kilidini açmak imkansız mı?

Danny: Tone, duygu analizinin bir parçası, bu çok önemli bir husus ve aynı zamanda zor bir nokta olduğu da söylenebilir. Retorik bir soru gibi farklı bir tonda bir sesli asistanla konuşmaya çalışırsanız, muhtemelen size yanlış bir cevap verecektir.

Bunun yolu yok değil. Bir yandan, benzer içerik, farklı tonlar ve farklı bağlamlarla temsil edilen farklı anlamlar dahil olmak üzere çeşitli senaryoları kapsayacak şekilde eğitim için büyük miktarda veriye ihtiyaç duyulurken, diğer yandan her şeyi yapmanın farklı aşamaları vardır, her şeyden önce En temel aşamaları birleştirin ve ardından çeşitli karmaşık boyutları kademeli olarak üst üste getirin. Örneğin, normal bir konuşmanın tonu, normal konuşma hızı, özellikle belirgin çevresel gürültü olmaması ve aynı anda pek çok insanın konuşmaması da çok yaygın içeriktir.Bu türden en temel ve en geleneksel sahnelerin ilk önce eğitilmesi gerekir. Yavaş yavaş daha yüksek karmaşıklığın peşine düş.

S: Şu anda, NLP temelde hala daha geleneksel ve basit bir seviyede, karmaşık boyutları işleme seviyesine ulaşmaktan uzak mı?

Danny: Geleneksel düzeyde kullanılabileceğini düşündüğüm söylenebilir, ancak gerçek uygulama senaryolarında "kullanımı kolay" olmaktan nispeten uzak. Ancak her üreticinin uygulamaları farklıdır. Baidu, Microsoft, Google ve Apple gibi büyük şirketler için daha çok genel senaryolara odaklanırken, diğer satıcılar hastanelerde araba kullanırken insan-bilgisayar etkileşimi gibi belirli özel senaryolara odaklanır. Kullanılabilir bir NLP motorunu, kullanım kapsamını azaltarak ve sınırlı bir yatırımla sınırlı verileri kullanarak eğitmek daha kolaydır.

Doğal dil işleme sadece ses dalgalarını mekanik olarak tanımak olmadığı için, sizinle iletişim kuran insanların niyetini anlamak ve yargılamak aslında çok belirsizdir.Bu karmaşıklık gerçekten çok yüksektir.Bir hata yaptığında, tersi olarak yorumlanabilir. Feci sonuçlara bile neden olur.

S: Algoritma NLP için ilk mi?

Danny: Herhangi bir yapay zeka teknolojisi veya ürün geliştirme yapmak için aslında üç şeye ihtiyaç var: algoritmalar, hesaplama gücü ve veri. Bilgi işlem gücünün kendisi destekleyici bir şeydir. NLP için, algoritmalardaki teorik atılımlar ancak bir süre sonra ortaya çıkacak ve şimdi sektördeki algoritmalar üzerine yapılan araştırmalar genellikle açık kaynaklıdır ve aralarında çok az fark vardır. Yani gerçek çekirdek veridir.

Verinin kendisi sürekli değişiyor. Örneğin, NLP'yi konuşma tanıma ile karşılaştırırken, Çince konuşma tanıma ile ilgili olarak, çeşitli aksanlar da dahil olmak üzere Çince karakterlerin miktarı sınırlıdır. Ancak konuşmanın içeriği ve ifade edilen niyet sonsuzdur ve ortaya çıkan sonsuz yeni içerik olacaktır. Örneğin, yeni taç pnömonisi gibi, motor bu yıl güncellenmezse, onu tanıyamayabilir. Bu nedenle, bu AI şirketlerinin modellerini eğitmek ve eğitmeye devam etmek için çok fazla veriye ihtiyacı var.

2.

Veritabanının avantajları açıktır: birincisi, düşük maliyet; ikincisi, hızlı zamanlama. Bitmiş veritabanı, makine öğrenimini temel teknolojileri olarak kullanan yeni kurulan şirketlerin rekabet gücünü büyük ölçüde artırabilir.

S: Günümüzde, Appen gibi bazı üreticiler bitmiş ürün veritabanları sağlıyorlar Veritabanlarının NLP motorları üzerindeki etkisi hakkında ne düşünüyorsunuz?

Danny: Farklı veri kaynakları var. Bunları toplamak için para harcayabilirsiniz. Örneğin, birinden bir saatlik ses kaydı yapmasını istemek için para harcayabilirsiniz. Konuşma videoları veya sesli kitaplar, web sitelerindeki metin resimleri gibi bazı herkese açık verileri de bulabilirsiniz. . Sesli asistanlar, akıllı hoparlörler ve ses giriş yöntemleri gibi uygulamalar da vardır.Kullanıcı tarafından yetki verilmesi halinde, bu uygulamaları kullandığınızda gerçek kullanıcı verileri uygulamanın geliştiricisine sağlanacaktır.

Ancak bunların kendi avantajları ve dezavantajları vardır.Kullanıcı verileri ücretsizdir ancak kontrol edilemez. Bazı özel verilere ihtiyacınız varsa, ihtiyacınız olan verileri bulamayabilirsiniz. Tabii ki, hedefli tahsilat için de para harcayabilirsiniz, ancak çok fazla para harcarsanız, karşılayabilir misiniz? Herkese açık verileri ararsanız, ne kadar olduğunu bulabilirsiniz ve sistematik ve hedefli değildir.

Veritabanının değeri nedir? Birincisi, hazırdır ve onu kullandığınızda kullanılabilir.Binlerce kişinin konuştuğu bir veriyi toplar ve sonra etiketlerseniz, iki ila üç aya ihtiyacınız olabilir.Günümüzün internet çağında, bir ürün döngüsü geçti. Yukarı. İkincisi, veri tabanının maliyeti düşüktür, çünkü belirli bir kişinin özel ihtiyaçları için toplama hedeflenmez. Bir kez yapıldığında tekrar tekrar satılabilir. Her satıldığında fiyat düşürülebilir. Fonlar sınırlı olduğunda bu çok zordur. Önemli faktör.

Ama bunun nesi kötü? Halihazırda mevcuttur, bu nedenle değiştirilemez.Özel uygulamanız için özel olarak optimize edilmemiştir.Bu nedenle, veritabanının doğal bir dil anlama motoru veya bir konuşma tanıma motoru geliştirmek gibi belirli kullanım senaryoları vardır. Bir veritabanını erken aşamada kullanmak çok iyi bir yoldur, ancak sonraki aşamada uygulama senaryonuz için hata ayıkladığınızda diğer özelleştirilmiş verileri tamamlamanız gerekir.

Yapay zeka yapan pek çok şirket veri tabanı satın almaya çok istekli. Pazara hızlı ve düşük maliyetle ve kısa sürede girmeyi umarak erken bir motor geliştirdiler. Bu özellikle mevcut Çin pazarı için önemlidir çünkü Çin pazarının yineleme hızı Avrupa ve Amerika Birleşik Devletleri'ninkinden çok daha hızlıdır.Zaman hayattır denilebilir.

Bu nedenle Çin'de, kullanıldıklarında kullanılabilen Appen gibi bitmiş veritabanları gerçekten çok popüler.

3.

Bitmiş ürün veri tabanı sadece yeni başlayanlar için özellikle önemli değil, aynı zamanda Google ve Facebook gibi devlerin buna her zaman güçlü bir talebi olmuştur.

S: Veritabanı bazı girişimci şirketler için çok uygundur, peki ya Google gibi en iyi satıcılar?

Danny: Aslında, bu büyük şirketlerin daha fazla talebi olabilir. Bir yandan aynı motoru farklı uygulama senaryolarına itecekler, diğer yandan da onu farklı ülkelerin pazarlarına itecekler ve temelden hedeflenen geliştirmeye kadar olan döngüyü tekrarlamaya devam edecekler.

Örneğin, geçen yıl Amerika Birleşik Devletleri'nde iki kişilik İngilizce konuşmaların bir veritabanı Çinli müşteriler ve Amerikalı müşteriler çok fazla talep görüyor ve bunların çoğu tanınmış büyük şirketler. Neden? Yeni bir aşamaya girdikleri için, örneğin, tek kişilik konuşmaları tanıma motoru neredeyse aynıdır ve iki kişilik konuşmaları, çok kişili konuşmaları ve hatta çok kişili toplantıları tanıyacak şekilde genişletilmelidir. Tek kişinin konuşması gibi sesli materyaller elbette yeterli değildir, ancak İki kişilik bir diyalog için ses materyaline ihtiyacınız varsa, bu, veritabanının en uygun olduğu daha düşük bir başlangıç noktasından başlamaya eşdeğerdir.

Bir başka bariz eğilim de, Çin'in önde gelen bu şirketleri denizaşırı pazarları genişlettiklerinde, Çince dışındaki denizaşırı dillerin veritabanlarına ve yabancıların görüntülerine olan talebin de artmasıdır.

S: Bitmiş veri tabanında bazı etiketli veriler var mı, yoksa zaten eğitilmiş veriler mi?

Danny: Veriler, eğitim verileri ve test verileri olarak ikiye ayrılabilir.Veritabanlarının tümü eğitim verileridir. Örneğin, 500 saatlik bir İspanyolca konuşma tanıma veritabanı için ana içeriği, her biri birçok kelime söyleyen 500 kişi veya 800 kişinin 500 saatlik ses kaydıdır. Ancak bu kayıtlar genellikle tek başına yeterli değildir Bu verilerin bir miktar işlenmesi gerekir, örneğin transkripsiyon, karşılık gelen metin metninin sağlanması ve bilgisayara her ses dosyasındaki dalga formunun hangi metne karşılık geldiğini bildirme. İçerik, böylece motor eğitimi yapılabilir.

Konuşma tanıma motorunu eğitin. Örneğin, bir ses 10 saniye uzunluğundadır. Yalnızca konuşulan kelimeleri değil, aynı zamanda bu ses bölümünde görünen, kapıyı açma sesi, hapşırma sesi ve bir çocuğun ağlama sesi gibi tüm sesleri de tanıması gerekir. , Müzik çalma sesi veya geçen bir arabanın sesi, bunun yararlı bir ses içeriği mi yoksa işe yaramaz parazit sesi mi olduğunu belirleyebilmelidir, bu nedenle ses transkripsiyonu çeşitli ses türlerini ayırt etmeyi de içerir.

Bazı nispeten karmaşık işlemler de vardır, örneğin, özellikle iki kişilik veya çok kişili bir konuşma durumunda bir zaman damgası, konuşmacının ayrımı dahil her kişinin konuşmasının başlangıç konumu ve bitiş konumu da içerecektir. Çoğu durumda, buna karşılık gelen bir telaffuz sözlüğü eklenecektir. Tüm fonetik veri tabanında, örneğin, 500 saatlik işitsel süreçte 3.700 farklı kelime olabilir.Her kelime için, telaffuzu dilbilim alanındaki standart fonetik tabloya göre işaretlenmelidir.

Genel olarak, nispeten eksiksiz bir konuşma veritabanı olsa bile, müşteriye böyle bir temel malzeme seti sağlayın, bu veri setini eğitim için modele aktarmasına izin verin ve ilgili metne, zaman damgasına ve telaffuz sözlüğüne başvurmasına izin verin. Belirli tanıma yeteneklerine sahip bir motor. Telaffuz sözlüğü bağımsız olabilir, çünkü kelimelerin telaffuzu nispeten sabittir. Bu nedenle, Appen, her biri birkaç bin giriş ve yüz binlerce giriş içeren yaklaşık yüz dil olmak üzere birçok özel telaffuz sözlüğü kitaplığına sahiptir.

S: Şu anda yerel NLP daha çok denizaşırı ülkeyi kapsıyor, yoksa daha fazla Çinli mi var?

Danny: Tabii ki iç pazar Mandarin ve lehçe pazarlarına dayalı olmalı ama iç pazar günden güne rekabet haline geldi. Bu yabancı endüstrilerdeki devler de pastadan pay almaya çalışıyor. Bu nedenle yerli lider firmalar da büyüme noktaları aramalı. Ve giderek daha fazlası denizaşırı pazarlara odaklanıyor. Örneğin Alibaba, Huawei, OV, Xiaomi, iFLYTEK ve Bytedance gibi şirketler geçtiğimiz iki yılda yurtdışına açılmak için büyük çaba sarf ettiler.

Yurt dışı pazar düzenine odaklanırken, herkesin üs kampına sadık kalabilmek için iç pazarda yetiştirmeye devam ettiği söylenebilir.

4.

Düşük maliyetli ve hızlı verimli bitmiş ürün veritabanı, ASR / TTS / NLP motorunun geliştirilmesi için daha azla daha fazlasını yapacaktır.

S: ASR / TTS arasında zorluk açısından bir fark var mı? Veritabanı kullanmak neden daha uygun?

Danny: Aslında farklı uygulama türleri, ASR bir konuşma tanıma. Layman'ın terimleriyle, insanların söylediklerini karşılık gelen kelimelere dönüştürmek anlamına gelir. Örneğin WeChat sesi, sezgisel bir ASR uygulaması olan doğrudan metne dönüştürülebilir. TTS (Metinden Konuşmaya), metinden konuşmaya, sektördeki bir terim, konuşmayı sentezlemek, yani makinenin konuşmasına izin vermektir. TTS aslında tam tersi şekilde çalışır.Makine önce makineye metin sağlar.Makine bu metni karşılaştırır, bu da bir taslağı okumaya eşdeğerdir.Makine karşılık gelen sesleri yayabilir.Tabii ki, TTS konuşmayı sentezleme yöntemi konuşma tanıma yöntemiyle aynı değildir. Aynı şey, sadece eğitim yöntemi farklı değil, aynı zamanda ihtiyaç duyduğu veriler de farklı.

Nispeten konuşursak, TTS teknolojisi nispeten kolaydır ve şu anda en olgun olanıdır. Sıfırdan TTS motorundan veri toplarsanız, sadece 10 saatlik ses verisi, artı prozodi etiketleme ve telaffuz sözlüğünün üretilmesi olsa bile, iki veya üç ayda tamamlanmayacak ve maliyeti oldukça yüksek olacaktır.Bu sadece veri. Hazırlık aşaması. Bitmiş bir ürün veritabanı satın alıyorsanız, verileri aldıktan iki hafta sonra tüm veri hazırlama ve motor geliştirme süreçlerini tamamlayabilir ve kullanılabilir bir TTS motoru yapabilirsiniz, bu veritabanının avantajıdır.

Diğer bir örnek, 500 saatlik bir İspanyolca ASR dili veri kümesidir. Bunların tümü sıfırdan yapılırsa, maliyet bir veritabanı satın alma maliyetinin en az iki katı olacaktır. Zaman açısından, ses yakalama bandı işlenir ve ilgili metin yazılır. Ve telaffuz sözlüğü, en az iki ila üç ay. Ancak bir veritabanı satın alıyorsanız, sözleşmeyi bugün imzalayın ve yarın devredilebilir.

S: Bitmiş veritabanını değiştirmek için belirli ihtiyaçlara daha uygun ve belirli senaryolar için özelleştirilmiş veriler sağlamanız gerekiyor mu?

Danny: Bu tamamen doğru değil. Bitmiş veritabanları için her zaman büyük miktarda talep vardı ve pazarda özelleştirme için büyük miktarda talep vardı, ikisi arasında bir çelişki yok. Herhangi bir senaryonun temelden başlaması gerekir ve bu aşama, bitmiş veritabanının avantajlarından tam anlamıyla yararlanabileceği aşamadır. Geçmişte, yapay zeka teknolojisinin gelişimi, daha az senaryoya ve daha az veri tabanı gereksinimine odaklandı.Senaryoların çeşitlendirilmesiyle, veri tabanlarına olan talep de arttı, ancak veri içeriği ve doğruluğu gereksinimleri değişmeye devam ediyor. Kararımıza göre, belirli bir talep türü sadece tek seferlik bir taleptir veya bazı genel talepler olabilir, tekrarlanan talepleri olanlar için bunu bir veri tabanına dönüştürebiliriz. Örneğin, bebeklerin ve küçük çocukların ağlama verilerinin akıllı ev üreticileri tarafından ürün geliştirmenin belirli bir aşamasında kullanılması muhtemeldir, bir veri tabanı oluşturmanın faydalı olacağını düşünüyoruz.

S: Son olarak, Appen şu anda bitmiş bir ürün veritabanı üzerinde çalışıyor.Ürünlerinizin özelliklerini tanıtabilir misiniz?

Danny: Pazardaki önde gelen şirketlerin ve girişimlerin talep eğilimlerine ve 20 yıldan fazla sektör deneyiminin birikimine dayanarak, müşterilerimize yapay zeka ürünlerinin geliştirilmesini ve yinelemesini hızlandırmak için zengin bir bitmiş ürün veritabanı sağlayabiliriz.

* Konuşma tanıma kitaplığı (ASR) 64 dil, 21.000 saat

* Sentetik konuşma kitaplığı (TTS) 3 dil 4 ton

* Telaffuz sözlüğü 98 dil, 4,6 milyon giriş

* 21 dilde, 1.9 milyon girişte konuşma parçası sözlüğü

* 8 dilde Adlandırılmış Varlık Kitaplığı (NER)

* Kelime şekli analizörü 3 dil

* 1.000 kişinin 130.000 siyah yüz resmi

* Çin'de maske takan 1000 kişinin 7.000 yüz resmi

* Tayca, Fince ve Çince dillerinde 5000 OCR resmi

* Bebek ağlama ses verisi 300 kişi 300 dakika

* 1000 yerli kedi ifadesi ve aksiyon videosu

Burada listelenen veritabanlarına ek olarak, pazar ihtiyaçlarını karşılamak için yeni veritabanları üretmeye devam ediyoruz ve bize veritabanı beklentilerini ortaya koymak için AI teknolojisinin ön saflarında savaşan meslektaşlarımızı memnuniyetle karşılıyoruz.

Leifeng.com AI Teknolojisi İncelemesi Not: Appenin bitmiş ürün veritabanları üzerindeki çalışmaları hakkında bilgi edinmek için şu bağlantıyı ziyaret edebilirsiniz: https://www.appen.com.cn/off-the-shelf-linguistic-resources/

ICLR2020 | Google'ın en son araştırması: "Bileşik diverjans" nicel modeliyle genelleme yeteneğini sentezleyin
önceki
Today Paper | Çapraz modal yaya yeniden tanımlama; moda göçüyle mücadele; hatalara dikkat etmeyi öğrenme; dışbükey karışık tamsayı programlama, vb.
Sonraki
"Kuantum üstünlüğünden" sonra Google, TensorFlow'un son derece açık kaynaklı kuantum sürümü
AI yüz değişikliği yalnızca pediatri içindir, bu şirket AI ile 4 mühendis yaptı
Parti tarihini hatırlayın ve Şehitleri Hatırlayın 18 Ma Yaonan: Ortaokul müdüründen müfrezenin komutanına
Bu üç kitabı okuduktan sonra bir yıl içinde gelirimi ikiye katladım
Bulaşık yıkayan kız 23 yaşında bir milyon kazandı. Suikastla ilgisi olmadığı için yıllık 390 milyar gelirle geri dönüş yaptı.
Jack Ma'nın başka bir tahmini doğrulandı! 2020'den sonra bu 4 sektör gayrimenkulden daha fazla paraya sahip olacak
"Tofu Xi Shi" den Tianjin'deki en zengin kadına, kocası vefat ettikten sonra 6 yılda 5.5 milyar yuan kazandı.
60 yaşında, 120 milyar yuan değerinde, dünyanın en çılgın adamı, Li Ka-shing bile onu övdü
Jia Yueting ile aynı memlekette, babası bir sınıf arkadaşı tarafından vurularak öldürüldü ve zirveye koştu, 12 yıl boyunca iki kadın yıldızla evlendi ve ailesini kaybetti.
RMB'nin tam adını biliyor musunuz? Kısaltma "RMB" değil, 1/2/3/4/5 setleri arasındaki fark nedir
Para kazanmak için başka bir fırsat burada! Jack Ma, 50.000 milyar çıktı değeriyle geleceğin en karlı 3 sektörü açıkladı
"Övünen bağımlılığı" olan en zengin adam, üç kez hapse girdi ve "bir uçak için 500 kamyon mal" ile ünlendi.
To Top