Doğal dil modeli algoritması çok mu dağınık? Yerel birleşik AI açık kaynak çerçevesi burada

Röportaj | Han Kun

Röportajcı | Wu Xingling

Üretildi | CSDN (ID: CSDNnews)

"AI Teknolojisi Ekolojik Teorisi" Karakter röportajı sütunu, CSDN tarafından başlatılan AI girişiminin önemli bir parçasıdır. AI ekosistemindeki en büyük kahveler, girişimciler ve endüstri KOL'leri ile yapılan röportajlar aracılığıyla, endüstri hakkındaki düşüncelerini, gelecekteki trendler hakkındaki yargılarını, teknik uygulamaları ve büyüme deneyimlerini yansıtıyorlar.

2020'de CSDN, AI ekolojisindeki ve AI endüstrisinin panoramasındaki en etkili kişileri özetlemek için bir dizi oluşturmak için 1000'den fazla kişiyle röportajlar yapacak!

Bu makale, Didi'nin yapay zeka açık kaynak platformu DELTA'nın arkasındaki teknik çerçeveyi ve evrimi ayrıntılı olarak açıklayan "AI Teknolojisi Ekolojik Teorisi" röportajları serisinin beşinci sayısıdır.

Milyonlarca insan AI öğreniyor ve sizin payınız var! Makale yorumlarına katılın, yorum alanına yorum bırakın ve 299 yuan değerinde "2020 AI Geliştiricileri Konferansı" için çevrimiçi canlı bilet alın.

Ağustos 2019'da, derin öğrenmeye dayalı konuşma ve doğal dil anlama modeli eğitim platformu DELTA resmi olarak açık kaynaklıydı. Açık kaynaklı DELTA, 1k + Star numarasıyla GitHub Hot List'te listelendi ve derin öğrenme çerçevesi Keras'ın yazarı François Chollet tarafından dikkat edildi. DELTA, yapay zeka geliştiricilerinin doğal dil işleme ve konuşma modelleri oluşturmasına ve dağıtmasına, verimli çözümler oluşturmasına ve NLP uygulamalarını daha iyi hale getirmesine yardımcı olabilir.

Didi'de NLP ve ses teknolojisinin önemli uygulamaları vardır: manuel müşteri hizmetlerine yardımcı olmak için akıllı müşteri hizmetleri sistemi aracılığıyla, sürücü sesli asistanları geliştirmek için ses tanıma ve doğal dil anlama teknolojisinin kullanılması yoluyla, Japonya, Avustralya ve diğer yerlerdeki Didi sürücülerinin sesi kullanmasına olanak tanır. "Temas yok" emri. Bu işlerin arkasında DELTA, arka uç modeli olarak kullanılmaktadır.

DELTA'nın prensibi nedir? Neden böyle bir yapay zeka açık kaynak projesi yapıyor? Bunun için "AI Technology Ecology" nin bu sayısında Didi AI Labs araştırmacısı ve DELTA proje lideri Han Kun ile özel bir röportaj var.

Han Kun

Birçok model algoritması var mı? Neden birleşmiyorsun?

Han Kun, makine öğrenimi alanında 10 yıldan fazla araştırma deneyimine sahiptir: 2008'den beri Ohio Eyalet Üniversitesi'ne doktora eğitimi almak için gelmiştir. Araştırma yönü makine öğrenimine dayalı konuşma işlemedir. 2014'te mezun olduktan sonra Facebook'a katıldım ve konuşma tanıma, doğal dil anlama ve öneri sistemleriyle uğraştım.

Han Kun, 2018'den beri Didi AI Labs'a katılmıştır ve şu anda doğal dil anlama ve konuşma işleme konularında araştırma ve ürün geliştirme yapmak için ondan fazla kişiden oluşan bir ekibe liderlik etmektedir.

DELTA'nın araştırmasının asıl amacı hakkında konuşurken Han Kun, Didi'ye katıldığında, ekibin derin öğrenme ve doğal dil anlayışı için birçok model algoritma kullandığını keşfetti.

Özellikle kod düzeyinde, Bazıları açık kaynaklı projelerden alınır ve bazıları dahili olarak geliştirilir ve bunların çoğu işlevsel olarak yeniden kullanılabilir.

Bu durumda Han Kun ve ekip şöyle düşünmeye başladı: Çeşitli model algoritmaları birleşik bir çerçeveye getirilebilirse, algoritma geliştirme yinelemelerini hızlandıracak ve daha iyi ekip işbirliğini teşvik edecektir.

Bu nedenle, teknik ekip doğal dilin anlaşılması için kodu bir bütün olarak yeniden düzenledi, çeşitli model algoritmalarını bir sistemle birleştirdi ve kodun kullanımı, okunması ve geliştirilmesini kolaylaştırdı. Geliştirme sürecinde, bu sistemin Didi'nin dışındakileri için de çok değerli olduğunu gördüler, bu yüzden kodu açık kaynak olarak değerlendirmeye ve bu konuda çok çalışmaya başladılar.

Temel çerçeve yükseltilerek uyumlu bir çukura düşürülür

DELTA'nın hızlı yineleme sürecinde, temel çerçevenin yeni sürümünün yeni işlevlerini kullanmak için ekip, uyumlu bir çukura da düştü:

Başlangıçta DELTA, TensorFlow 1.12 sistemine dayalı olarak inşa edildi.Teknik yineleme sürecinde, TensorFlow'un 1.14'e yükseltildiği ve birçok yeni özelliği tanıttığı keşfedildi. Ekip, yeni işlevleri kullanmak için DELTA'nın çekirdek modülünü hızlı bir şekilde 1.14'e yükseltti.

Sonuç olarak, DELTA'nın geliştirilmesinde yer alan diğer geliştiricilerin kodları uyumsuzdu ve bazı hatalar ortaya çıktı. Genel Ar-Ge ritmini etkileyen DELTA'yı tamir etme zamanını değerlendirmek için herkes işini derhal durdurdu.

Bu savaştan sonra Han Kun şunları söyledi: Proje işbirliği sürecinde, yükseltilmiş sürümlerin dahil edilmesi çok yaygındır. Ancak biz geliştiricilerin temkinli bir şekilde ilerlememiz gerekiyor, sonuçta bu diğerlerinin çalışmasını ve istikrarını içeriyor.

Deneyimlerden ve özetlerden öğrendikten sonra, TensorFlow 2.0'a yükseltildiğinde, DELTA hem 2.0 hem de 1.14 kodları uyumlu bir şekilde destekler ve ardından kodu 2.0'a yükseltmek için kademeli olarak optimize eder.

Teknik mimarinin ayrıntılı uygulaması

Doğal dil işleme modelleri ve konuşma modelleri, birçok yapay zeka sistemi ve kullanıcı arasındaki arayüzler olduğundan, DELTA, geliştiricilerin doğal dil işleme sistemleri ve konuşma modellerini yaratma ve devreye alma zorluğunu daha da azaltmayı amaçlamaktadır.

DELTA'nın uygulama detayları:

DELTA temel olarak hem NLP'yi hem de konuşma görevlerini ve sayısal özelliklerin eğitimini destekleyebilen TensorFlow'a dayalı olarak oluşturulmuştur. Tutarlı bir kod organizasyon yapısı oluşturmak ve birleşik bir arayüz paketlemek için metin sınıflandırması, adlandırılmış varlık tanıma, doğal dil muhakemesi, soru yanıtlama, sıralı metin oluşturma, konuşma tanıma, konuşmacı doğrulama ve konuşma duygusu tanıma gibi önemli algoritma modellerini entegre eder.

Kullanıcı model eğitim verilerini hazırladığında ve yapılandırma yapılandırmasını belirlediğinde, model eğitim hattı verileri yapılandırmaya göre işleyebilir ve model eğitimi için ilgili görevleri ve modelleri seçebilir.

Eğitim bittikten sonra model dosyası otomatik olarak oluşturulur ve kaydedilir. Model dosyası, doğrudan çevrimiçi kullanılabilen, hızlı bir şekilde ürünleştirilebilen ve araştırmadan üretime geçişi kolaylaştıran birleşik bir arayüz oluşturur.

DELTA'nın birden fazla modelin eğitimini desteklemenin yanı sıra esnek yapılandırmayı da desteklediğini belirtmek gerekir.Geliştiriciler DELTA'ya dayalı düzinelerce karmaşık model oluşturabilirler.

Buna ek olarak, DELTA çeşitli ortak görevler için istikrarlı ve verimli bir kıyaslama sağlar.Kullanıcılar modelin sonuçlarını kağıt üzerinde kolayca ve hızlı bir şekilde yeniden üretebilir ve aynı zamanda bu temelde yeni modelleri genişletebilir. Model oluşturulduktan sonra kullanıcılar, modeli çevrimiçi olarak hızlı bir şekilde tamamlamak için DELTA'nın dağıtım süreci aracını kullanabilir. Kağıttan ürün dağıtımına sorunsuz bağlantı.

Üç avantaj

Doğal dil işleme ve konuşma işleme için diğer açık kaynaklı projelerle karşılaştırıldığında, Google'ın Tensor2tensor ve Facebook'un PyText gibi projeleri daha araştırma odaklıdır ve esas olarak hızlı model oluşturma ve deneyler için kullanılır. Ekip, modelin ürün geliştirmesine çok zaman harcıyor ve hızlı bir şekilde piyasaya sürülmesine ve ürünleştirilmesine yardımcı olmak için endüstriyel uygulamalarda DELTA'yı desteklemeye çalışıyor.

Genel olarak, DELTA'nın üç özelliği vardır:

1. Kullanımı kolay

  • Yaygın olarak kullanılan ses ve metin işleme görev modellerini destekleyin; kullanıcılar, yaygın olarak kullanılan modelleri doğrudan kutudan çıkarabilir;

  • Endüstride yaygın olarak kullanılan çok modlu sahneler için, ses, metin ve harici özelliklerin çok modlu ortak öğrenimini destekleyin; büyük verileri hızlı bir şekilde eğitmek için paralel veri işlemenin ön ucunu ve yüksek hızlı model uygulamasını optimize edin;

  • Özelleştirilebilir yapılandırma dosyaları, kullanıcılar model yapısını ve parametreleri derinlemesine yapılandırabilir.

2. Kısa lansman

  • Sorunsuz bir şekilde eğitim ve canlı yayına geçiş. TensorFlow Op biçiminde çeşitli özellik çıkarma ve ön işleme modülleri uygulanır ve tüm paket veri modeli çevrimiçi sürecini açan TF Graph'te birleştirilir;

  • Tüm modeller birleşik giriş ve çıkış ile bağlantılıdır, model dışarıya şeffaftır ve herhangi bir yeni model dağıtımının çevrimiçi kodu değiştirmesine gerek yoktur.

3. Hızlı gelişme

  • Dahili model ve görev bileşenleri, geliştiricilerin kolayca arayabileceği CNN, RNN, dikkat vb. Gibi oldukça modüler hale getirilmiştir;

  • Temel modüller, verimli ve istikrarlı bir performansla kapsamlı bir şekilde test edilmiştir ve yeniden kullanıma uygundur.

Didi Kua ve araç içi sesli etkileşim sistemlerinin hepsi DELTA!

Didi'nin içinde DELTA, birçok konuşma ve doğal dil işleme projesinde kullanılıyor.Örneğin, bir süre önce netizenler sürücülere "gökkuşağı osuruğu" göndermekten bahsetti, arkasında DELTA tarafından desteklenen doğal dil anlama modülü:

Ayrıca Didi ve dış ortaklar tarafından geliştirilen araç içi sesli etkileşim sisteminde tüm diyalog etkileşim sistemi DELTA'ya dayanmaktadır.

Gelecekten bahseden Han Kun, teknik olarak, kullanıcıların başlamasını kolaylaştırmak için DELTA kullanma eşiğini daha da düşürmeyi planladığını belirtti. Parametre ayarlamayı daha da basitleştirmek için Otomatik ML işlevini geliştirin. Ekolojik olarak, biri DELTA'yı tanıtmaya devam etmek, diğeri ise daha yüksek standartlara sahip projeleri teşvik etmek için en iyi açık kaynak projelerinin kuluçka planına katılmayı düşünmektir.

Açık kaynak hakkında tavsiye

Didi Açık Kaynak, Didi Travel Kıdemli Başkan Yardımcısı Zhang Wensong tarafından tanıtılmaktadır. Şu anda Didi, yapay zeka, apletler, akıllı ulaşım, ara yazılım, ön uç çerçeveleri, Ar-Ge araçları vb. Konuları kapsayan açık kaynaklı 39 projeye sahiptir. Yıldız sayısı 5,6 W'ı aştı. .

Teknik ekip, DELTA'yı geliştirmek için dahili projelerle başladı. İç açık kaynaktan sonra, bazı olumlu geri bildirimler aldıktan sonra, onu dış kaynaklı olarak açtı ve Didi'nin 2019'daki ACL toplantısındaki etkinlikleriyle birlikte resmi olarak açık kaynaklı hale getirdi.

Açık kaynak söz konusu olduğunda, CSDN "2019-2020 Çinli Geliştiriciler Anket Raporu" nda, geliştiricilerin% 77'si açık kaynak üzerinde her hafta 5 saatten fazla zaman harcamıyor ve bunun% 31'i 1 saat içinde. Bu bakımdan Han Kun'un gözlemine göre, yerel internet endüstrisi çok fazla iş baskısı altında ve iş dışında açık kaynak kodlu bir proje oluşturmak gerçekten kolay değil.

Buna ek olarak, yerel BT ortamında, bazı geliştiriciler özellikle uzun vadeli ve derinlemesine teknolojinin arayışına odaklanmaz, bunun yerine kısa vadeli ve orta vadeli faydalara odaklanır. Ancak Han Kun, iyi açık kaynak projelerinin genellikle oldukça uzun bir geliştirme ve birikim döneminden sonra geliştirildiğine inanıyor ve bu da yerel açık kaynak geliştiricilerin motivasyon eksikliğine neden olabilir.

Han Kun, açık kaynağın kendisinin eğlenceli olduğunu ve açık kaynağı seven geliştiricilerin devam edeceğini söyledi. Örnek olarak tanıdığı yabancı açık kaynak geliştiricilerini ele alalım.Çeşitli Buluşmalara ve konferanslara aktif olarak katılıyorlar ve açık kaynak olmayan çevrelerdeki insanlarla iletişim kuruyorlar, böylece daha fazla insan açık kaynak hakkında bilgi edinebilir ve onlara katılabilir. Yardım ediyor.

Peki yerli açık kaynak ekolojisi nasıl geliştirilir?

Han Kun, bir yandan endüstri liderlerinin açık kaynağın önemini kabul etmek ve üst düzey tasarımdan açık kaynak etkinliklerini teşvik etmek için inisiyatif alması gerektiğini söyledi. Öte yandan, geliştiricilerin dış dünyayla daha fazla iletişim kurması gerektiğini, böylece daha fazla insanın açık kaynağın sadece Geliştiricinin kendi kendine eğlenmesi çok değerlidir.

Portal: https://github.com/didi/delta

Bugünün refahı: yorum alanı seçildi, çevrimiçi 299 yuan değerinde "2020 AI Geliştiricileri Konferansı" nı alabilirsiniz Bir canlı bilet . Parmaklarınızı hareket ettirin ve söylemek istediklerinizi yazın.

Görüşme tamamlandı! 2020 sürüngen mülakat soruları koleksiyonu
önceki
5 günde 12 araca el konuldu! Rizhao Kamu Güvenliği Trafik Polisi "Sokak Sokağı" Yasadışı Eylemlerini Sıkı Bir Şekilde Araştırıyor |
Sonraki
Tai'an: Paidaiyue Bölgesindeki ikinci grup CPPCC organları "dört ilerlemeyi" ilerletiyor
İl Kırsal Canlandırma Hizmet Ekibi: En güzel ayak izini Rushan'da bırakın
Hong Kong Basel sizi "bulut süpürme ürünleri" çevrimiçi ticaret moduna mı yoksa "baharı" karşılamaya mı davet ediyor?
Shenzhen Yima Yolu, birkaç aydır belediye mühendisliği hasarından dolayı tamir edilmedi.
Son LPR'de faiz indirimi beklentileri düştü! Mortgage'in LPR'ye dönüştürülmesi için aylık ödeme artacak mı yoksa azalacak mı?
Namebase, GitHub geliştiricilerine para verdi, bu yeni bir yatırım mı yoksa bir yatırım dolandırıcılığı mı?
Mühendisler teknolojiden yönetime nasıl dönüşür?
Çizgi Roman: "Meme" nedir?
Luo Yonghao, borçlarını ödemek için para kazanmak için bir çapa olmaya karşılık verdi; 360 işten çıkarmaları reddediyor; Kubernetes 1.18 yayınlandı | Geek Manşet
Ali bu yıl IoT'ye tam olarak girdi Makale sonu avantajları
"Programcılar matematik yapamazlar, hiçbir şey yapamazlar!" Gelişmiş geliştirme:% 90'ı zor iş
Yine kel mi olacak? 2020'de yedi büyük AI programlama dili
To Top