Nanda Didi, zayıf denetimli bir öğrenme yöntemi önerdi, EAA% 5'ten fazla arttı

Yazar | Guo Lanzhe

Editör | Jia Wei

Bu makale, Li Yufeng'in Nanjing Üniversitesi'ndeki LAMDA Makine Öğrenimi ve Veri Madenciliği Enstitüsü'ndeki araştırma grubu ve AAAI 2020'de yayınlanan Didi otomobil selamlama teknik ekibi tarafından tamamlanan "Zayıf Denetlenen Öğrenme, Sürüş Paylaşımı Kullanıcı Deneyimi Geliştirmesiyle Buluşuyor" çalışmasını yorumlamaktadır.

Makaleye bağlantı: https://arxiv.org/abs/2001.09027

Mevcut makine öğrenimi teknolojilerinin başarısı genellikle yeterli etiketli verilere dayanır. Bununla birlikte, yeterli etiketli veri elde etmek çok zordur, çünkü gerçek görevlerdeki veri etiketleme hızı genellikle veri oluşturma hızına ayak uyduramaz. Zayıf bir şekilde denetlenen öğrenme (yeterince etiketlenmiş verilere dayanmayan bir makine öğrenimi çerçevesi) gerçek dünyadaki görevlere daha yakındır, ancak aynı zamanda daha zordur.

Zayıf denetimli öğrenme üzerine araştırmalar, temel olarak çeşitli özel zayıf denetimli veri sinyalleri etrafında yürütülür. Örneğin, yarı denetimli öğrenme, verileri eksik denetim bilgileriyle incelemeyi amaçlar; gürültü etiketli öğrenme, verileri yanlış denetim bilgileriyle incelemeyi amaçlar; çok örnekli öğrenme, verileri tam olmayan denetim bilgileri vb. İle incelemeyi amaçlar. . Nanjing Üniversitesi LAMDA ekibi, yıllardır zayıf denetimli öğrenmeyle ilgili teknik darboğazlar üzerine temel araştırmalar yürüttü ve güvenli yarı / zayıf denetimli öğrenme ve performans garantili otomatik yarı denetimli öğrenme önerdi.

Zayıf bir şekilde denetlenen öğrenme, pratik uygulamalara doğru ilerlemeye devam ettikçe, tamamen zayıf bir şekilde denetlenen öğrenme tekniklerinin gerçek görevlerin ihtiyaçlarını karşılaması gittikçe zorlaşmaktadır. Sebeplerden biri, olağan zayıf denetimli öğrenme tekniğinin yalnızca bir tür zayıf denetimli veri sinyali için uygun olmasıdır, tıpkı bir reçeteye benzer (zayıf denetimli öğrenme tekniği) yalnızca belirli bir hastalık için uygundur (zayıf denetlenen veri sinyali). Bununla birlikte, gerçek dünya görevlerinin verileri bazen aynı anda birden fazla hastalığa benzer şekilde çeşitli zayıf denetlenen veri sinyalleri ile ortaya çıkar. Birden çok hastalıkla işbirliği yapabilen Bileşik Zayıf Denetimli Öğrenme (Bileşik Zayıf Denetimli Öğrenme) teknolojisi çok gereklidir. Bununla birlikte, gerçek iş verileriyle birleştirilmiş uygulama vakalarının analizi dahil olmak üzere bu alanda çok az ilgili temel araştırma çalışması vardır ve araştırmaya acilen ihtiyaç vardır.

Didi Intelligent Drivers tarafından değerlendirilen gerçek iş senaryolarına dayanan bu makale, zayıf denetimli bileşik öğrenmenin gerekliliğini ve pratik faydasını göstermektedir.

Özellikle iş geçmişi şu şekildedir: Mobil internetin yıkıcı değişiklikleriyle, çevrimiçi araç selamlama gelişmeye ve popüler olmaya devam ediyor ve insanların günlük yaşamlarına giriyor. Önde gelen tek noktadan mobil seyahat platformu olarak Didi, insanların seyahatleri ve yaşam tarzları üzerinde derin bir etkiye sahiptir. Kullanıcı deneyimini olabildiğince iyileştirmek ve iyi bir sürücü ve yolcu ekolojisi oluşturmak için, çevrimiçi araç selamlamasına yönelik akıllı araç selamlama değerlendirme sistemi hayati bir rol oynar.Yolcu deneyimini, sürücü siparişlerinin adilliğini ve platform verimliliğini hesaba katmak gerekir.

Akıllı değerlendirme sisteminde, her yolcu, yolculuktan sonra cep telefonunda "Sürücü yoldan saptı mı?" Gibi önerilen bir değerlendirme sorusu alacak. Cevap, bu gezinin yetersizliğini iyi yansıtabilirse, platformun sürücüleri eğitmesine ve kullanıcı deneyimini iyileştirmesine yardımcı olacaktır. Değerlendirme sorularını önermek için makine öğrenimini kullanmak, akıllı değerlendirme sisteminin ana hedefidir.

Bununla birlikte, makine öğreniminin performansını ciddi şekilde etkileyen iki veri sorunu vardır.

Birincisi, verilerde ciddi işaretleme gürültüsü vardır, çünkü değerlendirme sonuçları genellikle yolcuların öznel faktörlerinden etkilenir, bu da yanlış işaretlerin toplanmasına neden olur ve ayrıca yolcular tarafından çok sayıda yanlış işlem ve rastgele değerlendirmeler vardır;

İkincisi, veri etiketi dağılımında bir sapma vardır, yani eğitim verilerindeki kötü incelemelerin ve iyi incelemelerin etiket dağılımı ile gerçek çevrimiçi ortamın etiket dağıtımı arasında açık bir boşluk vardır.

Bu tür bir gerçek veri problemi etrafında, zayıf denetimli bir öğrenme teknolojisi geliştirmek gerekir. Bu makalede önerilen zayıf denetimli öğrenme teknolojisi bileşik, tamamen zayıf denetlenen öğrenme teknolojisinden önemli ölçüde daha iyidir ve AUC performansını% 5'ten fazla artırabilir.

Teknik çözümler

Bu belgedeki teknik çözüm, iki aşamalı optimizasyona dayalı yeni bir çerçeve benimser. Özellikle, etiketleme gürültü problemi için numuneleri ağırlıklandırıyoruz. Amaç, gürültü numunelerine daha düşük ağırlıklar vermek ve böylece model performansı üzerindeki etkisini azaltmaktır. Amaç işlevi aşağıdaki gibidir:

Burada w örnek ağırlığını temsil eder ve model parametresidir.

Uyumsuz etiket dağıtımı sorununu hedefleyerek, etiket dağıtımına daha sağlam olan performans endeksi AUC'yi optimize ediyoruz:

Ek olarak, "iyi" bir örnek ağırlıklandırma mekanizması, elde edilen modelin doğrulama verileri üzerinde iyi performans göstermesini sağlayabilmelidir. Yukarıdaki fikirlere dayanarak, teknik çözüm aşağıdaki iki katmanlı optimizasyon hedefini benimser:

İç optimizasyon adımı, eğitim verilerindeki deneyim riskini en aza indirir ve dış optimizasyon adımı, doğrulama verileri üzerindeki performansı değerlendirir. İkisinin kombinasyonu, eğitim modelini sürekli olarak optimize eder.

Teknik çözümün genel süreci aşağıdaki şekilde gösterilmektedir:

Aynı zamanda makale, teknik çözümler için verimli optimizasyon algoritmaları önermektedir. Ayrıntılı optimizasyon teknik ayrıntıları için lütfen kağıda bakın.

Uygulama etkisi

Didi Sicheng değerlendirme verilerinde, kompozit zayıf denetimli öğrenme teknolojisi şeması, yalnızca zayıf denetimli bir veri sinyalini dikkate alan, tamamen zayıf denetlenen bir öğrenme algoritması ile karşılaştırılır. Karşılaştırma yöntemleri, etiket dağıtımının düzeltilmesinden sonra denetlenen öğrenme algoritmalarını içerir: Lojistik Regresyon (LR), Derin Sinir Ağı (DNN), XGBoost; Etiket gürültüsünün işlenmesi için SOTA algoritması Sıralı Budama, GLC ve LTR.Özel deneysel sonuçlar aşağıdaki gibidir:

Bu makalede önerilen kompozit zayıf denetimli öğrenme teknolojisi, AUC performansını% 5'ten fazla artırabilen ve iyi verimliliği koruyabilen, tamamen zayıf denetlenen öğrenme teknolojisinden önemli ölçüde daha iyidir.

Araştırma sonuçları sadece değerlendirme verilerinin kullanımında tavsiye sonuçlarını iyileştirmekle kalmaz, aynı zamanda sürücü ve yolcu anlaşmazlıklarının adil yargılanması ve harita POI madenciliği gibi senaryolar için iyi bir referans önemine sahiptir.

Referanslar

Zhi-Hua Zhou. "Zayıf denetlenen öğrenmeye kısa bir giriş." National Science Review 5.1 (2018): 44-53.

Yu-Feng Li, Lan-Zhe Guo ve Zhi-Hua Zhou. "Güvenli Zayıf Denetlenen Öğrenime Doğru." Desen Analizi ve Makine Zekası Üzerine IEEE İşlemleri (2019).

Yu-Feng Li, Hai Wang, Tong Wei, Wei-Wei Tu. Otomatikleştirilmiş Yarı Denetimli Öğrenmeye Doğru. AAAI'19, Honolulu, HI, 2019, s. 4237-4244.

Dal Pozzolo, A., Caelen, O., Johnson, R. A. ve Bontempi, G. "Dengesiz sınıflandırma için düşük örnekleme ile olasılığın kalibre edilmesi." Hesaplamalı Zeka üzerine IEEE Sempozyum Serisi, 2015, 159-166.

Northcutt, C. G .; Wu, T .; ve Chuang, I.L. Kendine güvenen örneklerle öğrenme: Gürültülü etiketlerle sağlam sınıflandırma için kademeli budama.

Hendrycks, D .; Mazeika, M .; Wilson, D .; ve Gimpel, K. Gürültü nedeniyle bozulan etiketler üzerinde ciddi ağları eğitmek için güvenilir verileri kullanma. NIPS 2018, 1045610465.

Ren, M .; Zeng, W .; Yang, B .; ve Urtasun, R. Sağlam derin öğrenme için örnekleri yeniden ağırlıklandırmayı öğrenme. ICML 2018, 43314340.

Today Paper | ACEnet Bağlam Kodlama Ağı; Evrişimli Ağ Biyolojik Sistemi, vb.
önceki
PolarMask: Örnek segmentasyonunu, endüstride büyük ölçekte uygulanması beklenen FCN ile birleştirin
Sonraki
Göç öğreniminin sınırlarını aşın! Google "T5" yeni NLP modeli öneriyor, çoklu karşılaştırma testi SOTA'ya ulaşıyor
Today Paper | TRANSFORMER yapısı; görüntüden görüntüye çeviri; eksik açıklamalı hedef algılama çözümü; GAN su altı görüntü rengi düzeltme, vb.
Eski zamanlarda sihirli bir ayna vardı ve şimdi bir yüz tanıma makinesi, Microsoft CVPR 2020 başyapıtı var, böylece sahte yüzlerin saklanacak hiçbir yeri yok
NAS çok zordur, arama sonuçları rastgele örnekleme ile karşılaştırılabilir! Huawei ICLR 2020 belgesi 6 öneri veriyor
CVPR 2020 kabul edilen bildiriler duyuruldu: 1470 kabul edilen bildiri, kabul oranı "art arda iki damla", yalnızca% 22
AAAI Online Live | Dikkat HetSANN modeline dayalı olarak heterojen ağ semantik bilgilerini otomatik olarak madenciliği
IJCAI 2020 o kadar acımasız ki, gönderilen bildirilerin% 42'si son incelemeden önce reddedildi! Reddedilen yazar: cahil bir güce bakın, bunun üzerine geribildirim mi?
Pekiştirmeli öğrenmede her yerde bulunan Bellman optimallik denkleminin arkasındaki matematiksel ilke nedir?
Yicai muhabirleri Şangay Otobanı G50'ye gece ziyaretleri, Şangay'a giren araçların salgın durumuna ilişkin 24 saat kesintisiz nokta kontrollerine başlıyor
Bu 13 günde Wuhan'dan ayrılan tüm insanlar nereye gitti?
Grafik | Turistlerin Yılbaşı Gecesi: Çocuklar, hazır erişte ve özel Yılbaşı Yemeği
Oksijen iyon taşıma mekaniği üzerine yerinde elektron mikroskobu araştırması ilerleme kaydetti
To Top