Özel Transfer öğrenimini anlamak için bir makale (öğrenme kiti ile)

1. Giriş

İnsanlar için Transfer Öğrenimi (TL), benzetme yoluyla öğrenme yeteneğine hakim olmak anlamına gelir. Örneğin, bisiklete binmeyi öğrendikten sonra, motosiklete binmeyi öğrenmek çok basit; badminton oynamayı öğrendikten sonra tenis oynamayı öğrenmek o kadar da zor değil. Bilgisayarlar için, sözde transfer öğrenme, mevcut model algoritmalarının yeni bir alana ve işleve uygulanacak şekilde biraz ayarlanmasına izin veren bir teknolojidir.

Kısa bir süre önce, Hong Kong Bilim ve Teknoloji Üniversitesi'nden Profesör Yang Qiang, Machine Heart GMIS konferansında AlphaGo ile Ke Jie arasındaki Go oyununu gözden geçirdi ve AlphaGo'nun bir tanrı gibi göründüğünü ve yenilmez göründüğünü ve buna makine öğrenimi perspektifinden bakarsak Buna bakılırsa, hala zayıf yönleri var ve bu zayıflık hala çok ciddi. Bu zayıflık, AlphaGo'nun öğrenmeyi insanlar gibi aktarma yeteneğine sahip olmamasıdır. Go öğrendikten sonra satranç oynama yeteneğine geçemez.Bu sınırlamanın göç öğrenimi ile aşılması gerekir. Başka bir büyük inek olan Wu Enda, NIPS 2016 eğitiminde, transfer öğrenmenin uygulama olasılıkları konusunda çok iyimser olduğunu söyledi. Transfer öğrenmenin, denetimli öğrenmeden sonra makine öğreniminin ticari uygulamasında bir sonraki başarı dalgası olacağına inanıyor. Gerçek dünya karmaşıktır ve birçok sahne içerir. Göç öğrenimi, fenomenler aracılığıyla sorunların ortaklığını kavramamıza ve yeni karşılaşılan sorunları akıllıca çözmemize yardımcı olabilir.

Geleneksel makine öğreniminin genellikle iki temel varsayımı vardır: eğitim örnekleri ve test örneklerinin bağımsız ve aynı dağılımı karşıladığı varsayımı ve yeterli sayıda kullanılabilir eğitim örneği olması gerektiği varsayımı. Bununla birlikte, bu iki temel varsayımı gerçek hayatta tatmin etmek bazen zordur. Örneğin, stok verilerinin güncelliği genellikle çok güçlüdür.Önceki ayın verileri üzerine eğitilen modeli bir sonraki ayın tahminine sorunsuz bir şekilde uygulamak genellikle zordur; örneğin, bir şirket yeni bir iş açar ancak onu kurmak için yeterli veriye sahip olmamaktan endişe duyar. Model, kullanıcı tavsiyesinde bulunur. Son yıllarda makine öğrenimi alanında geniş ilgi gören transfer öğrenimi bu iki sorunu çözmüştür. Transfer öğrenimi, yalnızca az miktarda etiketli örnek verinin öğrenme problemini çözmek için veya hedef alanda hiç veri olmaması için mevcut bilgiyi kullanır ve geleneksel makine öğreniminin temel varsayımlarını temelde gevşetir. İnsanların benzersiz bilgeliği göz önüne alındığında, aktarım öğrenimi, büyük veriye uygun modelleri küçük verilere aktarabilir, sorunların ortak yönlerini keşfedebilir ve kişiselleştirilmiş geçişi sağlamak için genel modelleri kişiselleştirilmiş verilere aktarabilir.

2. Transfer öğrenmenin genelleştirilmiş bir tanımı

  • Koşul: Bir kaynak etki alanı Ds ve kaynak etki alanında bir öğrenme görevi Ts, hedef etki alanında bir hedef etki alanı Dt ve bir öğrenme görevi Tt verildiğinde

  • Hedef: Hedef etki alanında f (·) tahmin işlevini öğrenmek için Ds ve Ts kullanın

  • Kısıtlamalar: Ds Dt, Ts Tt

3 Transfer öğreniminin sınıflandırılması

3.1 Özellik alanına göre

  • Homojen TL: Kaynak etki alanı ile hedef etki alanının özellik alanı aynıdır, XS = XT

  • Heterojen TL: Kaynak alanın ve hedef alanın özellik alanı farklıdır, XS XT

3.2 Taşıma senaryosuna göre sınıflandırılmıştır

  • Endüktif transfer öğrenme (Endüktif TL): kaynak alan ve hedef alan farklı öğrenme görevlerine sahiptir

  • Transdüktif TL: Kaynak alan ve hedef alan farklıdır ve öğrenme görevi aynıdır

  • Denetimsiz aktarım öğrenimi (Denetimsiz TL): Hem kaynak hem de hedef etki alanlarının etiketi yoktur

4. Temel transfer öğrenme yöntemleri

  • Örnek taşıma (Bulut sunucusuna dayalı TL)

Kaynak alandaki hedef alana benzer verileri bulun ve yeni verilerin hedef alan verileriyle eşleşmesini sağlamak için bu verilerin ağırlığını ayarlayın. Aşağıdaki şekildeki örnek, kaynak alan örnek 3'ü bulmak ve ardından hedef alanı tahmin etme oranının artması için numunenin ağırlığını arttırmaktır. Avantaj, yöntemin basit ve uygulanmasının kolay olmasıdır. Dezavantaj, ağırlıkların seçiminin ve benzerliğin ölçülmesinin deneyime bağlı olması ve kaynak alan ile hedef alanın veri dağılımının genellikle farklı olmasıdır.

  • Özellik bazlı TL

Kaynak etki alanı ve hedef etki alanının bazı ortak çapraz özellikler içerdiği varsayıldığında, kaynak etki alanı ve hedef etki alanının özellikleri, özellik dönüşümü yoluyla aynı alana dönüştürülür, böylece uzaydaki kaynak etki alanı verileri ve hedef etki alanı verileri aynı veri dağılımına sahip olur ve ardından devam eder. Geleneksel makine öğrenimi. Avantajı, çoğu yönteme uygulanabilir olması ve etkisinin daha iyi olmasıdır. Dezavantajı, çözmenin zor olması ve aşırı uymaya yatkın olmasıdır.

  • Model geçişi (Parametre bazlı TL)

Kaynak etki alanı ve hedef etki alanının model parametrelerini paylaştığını varsayarsak, bu, kaynak etki alanında büyük miktarda veriyle eğitilen modelin, bir görüntü tanıma sistemini eğitmek için on milyonlarca görüntü kullanmak gibi tahmin için hedef etki alanına uygulandığı anlamına gelir. Yeni bir resim alanında bir sorunla karşılaştığımızda, eğitim için on milyonlarca resim bulmamız gerekmez. Yalnızca orijinal eğitilmiş modeli yeni bir alana taşımamız gerekir. On binlerce resim yeterlidir ve yüksek doğruluk da elde edilebilir. Avantajı, modeller arasındaki benzerliklerden tam olarak yararlanabilmenizdir. Dezavantajı, model parametrelerinin yakınsamasının kolay olmamasıdır.

  • İlişkiye dayalı TL

    İki alanın benzer olduğunu varsayarsak, aralarında belirli bir benzer ilişkiyi paylaşacaklardır.Kaynak etki alanındaki mantıksal ağ ilişkisi, örneğin biyolojik virüs yayılmasının bilgisayar virüsü yayılmasına geçişi gibi, göç için hedef etki alanına uygulanır.

5. Transfer öğreniminin uygulama senaryoları

5.1 Transfer öğrenmenin teorik araştırma değeri

  • Etiketli verilerin kıtlığını çözün

Büyük veri çağında, yüz milyonlarca veri ölçeği, verilerin giderek daha ciddi istatistiksel heterojenliğine ve eksik etiketlere yol açtı. Etiketli verilerin eksik olması, geleneksel denetimli öğrenmede ciddi aşırı uyum sorunlarına neden olacaktır. Veri kıtlığını çözmek için mevcut yöntemler, geleneksel yarı denetimli öğrenmeyi, işbirliğine dayalı eğitimi, aktif öğrenmeyi vb. İçerir, ancak bu yöntemler hedef alanda belirli bir dereceye kadar etiketli veri gerektirir ve etiketlenmiş veriler kıt olduğunda manuel olarak etiketlenmiş verileri elde etmenin maliyeti çok yüksektir. Büyük. Şu anda, hedef alanın öğrenme etkisinin iyileştirilmesine yardımcı olmak için transfer öğrenmeye ihtiyaç vardır.

  • Durağan olmayan genelleme hata paylaşımı

Klasik istatistiksel öğrenme teorisi, bağımsız ve özdeş dağılım koşulu altında modelin genelleme hatasının üst sınırını sağlar. Durağan olmayan bir ortamda (farklı veri alanları bağımsız ve özdeş dağıtım varsayımına uymaz), geleneksel makine öğrenimi teorisi artık geçerli değildir, bu da heterojen veri analizi ve madenciliğe teorik riskler getirir. Geniş anlamda, transfer öğrenimi, durağan olmayan ortamlarda geleneksel makine öğreniminin teşviki olarak görülebilir. Bu nedenle, durağan olmayan bir ortamda, transfer öğrenimi, klasik makine öğrenimine önemli bir teorik tamamlayıcıdır.

5.2 Transfer öğrenmenin pratik uygulamaları

  • Robot kolu eğitimi

Modelleri gerçek robotlarda eğitmek çok yavaş ve çok pahalıdır. Çözüm, önce simülasyon öğrenimini gerçekleştirmek ve simülasyon öğreniminden öğrenilen bilgileri, kaynak etki alanı ile hedef etki alanı arasındaki özellik alanının aynı olduğu gerçek dünya robot eğitimine aktarmaktır. Son yıllarda bu alanda yapılan araştırmalar birçok kişinin ilgisini çekmiştir. Aşağıdaki resim Google DeepMind'in çalışmasıdır: Resmin solunda robotik kolun hareketini simüle edilmiş bir ortamda eğitmektir.Eğitim tamamlandıktan sonra bilgi gerçek dünyadaki robotik kola aktarılabilir.Gerçek robotik kol küçük bir eğitimle çok iyi olabilir. Etki, aşağıda gösterildiği gibi sağda gösterilmektedir.

Videoyu izleyin: https://www.youtube.com/watch?v=YZz5Io_ipi8

  • Kamuoyu analizi

Transfer öğrenimi, kamuoyu analizinde kullanıcı değerlendirmesine de uygulanabilir. Örnek olarak elektronik ürünler ve video oyunu ürünleriyle ilgili kullanıcı yorumlarını alın. Şekilde, yeşil iyi bir inceleme etiketi ve kırmızı, kötü bir inceleme etiketidir. Resmin solundaki elektronik ürün değerlendirmesinden (kaynak alan) özellikleri çıkarın, elektronik ürün değerlendirme alanında bir model oluşturun ve ardından bunu geniş ölçekli bir kamuoyu geçişi elde etmek için sağdaki video oyun alanına (hedef alan) ve yeni Alanlar etiket gerektirmez.

  • Önerilen sistem

Transfer öğrenmesi tavsiye sistemlerinde de kullanılabilir.Belirli bir alanda bir tavsiye sistemi oluşturun ve ardından onu seyrek, yeni dikey alanlara uygulayın. Örneğin, olgun bir film öneri sistemi, soğuk bir başlangıçta bir kitap öneri sistemine uygulanabilir.

  • Kişiselleştirilmiş görüşme

Önce genel amaçlı bir diyalog sistemini eğitin ve ardından belirli bir alandaki küçük verilere göre değiştirin, böylece diyalog sistemi o belirli alandaki görevlere uyum sağlayabilir. Örneğin, bir kullanıcı kahve satın almak isterse, büyük bir fincan ve küçük bir fincan, sıcak ve soğuk istemek gibi tüm sıkıcı soruları yanıtlamak istemiyor mu?

  • Veri üretken aktarım öğrenme-GAN

Generative Adversarial Network (GAN), yeni bir makine öğrenimi fikridir. GAN modelindeki iki oyuncu, sırasıyla üretici model ve ayırt edici model olarak hareket eder. Üretken model G, örnek verilerin dağılımını yakalar ve gerçek eğitim verilerine benzer bir örnek oluşturmak için belirli bir dağılıma (tekdüze dağılım, Gauss dağılımı, vb.) Uyan gürültü z'yi kullanır. Sınıflandırıcı, bir örneğin eğitim verilerinden gelme olasılığını tahmin eder (üretilen verilerden ziyade) Örnek gerçek eğitim verilerinden geliyorsa, D yüksek bir olasılık verir, aksi takdirde D küçük bir olasılık verir. GAN optimizasyonu bir minimax oyun problemidir.Nihai amaç, jeneratör çıktısı ayırıcıya gönderildiğinde, bunun gerçek mi yoksa sahte mi olduğuna karar vermenin zor olmasıdır.

Belirli bir veri kümesi üzerinde eğitilmiş iyi bir üretken modelimiz varsa, önceki veri kümesinden önemli ölçüde farklı bazı yeni veriler varsa, değiştirmek için "GAN + sınır koşullarını" kullanabiliriz. Üretken model, yeni veri dağıtımına taşınır. Örneğin, yazdığımızda herkesin imzası farklıdır. İmzalamak için yazdırmayı kullanmayız çünkü her birimizin kendi yazma özelliklerine sahibiz. Daha sonra, iyi bir genel model eğitmek için ilk bölüm için eğitim örnekleri olarak çok sayıda basılı karakter kullanırsanız ve eğitim örneklerinin ikinci bölümü olarak bir kişinin el yazısıyla yazılmış italiklerini kullanırsanız, basılı modeli dönüştürmek için Wasserstein GAN'ı kullanabilirsiniz. Kişisel imzaya geçin. Başka bir deyişle, böyle bir imza daha kişiselleştirilmiştir.

6. Transfer öğrenimi ile ilgili yarışmalar

  • (

  • (

7. Transfer öğrenimi konusunda temsili araştırma akademisyenleri

Transfer öğrenimi üzerine araştırma, temsili araştırma akademisyenlerinin transfer öğrenimi konusundaki başarılarını izleyerek başlayabilir. Yurtiçi ve yurtdışında göç öğrenimi temsilcileri şunları içerir:

  • Hong Kong Bilim ve Teknoloji Üniversitesi'nden Profesör Yang Qiang

  • Dördüncü Normal Formun CEO'su (https://scholar.google.com.sg/citations?user=AGR9pP0AAAAJhl=zh-CN)

  • Nanyang Teknoloji Üniversitesi Yardımcı Doçenti (

  • Doçent, Bilgisayar Teknolojisi Enstitüsü, Çin Bilimler Akademisi (

8. Migration Learning Toolkit

  • ( Wenyuan Dai, Qiang Yang, ve diğerleri, C dili

  • ( Eric Eaton ve Marie desJardins, Java

  • ( Jiang Jiang, C ++

  • ( Fuzhen Zhuang, Ping Luo, ve diğerleri, Matlab

  • ( Yin Zhu, Yuqiang Chen, ve diğerleri, Matlab

  • (https://github.com/viggin/domain-adaptation-toolbox), Ke Yan, Matlab

9. Referanslar

2017 Hong Kong Bilim ve Teknoloji Üniversitesi Yang Qiang Makinenin Kalbi GMIS Zirvesi Konuşması

2016 Hong Kong Bilim ve Teknoloji Üniversitesi Yang Qiang KDD Çin Teknoloji Zirvesi konuşması

Sinno Jialin Pan ve Qiang Yang, Transfer öğrenimi üzerine bir anket

Karl Weiss, Taghi M. Khoshgoftaar ve DingDing Wang, Bir transfer öğrenimi araştırması

Long Mingsheng, Transfer Öğrenme Problemleri ve Yöntemleri Üzerine Araştırma

Not: Yukarıdaki resimlerden bazıları yukarıdaki referans malzemelerden alınmıştır.

Luneng, son 10 dakika içinde arka arkaya üç tartışmalı ceza aldı. Süper Lig'deki profesyonel hakemler fazla "amatör"!
önceki
Guoan deli! Zhang Yuning'in U23 gencini değiştirdi ve 4 dakika içinde yedek kulübesinde gol attı!
Sonraki
Asya Kupası'nın 51 maçını izledikten sonra milli futbol takımına giden zayıf takım gerçekten gitti
Amerikan draması "Silikon Vadisi" nde "sosisli sandviç" uygulamasını oluşturmak için TensorFlow ve Keras'ı nasıl kullanacağınızı öğretin
Girişim portföyünün boyutu gizlidir! Birçok VC'nin "haitou" projeleri için "Moğolistan" a güvendiği ortaya çıktı
Heze polisi alenen 20 kaçak aradı! Gelin ve oyunda yeni yılı kutlayın
Patlayıcı ürünler için hızlı bir zafer yaratın ve veriler için bir dayanak bulun | China Eastern Data Lab Wang Xuewu ile diyalog
Tepeli Batağan kış için Donghu'ya uçuyor
Singularity Üniversitesi'nin kurucusu: İnsan zekası, daha gelişmiş zeka olmak için yapay zekayı geçecek
Çin şampiyonası perde çağrısı, Chengdu Xingcheng ikinci sırada
"Double 11" karnavalı 10 yıl oldu, ilk single'larını göstermeye gelen 11 kişi
Özel Yalancıları Fare İzleriyle Tanımlayın
Benzeri görülmemiş! Sadece Çin'e yaklaşmak için bu ülke "savaş"
+ 1V3 puan almayı planlayan ve dünya dalgasına dönen 7 dakikalık baskın, 22 yaşındaki Zhang Yuning, Guoan 2 dış yardımını fethetti!
To Top