1. Giriş
İnsanlar için Transfer Öğrenimi (TL), benzetme yoluyla öğrenme yeteneğine hakim olmak anlamına gelir. Örneğin, bisiklete binmeyi öğrendikten sonra, motosiklete binmeyi öğrenmek çok basit; badminton oynamayı öğrendikten sonra tenis oynamayı öğrenmek o kadar da zor değil. Bilgisayarlar için, sözde transfer öğrenme, mevcut model algoritmalarının yeni bir alana ve işleve uygulanacak şekilde biraz ayarlanmasına izin veren bir teknolojidir.
Kısa bir süre önce, Hong Kong Bilim ve Teknoloji Üniversitesi'nden Profesör Yang Qiang, Machine Heart GMIS konferansında AlphaGo ile Ke Jie arasındaki Go oyununu gözden geçirdi ve AlphaGo'nun bir tanrı gibi göründüğünü ve yenilmez göründüğünü ve buna makine öğrenimi perspektifinden bakarsak Buna bakılırsa, hala zayıf yönleri var ve bu zayıflık hala çok ciddi. Bu zayıflık, AlphaGo'nun öğrenmeyi insanlar gibi aktarma yeteneğine sahip olmamasıdır. Go öğrendikten sonra satranç oynama yeteneğine geçemez.Bu sınırlamanın göç öğrenimi ile aşılması gerekir. Başka bir büyük inek olan Wu Enda, NIPS 2016 eğitiminde, transfer öğrenmenin uygulama olasılıkları konusunda çok iyimser olduğunu söyledi. Transfer öğrenmenin, denetimli öğrenmeden sonra makine öğreniminin ticari uygulamasında bir sonraki başarı dalgası olacağına inanıyor. Gerçek dünya karmaşıktır ve birçok sahne içerir. Göç öğrenimi, fenomenler aracılığıyla sorunların ortaklığını kavramamıza ve yeni karşılaşılan sorunları akıllıca çözmemize yardımcı olabilir.
Geleneksel makine öğreniminin genellikle iki temel varsayımı vardır: eğitim örnekleri ve test örneklerinin bağımsız ve aynı dağılımı karşıladığı varsayımı ve yeterli sayıda kullanılabilir eğitim örneği olması gerektiği varsayımı. Bununla birlikte, bu iki temel varsayımı gerçek hayatta tatmin etmek bazen zordur. Örneğin, stok verilerinin güncelliği genellikle çok güçlüdür.Önceki ayın verileri üzerine eğitilen modeli bir sonraki ayın tahminine sorunsuz bir şekilde uygulamak genellikle zordur; örneğin, bir şirket yeni bir iş açar ancak onu kurmak için yeterli veriye sahip olmamaktan endişe duyar. Model, kullanıcı tavsiyesinde bulunur. Son yıllarda makine öğrenimi alanında geniş ilgi gören transfer öğrenimi bu iki sorunu çözmüştür. Transfer öğrenimi, yalnızca az miktarda etiketli örnek verinin öğrenme problemini çözmek için veya hedef alanda hiç veri olmaması için mevcut bilgiyi kullanır ve geleneksel makine öğreniminin temel varsayımlarını temelde gevşetir. İnsanların benzersiz bilgeliği göz önüne alındığında, aktarım öğrenimi, büyük veriye uygun modelleri küçük verilere aktarabilir, sorunların ortak yönlerini keşfedebilir ve kişiselleştirilmiş geçişi sağlamak için genel modelleri kişiselleştirilmiş verilere aktarabilir.
2. Transfer öğrenmenin genelleştirilmiş bir tanımı
Koşul: Bir kaynak etki alanı Ds ve kaynak etki alanında bir öğrenme görevi Ts, hedef etki alanında bir hedef etki alanı Dt ve bir öğrenme görevi Tt verildiğinde
Hedef: Hedef etki alanında f (·) tahmin işlevini öğrenmek için Ds ve Ts kullanın
Kısıtlamalar: Ds Dt, Ts Tt
3 Transfer öğreniminin sınıflandırılması
3.1 Özellik alanına göre
Homojen TL: Kaynak etki alanı ile hedef etki alanının özellik alanı aynıdır, XS = XT
Heterojen TL: Kaynak alanın ve hedef alanın özellik alanı farklıdır, XS XT
3.2 Taşıma senaryosuna göre sınıflandırılmıştır
Endüktif transfer öğrenme (Endüktif TL): kaynak alan ve hedef alan farklı öğrenme görevlerine sahiptir
Transdüktif TL: Kaynak alan ve hedef alan farklıdır ve öğrenme görevi aynıdır
Denetimsiz aktarım öğrenimi (Denetimsiz TL): Hem kaynak hem de hedef etki alanlarının etiketi yoktur
4. Temel transfer öğrenme yöntemleri
Örnek taşıma (Bulut sunucusuna dayalı TL)
Kaynak alandaki hedef alana benzer verileri bulun ve yeni verilerin hedef alan verileriyle eşleşmesini sağlamak için bu verilerin ağırlığını ayarlayın. Aşağıdaki şekildeki örnek, kaynak alan örnek 3'ü bulmak ve ardından hedef alanı tahmin etme oranının artması için numunenin ağırlığını arttırmaktır. Avantaj, yöntemin basit ve uygulanmasının kolay olmasıdır. Dezavantaj, ağırlıkların seçiminin ve benzerliğin ölçülmesinin deneyime bağlı olması ve kaynak alan ile hedef alanın veri dağılımının genellikle farklı olmasıdır.
Özellik bazlı TL
Kaynak etki alanı ve hedef etki alanının bazı ortak çapraz özellikler içerdiği varsayıldığında, kaynak etki alanı ve hedef etki alanının özellikleri, özellik dönüşümü yoluyla aynı alana dönüştürülür, böylece uzaydaki kaynak etki alanı verileri ve hedef etki alanı verileri aynı veri dağılımına sahip olur ve ardından devam eder. Geleneksel makine öğrenimi. Avantajı, çoğu yönteme uygulanabilir olması ve etkisinin daha iyi olmasıdır. Dezavantajı, çözmenin zor olması ve aşırı uymaya yatkın olmasıdır.
Model geçişi (Parametre bazlı TL)
Kaynak etki alanı ve hedef etki alanının model parametrelerini paylaştığını varsayarsak, bu, kaynak etki alanında büyük miktarda veriyle eğitilen modelin, bir görüntü tanıma sistemini eğitmek için on milyonlarca görüntü kullanmak gibi tahmin için hedef etki alanına uygulandığı anlamına gelir. Yeni bir resim alanında bir sorunla karşılaştığımızda, eğitim için on milyonlarca resim bulmamız gerekmez. Yalnızca orijinal eğitilmiş modeli yeni bir alana taşımamız gerekir. On binlerce resim yeterlidir ve yüksek doğruluk da elde edilebilir. Avantajı, modeller arasındaki benzerliklerden tam olarak yararlanabilmenizdir. Dezavantajı, model parametrelerinin yakınsamasının kolay olmamasıdır.
İlişkiye dayalı TL
İki alanın benzer olduğunu varsayarsak, aralarında belirli bir benzer ilişkiyi paylaşacaklardır.Kaynak etki alanındaki mantıksal ağ ilişkisi, örneğin biyolojik virüs yayılmasının bilgisayar virüsü yayılmasına geçişi gibi, göç için hedef etki alanına uygulanır.
5. Transfer öğreniminin uygulama senaryoları
5.1 Transfer öğrenmenin teorik araştırma değeri
Etiketli verilerin kıtlığını çözün
Büyük veri çağında, yüz milyonlarca veri ölçeği, verilerin giderek daha ciddi istatistiksel heterojenliğine ve eksik etiketlere yol açtı. Etiketli verilerin eksik olması, geleneksel denetimli öğrenmede ciddi aşırı uyum sorunlarına neden olacaktır. Veri kıtlığını çözmek için mevcut yöntemler, geleneksel yarı denetimli öğrenmeyi, işbirliğine dayalı eğitimi, aktif öğrenmeyi vb. İçerir, ancak bu yöntemler hedef alanda belirli bir dereceye kadar etiketli veri gerektirir ve etiketlenmiş veriler kıt olduğunda manuel olarak etiketlenmiş verileri elde etmenin maliyeti çok yüksektir. Büyük. Şu anda, hedef alanın öğrenme etkisinin iyileştirilmesine yardımcı olmak için transfer öğrenmeye ihtiyaç vardır.
Durağan olmayan genelleme hata paylaşımı
Klasik istatistiksel öğrenme teorisi, bağımsız ve özdeş dağılım koşulu altında modelin genelleme hatasının üst sınırını sağlar. Durağan olmayan bir ortamda (farklı veri alanları bağımsız ve özdeş dağıtım varsayımına uymaz), geleneksel makine öğrenimi teorisi artık geçerli değildir, bu da heterojen veri analizi ve madenciliğe teorik riskler getirir. Geniş anlamda, transfer öğrenimi, durağan olmayan ortamlarda geleneksel makine öğreniminin teşviki olarak görülebilir. Bu nedenle, durağan olmayan bir ortamda, transfer öğrenimi, klasik makine öğrenimine önemli bir teorik tamamlayıcıdır.
5.2 Transfer öğrenmenin pratik uygulamaları
Robot kolu eğitimi
Modelleri gerçek robotlarda eğitmek çok yavaş ve çok pahalıdır. Çözüm, önce simülasyon öğrenimini gerçekleştirmek ve simülasyon öğreniminden öğrenilen bilgileri, kaynak etki alanı ile hedef etki alanı arasındaki özellik alanının aynı olduğu gerçek dünya robot eğitimine aktarmaktır. Son yıllarda bu alanda yapılan araştırmalar birçok kişinin ilgisini çekmiştir. Aşağıdaki resim Google DeepMind'in çalışmasıdır: Resmin solunda robotik kolun hareketini simüle edilmiş bir ortamda eğitmektir.Eğitim tamamlandıktan sonra bilgi gerçek dünyadaki robotik kola aktarılabilir.Gerçek robotik kol küçük bir eğitimle çok iyi olabilir. Etki, aşağıda gösterildiği gibi sağda gösterilmektedir.
Videoyu izleyin: https://www.youtube.com/watch?v=YZz5Io_ipi8
Kamuoyu analizi
Transfer öğrenimi, kamuoyu analizinde kullanıcı değerlendirmesine de uygulanabilir. Örnek olarak elektronik ürünler ve video oyunu ürünleriyle ilgili kullanıcı yorumlarını alın. Şekilde, yeşil iyi bir inceleme etiketi ve kırmızı, kötü bir inceleme etiketidir. Resmin solundaki elektronik ürün değerlendirmesinden (kaynak alan) özellikleri çıkarın, elektronik ürün değerlendirme alanında bir model oluşturun ve ardından bunu geniş ölçekli bir kamuoyu geçişi elde etmek için sağdaki video oyun alanına (hedef alan) ve yeni Alanlar etiket gerektirmez.
Önerilen sistem
Transfer öğrenmesi tavsiye sistemlerinde de kullanılabilir.Belirli bir alanda bir tavsiye sistemi oluşturun ve ardından onu seyrek, yeni dikey alanlara uygulayın. Örneğin, olgun bir film öneri sistemi, soğuk bir başlangıçta bir kitap öneri sistemine uygulanabilir.
Kişiselleştirilmiş görüşme
Önce genel amaçlı bir diyalog sistemini eğitin ve ardından belirli bir alandaki küçük verilere göre değiştirin, böylece diyalog sistemi o belirli alandaki görevlere uyum sağlayabilir. Örneğin, bir kullanıcı kahve satın almak isterse, büyük bir fincan ve küçük bir fincan, sıcak ve soğuk istemek gibi tüm sıkıcı soruları yanıtlamak istemiyor mu?
Veri üretken aktarım öğrenme-GAN
Generative Adversarial Network (GAN), yeni bir makine öğrenimi fikridir. GAN modelindeki iki oyuncu, sırasıyla üretici model ve ayırt edici model olarak hareket eder. Üretken model G, örnek verilerin dağılımını yakalar ve gerçek eğitim verilerine benzer bir örnek oluşturmak için belirli bir dağılıma (tekdüze dağılım, Gauss dağılımı, vb.) Uyan gürültü z'yi kullanır. Sınıflandırıcı, bir örneğin eğitim verilerinden gelme olasılığını tahmin eder (üretilen verilerden ziyade) Örnek gerçek eğitim verilerinden geliyorsa, D yüksek bir olasılık verir, aksi takdirde D küçük bir olasılık verir. GAN optimizasyonu bir minimax oyun problemidir.Nihai amaç, jeneratör çıktısı ayırıcıya gönderildiğinde, bunun gerçek mi yoksa sahte mi olduğuna karar vermenin zor olmasıdır.
Belirli bir veri kümesi üzerinde eğitilmiş iyi bir üretken modelimiz varsa, önceki veri kümesinden önemli ölçüde farklı bazı yeni veriler varsa, değiştirmek için "GAN + sınır koşullarını" kullanabiliriz. Üretken model, yeni veri dağıtımına taşınır. Örneğin, yazdığımızda herkesin imzası farklıdır. İmzalamak için yazdırmayı kullanmayız çünkü her birimizin kendi yazma özelliklerine sahibiz. Daha sonra, iyi bir genel model eğitmek için ilk bölüm için eğitim örnekleri olarak çok sayıda basılı karakter kullanırsanız ve eğitim örneklerinin ikinci bölümü olarak bir kişinin el yazısıyla yazılmış italiklerini kullanırsanız, basılı modeli dönüştürmek için Wasserstein GAN'ı kullanabilirsiniz. Kişisel imzaya geçin. Başka bir deyişle, böyle bir imza daha kişiselleştirilmiştir.
6. Transfer öğrenimi ile ilgili yarışmalar
(
(
7. Transfer öğrenimi konusunda temsili araştırma akademisyenleri
Transfer öğrenimi üzerine araştırma, temsili araştırma akademisyenlerinin transfer öğrenimi konusundaki başarılarını izleyerek başlayabilir. Yurtiçi ve yurtdışında göç öğrenimi temsilcileri şunları içerir:
Hong Kong Bilim ve Teknoloji Üniversitesi'nden Profesör Yang Qiang
Dördüncü Normal Formun CEO'su (https://scholar.google.com.sg/citations?user=AGR9pP0AAAAJhl=zh-CN)
Nanyang Teknoloji Üniversitesi Yardımcı Doçenti (
Doçent, Bilgisayar Teknolojisi Enstitüsü, Çin Bilimler Akademisi (
8. Migration Learning Toolkit
( Wenyuan Dai, Qiang Yang, ve diğerleri, C dili
( Eric Eaton ve Marie desJardins, Java
( Jiang Jiang, C ++
( Fuzhen Zhuang, Ping Luo, ve diğerleri, Matlab
( Yin Zhu, Yuqiang Chen, ve diğerleri, Matlab
(https://github.com/viggin/domain-adaptation-toolbox), Ke Yan, Matlab
9. Referanslar
2017 Hong Kong Bilim ve Teknoloji Üniversitesi Yang Qiang Makinenin Kalbi GMIS Zirvesi Konuşması
2016 Hong Kong Bilim ve Teknoloji Üniversitesi Yang Qiang KDD Çin Teknoloji Zirvesi konuşması
Sinno Jialin Pan ve Qiang Yang, Transfer öğrenimi üzerine bir anket
Karl Weiss, Taghi M. Khoshgoftaar ve DingDing Wang, Bir transfer öğrenimi araştırması
Long Mingsheng, Transfer Öğrenme Problemleri ve Yöntemleri Üzerine Araştırma
Not: Yukarıdaki resimlerden bazıları yukarıdaki referans malzemelerden alınmıştır.