Birleşik öğrenmedeki en son araştırma trendleri

2019'daki federal yangın araştırmasındaki son araştırma ilerlemesine ne dersiniz?

Metin | Jiang Baoshang

Editör | Jia Wei

Federe öğrenme, kuşkusuz son zamanlarda AI endüstrisindeki en popüler teknik paradigmalardan biridir.Geçtiğimiz 2019'da, çok sayıda federal öğrenmeyle ilgili araştırma ortaya çıktı.

Federe öğrenme, kullanıcıların farklı konumlarda dağıtılan çoklu veri kümelerini kullanarak makine öğrenimi modellerini eğitmesine olanak tanırken, veri sızıntısını önleyen ve katı veri gizliliği düzenlemelerine uyan bir makine öğrenimi çerçevesidir.

Veri sızmasını önleyebilir! Bu ayrıca, federe öğrenmenin veri hassasiyetini çözmenin önemli bir yolu olabileceği anlamına gelir.

Yakın zamanda, Avustralya Ulusal Üniversitesi, Carnegie Mellon Üniversitesi, Cornell Üniversitesi, Google, Hong Kong Bilim ve Teknoloji Üniversitesi ve diğer kurumlardan akademisyenler ortaklaşa, alanın karşı karşıya olduğu açık sorunları ve zorlukları detaylandıran bir makale yayınladılar. Ve birçok değerli araştırma yönünü listeledi.

Kağıt indirme adresi:

https://arxiv.org/pdf/1912.04977.pdf

Bu gözden geçirme belgesi, girişte tanıtılan, cihazlar arası ayarlar dışındaki diğer birleşik öğrenme ayarlarını ve sorunları ve birleşik öğrenmenin verimliliğini ve etkinliğini nasıl geliştirebileceğini tanıtan 7 bölümden oluşmaktadır. Ayrıca kullanıcı verilerini, gizliliği ve modeli tartışır. Manipülasyon ve başarısızlık faktörleri gibi önemli sorunlar.

1. Giriş

Birleşik öğrenme, birden çok istemcinin (mobil cihazlar veya kuruluşun tamamı gibi), modelleri merkezi bir sunucu (bir hizmet sağlayıcı gibi) altında işbirliği içinde eğittiği bir makine öğrenimi ayarını ifade eder. Bu ayar aynı zamanda eğitim verilerinin merkezden uzaklaştırılmasını da sağlar. Birleşik öğrenme, geleneksel merkezi makine öğrenimi yöntemlerinin neden olduğu bazı sistemik gizlilik risklerini ve maliyetleri azaltmak için kısmi veri toplama ve en aza indirme ilkesini kullanır.

Federe öğrenme terimi ilk olarak 2016 yılında McMahan ve arkadaşları tarafından önerildi, ancak bu terim doğmadan önce, 1980'lerde ortaya çıkan bilgi işlem şifreleme verileri gibi veri gizliliğinin korunmasına adanmış birçok ilgili araştırma çalışması yapılmıştı. Şifreleme yöntemi.

Birleşik öğrenme başlangıçta yalnızca mobil ve uç cihaz uygulamalarını vurguladı. Araştırmacılar bu iki ayarı sırasıyla cihazlar arası ve silolar arası olarak adlandırdı. Bu iki çeşidi temel alan bu makale, federe öğrenmenin daha geniş bir tanımını vermektedir:

Federe öğrenme, makine öğrenimi sorunlarını çözmek için birden fazla varlığın (istemcilerin) birlikte çalıştığı bir makine öğrenimi ortamıdır ve merkezi bir sunucu veya hizmet sağlayıcısının koordinasyonu altında gerçekleştirilir. Her istemcinin orijinal verileri yerel olarak depolanır ve değiştirilemez veya taşınamaz. Federe öğrenme, öğrenme hedeflerine ulaşmak için kısmi güncellemeleri (anında toplama için kullanılır) kullanır.

Bu tanımın, federe öğrenmeyi tamamen merkezi olmayan öğrenme teknolojisinden tamamen ayırdığını belirtmekte fayda var.

Cihazlar arası birleşik öğrenme ayarları: Yukarıdaki şekil, birleşik öğrenim eğitiminin ve birleşik öğrenim sistemindeki birden çok katılımcının yaşam döngüsünü göstermektedir. İş akışı özellikle 6 bölümden oluşur: 1. Sorun tanımlama; 2. İstemci ayarı; 3. Model prototip geliştirme; 4. Federasyon modeli eğitimi; 5. Model değerlendirme; 6. Dağıtım,

Eğitim sürecine özel olarak, temel olarak şunları içerir: 1. Müşteri seçimi; 2. Yayın; 3. Müşteri hesaplama; 4. Toplama; 5. Model güncelleme. İstemci seçimi adımı esas olarak gereksinimleri karşılayan istemcilerden örnek almaktır; yayın adımı esas olarak geçerli model ağırlığını ve eğitim programını seçili istemciden sunucudan indirir ve istemci hesaplama, toplama ve model güncelleme aşamalarının ayrılması birleşik öğrenme değildir. Katı gereksinimler, ancak eşzamansız SGD gibi belirli algoritma kategorilerini hariç tutmaktadır.

2. Cihazlar arası ayarlar dışındaki diğer federal öğrenim ayarları ve sorunları

Federe öğrenme eğitiminde, sunucu merkezi bir rol oynamaktadır.İstemci sayısı çok fazla olduğunda, sunucu bir eğitim darboğazı haline gelebilir. Tam ademi merkezileştirmenin ana fikri, sunucu merkezli iletişim modelini noktadan noktaya bir yaklaşımla değiştirmektir.

Tamamen merkezi olmayan bir algoritmada, istemci bir düğüm görevi görür ve istemciler arasındaki iletişim kanalı bir kenar görevi görür.Kenarlar ve noktalar arasındaki bu ilişki birleşik bir öğrenme ağı oluşturur. Standart federe öğrenmede artık küresel durum olmadığını unutmayın.Süreç, tüm yerel modellerin istenen küresel çözüme yakınlaşması için tasarlanabilir.Başka bir deyişle, her model kademeli olarak bir fikir birliğine varır.

Tamamen dağıtılmış olmasına rağmen, öğrenme görevlerinin tahsis edilmesinden sorumlu olacak bir merkez vardır.Bu öğrenme görevleri şunları içerir: algoritma seçimi, hiperparametre seçimi, hata ayıklama vb. Bu merkezin seçimine güvenilmesi gerekir, bu, öğrenme görevini öneren müşteri tarafından yapılabilir veya oy birliği ile karar verilebilir.

Birleşik öğrenme ve dağıtılmış öğrenmenin karşılaştırılması

Bununla birlikte, makine öğreniminin merkezi olmayan çözümü hala çok sayıda algoritmik problemle karşı karşıyadır.Bazı problemler, ortak öğrenme için merkezi bir sunucunun kullanılmasının özel durumuna benzer ve diğer problemler, tam dağıtımın yan etkilerinden kaynaklanmaktadır.

Algoritmalar açısından ana zorluklar, ağ topolojisi ve eşzamansızlığın dağıtılmış SGD üzerindeki etkisi, yerel olarak güncellenmiş dağıtılmış SGD, kişiselleştirme ve güven mekanizmaları, gradyan sıkıştırma ve niceleme yöntemleridir.

Silolar Arası Federal Çalışma: Cihazlar arası ortak öğrenmenin özelliklerinin aksine, Cross-Silo birleşik öğrenme, genel tasarımın bazı yönlerinde çok esnektir. Birçok kuruluş sadece eğitim modellerini paylaşmak istiyor ancak verileri paylaşmak istemiyorsa, silolar arası ayar çok iyi bir seçimdir. Cross-Silo federe öğreniminin ayarları temel olarak şu noktalara sahiptir: veri bölümleme, teşvik mekanizması, farklı gizlilik ve tensör faktörleştirme.

İki ayrı öğrenme ayarı

Bölünmüş Öğrenme: Segmentasyon öğrenmenin temel fikri, istemci ve sunucu arasındaki her katmana dayalı bir segmentasyon modeli yürütmek ve bunu eğitim ve çıkarıma uygulamaktır. Bölünmüş öğrenmenin en basit yapılandırması, her müşterinin hesaplamasının derin ağ üzerinden iletilmesi ve ardından kesme katmanının çıktısının, yani parçalanan verilerin başka bir sunucuya veya istemciye gönderilmesi ve ardından sunucu veya istemcinin kalan hesaplamaları tamamlamasıdır. Bu, paylaşılmayan verilerin ileriye doğru yayılması anlamına gelir; son olarak, gradyan, son katmanından kesme katmanına benzer şekilde geri yayılabilir. Bu işlemin yakınsamaya kadar devam edeceğini unutmayın.

3. Verimlilik nasıl artırılır

Makalenin bu kısmı, çeşitli teknolojileri araştıran açık bir bölümdür. Tartışılan sorular daha iyi optimizasyon algoritmaları geliştirmeyi içeriyor mu? Farklı müşteriler için farklılaştırılmış modeller nasıl sağlanır? Birleşik öğrenme bağlamında makine öğrenimi görevleri nasıl gerçekleştirilir?

Yukarıdaki problemleri çözmenin birçok zorluğu vardır: Bunlardan biri IID olmayan (bağımsız ve aynı dağıtım gereksinimlerini karşılamayan) verilerin varlığıdır. Bu sorunun üç ana nedeni vardır: 1. Farklı müşteri dağılımı; 2. Bağımsızlık varsayımının ihlali; 3. Veri kümesi geçişi.

IID dışı verilerle nasıl başa çıkılır? En genel yöntem, mevcut algoritmayı değiştirmektir. Bazı uygulamalar için, verileri genişletmeyi seçebilir veya verileri istemciler arasında daha benzer hale getirmek için bazı yöntemler kullanabilirsiniz. Örneğin, küresel olarak paylaşılabilecek küçük bir veri kümesi oluşturun.

Verimliliği artırmanın bir başka yolu, birleşik öğrenme için algoritmaları optimize etmektir. Bazı tipik birleşik öğrenme görevlerinde, optimizasyon hedefi "belirli işlevleri" en aza indirmektir. Ortak optimizasyon algoritması ile standart dağıtılmış eğitim yöntemi arasındaki temel fark, IID olmayan verileri ve dengesiz verileri çözme ihtiyacı duymasıdır. Ek olarak, federe öğrenme algoritmasının bir diğer önemli pratik düşüncesi, durum bilgisi olan optimizasyon algoritmalarını (ADMM gibi) ve durum bilgisi olan sıkıştırma stratejilerini gerçek koşullara göre ayarlamak gibi diğer teknolojilerle birleştirilebilirliğidir.

Çok görevli öğrenme, kişiselleştirme ve meta-öğrenme, IID olmayan veriler karşısında çok etkilidir ve performansı en iyi paylaşılan küresel modeli bile aşabilir. Ek olarak, kişiselleştirme, karakterizasyon yoluyla elde edilir Bu tür girdiler, paylaşılan küresel modelin oldukça kişiselleştirilmiş tahminler üretmesine izin verebilir.

Eğitim etkisini daha verimli hale getirmek için makine öğrenimi iş akışı ayarlanabilir. Standart makine öğrenimi iş akışındaki veri geliştirme, özellik mühendisliği, sinir mimarisi tasarımı, model seçimi, hiperparametre optimizasyonu vb. Nedeniyle, dağınık veri kümelerine ve kaynak kısıtlı mobil cihazlara dağıtılırken birçok sorun ortaya çıkacaktır.

4. Kullanıcı verilerini koruyun nın-nin gizlilik

Çeşitli tehdit modelleri

Makine öğrenimi iş akışı çeşitli katılımcıları içerir. Kullanıcı için, cihazla etkileşim kurarak eğitim verileri oluşturabilir. Makine öğrenimi mühendisleri için katılmanın yolu, modelin kalitesini eğitmek ve değerlendirmektir.

İdeal bir durumda, sistemdeki her katılımcı, bilgilerinin sızdırılıp sızdırılmadığını kolayca çıkarabilir ve tüm katılımcılar, harekete geçip geçmeyeceğini belirlemek için bu çıkarımları kullanabilir.

Bu bölümde, çalışma mevcut sonuçlara genel bir bakış sunmakta ve sıkı gizlilik koruması sağlamak için nasıl tasarım yapılacağının yanı sıra ortak öğrenme sisteminin karşılaştığı zorlukları tanıtmaktadır. Elbette, kullanıcı gizliliğine yönelik saldırılara ek olarak, ortak öğrenmeye yönelik başka türden saldırılar da vardır; örneğin, rakip model eğitimini tamamen engellemeye çalışabilir veya modeli önyargılı yapmaya çalışabilir.

Makalede ayrıca koruma sağlayabilecek çeşitli tehdit modelleri tartışılmakta ve ardından bazı temel araçlar ve teknolojiler listelenmektedir. Ayrıca, güvenilir sunucular hakkında varsayımlar yaptık ve düşman istemcilerin ve analistlerin korunmasındaki açık sorunları ve zorlukları tartıştık.

5. Saldırı ve başarısızlığa karşı dayanıklılık

Modern makine öğrenimi sistemleri sorunlara eğilimlidir. Bu sorunlar, ön işleme ardışık düzenindeki hatalar, gürültülü eğitim etiketleri, güvenilmez istemciler ve eğitim ve dağıtıma yönelik açık saldırılar gibi kötü niyetli olmayabilir. Bu bölümde makale, yeni başarısızlık modları ve saldırı yüzeyleri açan birleşik öğrenmenin dağıtılmış özelliklerini, mimari tasarımını ve veri kısıtlamalarını tanıtmaktadır. Ek olarak, federe öğrenmede mahremiyeti korumaya yönelik güvenlik mekanizmalarının tespit ve düzeltmeyi çok zor hale getirebileceğini belirtmek gerekir.

Makalede ayrıca farklı saldırı türleri ve başarısızlıklar arasındaki ilişki ve bu ilişkilerin federe öğrenmedeki önemi tartışıldı.

Model performansına yönelik çekişmeli saldırılar: Saldırgan yalnızca modelin performansına saldırmakla kalmaz, eğitime katılan kullanıcıların özel verilerini de çıkarabilir. Veri zehirlenmesi, model güncelleme zehirlenmesi ve model kaçınma saldırıları dahil olmak üzere pek çok düşman saldırı örneği vardır.

Kötü Amaçlı Olmayan Hata Modları : Geleneksel veri merkezi modelinin eğitimi ile karşılaştırıldığında, federe öğrenme, istemcinin kötü niyetli olmayan başarısızlıklarına karşı özellikle savunmasızdır.Düşmanca saldırılar gibi, sistem faktörleri ve veri kısıtlamaları da kötü niyetli olmayan hatalara neden olabilir. Kötü niyetli olmayan hatalar genellikle kötü niyetli saldırılardan daha az yıkıcıdır, ancak daha sık meydana gelir, ancak genellikle kötü niyetli saldırılarla aynı kök ve karmaşıklığı paylaşırlar. Bu nedenle, kötü niyetli olmayan hatalarla başa çıkma yöntemi kötü niyetli saldırılarla başa çıkmak için de kullanılabilir.

Gizlilik ve sağlamlık arasındaki gerilimi keşfedin: Güvenlik toplama teknolojisi genellikle gizlilik korumasını güçlendirmek için kullanılır, ancak genellikle düşman saldırılara karşı savunmayı zorlaştırır, çünkü merkezi sunucu yalnızca güncellenmiş istemci koleksiyonunu görür. Bu nedenle, güvenlik toplamayı kullanırken düşmanca saldırılara karşı nasıl savunma yapılacağını incelemek çok önemlidir.

Genel olarak, önce rakip saldırıları tanıtır, ardından kötü niyetli olmayan başarısızlık modlarını tartışır ve son olarak gizlilik ile sağlamlık arasındaki gerilimi tartışır.

6. Adalet sağlayın ve önyargıyı ortadan kaldırın

Makine öğrenimi modellerinin performansı genellikle şaşırtıcıdır. Bu davranış modelleri kullanıcılar için çok düşmanca olduğunda, araştırmacılar onları haksız olarak sınıflandıracaklar. Örneğin, benzer özelliklere sahip kişiler tamamen farklı sonuçlar alırsa, bu bireysel adalet standardını ihlal eder. Belirli hassas gruplar (ırk, cinsiyet vb.) Farklı sonuçlar alırsa, bu çeşitli demografik adalet standartlarını ihlal edebilir ...

Federe öğrenme, adalet araştırması için, bazıları federal olmayan ortamlarda önceki araştırma yönlerini genişleten, diğerleri ise federe öğrenmeye özgü olan çeşitli hususlar sağlar.

Eğitim verilerinde önyargı: Makine öğrenimi modellerindeki adaletsizliğin bir nedeni, bilişsel örnekleme, raporlama ve onaylama önyargısı dahil olmak üzere eğitim verilerindeki önyargıdır. Yaygın bir fenomen, bireysel özellik verilerinin genel veri setinde yetersiz temsil edilmesidir, bu nedenle model eğitiminden sonra elde edilen ağırlıklar sorunu temsil etmez. Ortak öğrenmede kullanılan veri erişim süreci gibi, veri seti kayması ve bağımsızlığı da getirebilir.

Hassas nitelikler edinmeden adil: Irk, cinsiyet vb. Gibi demografik bilgilere açık erişim, adalet standartlarıyla ilgili tartışmaları tetikleyecektir.Bireysel hassas nitelikler mevcut olmadığında, federal öğrenmenin sıklıkla uygulandığı ortam, kişiselleştirilmiş dil modellerinin geliştirilmesi gibi adalet konusundaki tartışmaları da tetikleyecektir. Adil tıbbi sınıflandırıcı. Bu nedenle, adaletsizliği ölçmek ve düzeltmek, ortak öğrenme araştırmacılarının çözmesi gereken önemli bir sorundur.

Adalet, mahremiyet ve istikrar: Adalet ve veri gizliliği, birbirini tamamlayan etik kavramlar gibi görünmektedir. Ayrıca, gizlilik koruması gerektiren birçok gerçek ortamda adalet çok gereklidir. Ortak öğrenmenin hem mahremiyet hem de adalet gerektiren hassas bir veri ortamında uygulanması büyük olasılıkla olduğundan, adalet ve mahremiyet sorunlarını çözmek çok önemlidir.

Model çeşitliliğini artırmak için federasyonu kullanın: Ortak öğrenme ile sağlanan dağıtılmış eğitim, önceden gerçekçi olmayan ve hatta yasadışı verileri makul şekilde kullanabilir. Bazı güncel veri gizliliği koruma yasaları, şirketleri veri silolarında model olmaya zorlamıştır. Ek olarak, eğitim verilerinde temsil edilebilirlik ve çeşitlilik eksikliği, model performansında bir düşüşe yol açacaktır.Federasyonlu öğrenme, bu modellerin adilliğini iyileştirmek için hassas niteliklerle ilgili olabilecek verileri birleştirebilir ve böylece modelin performansını iyileştirebilir.

7. Karar

Birleşik öğrenme, dağıtılmış istemci cihazlarının, tüm eğitim verilerini cihazda depolarken, böylece makine öğreniminin yeteneklerini bulutta veri depolama ihtiyacından ayırırken, ortaklaşa öğrenip tahmine dayalı modelleri paylaşmasına olanak tanır.

Son yıllarda, federal öğrenme konusu hem endüstride hem de akademide patlayıcı bir büyüme yaşadı. Federal öğrenme, diğer disiplinlerdeki etkisini kademeli olarak genişletti: makine öğreniminden optimizasyona, bilgi teorisi ve istatistikten kriptografiye, adalet ve mahremiyete.

Veri gizliliği ikili değildir, farklı varsayımlar altındaki tehdit modelleri, her modelin kendine özgü zorlukları vardır.

Makalede tartışılan açık konular kapsamlı değildir ve yazarın ilgisini ve geçmişini yansıtır. Bu makale, makine öğrenimi projelerinde çözülmesi gereken öğrenim dışı problemleri tartışmamaktadır.Sonuçta, bu problemlerin dağınık verilere dayanarak çözülmesi gerekebilir. Örneğin, temel tanımlayıcı istatistikleri hesaplamak, açık küme üzerindeki histogramın başını hesaplamak. Tartışılmayan bir diğer önemli konu, federal öğrenmenin kullanımına ilham verebilecek veya onu sınırlayabilecek yasal ve ticari konulardır.

COVID-19 ve influenzayı ayırt etmek için derin öğrenme nasıl kullanılır? İlk taramadan kritik hastalık tahminine
önceki
Microsoft AI araştırması koçları değiştirdi, yeni pozisyonlar yarattı ve gazileri Shen Xiangyang'ın yerini almaları için terfi etti.
Sonraki
ICLR2020 | Google'ın en son araştırması: "Bileşik diverjans" nicel modeliyle genelleme yeteneğini sentezleyin
BYD, yeni enerjili araç sübvansiyonlarından 1,3 milyar yuan aldı ve yeni enerji araçlarının geliştirilmesinin önünde uzun bir yol var
Yurtdışı pazarına ilk kez girin, Eğitimin Malezya kurumlarını satın almak için 140 milyon ABD doları harcayacağını umuyoruz.
Virüs ve ev sahibi "birbirini sevip dizginler"
Orta Pleistosen iklim geçiş döneminin ilk aşamasında Nihewan Havzasında taş alet teknolojisi çalışmasında ilerleme kaydedilmiştir.
Betelgeuse patlamadı ve "kıyamet kuyruklu yıldızı" yakın mı?
Aşıklar, netizenlerle tanışmak için "yumuşak kızlar" gibi davranıyor ve "1314 "'ü sorduktan sonra ortadan kayboluyor
Sisin içindeki "Waldorf"
Tıp kurumlarının "yeni altyapısı" için fırsatlar nelerdir? Salgın güçlü bir ilaç getirecek
Kaliforniya yeni kraliyet salgınının etkisinden muzdarip, Silikon Vadisi'nin "savaş salgını" sürüyor
Denizaşırı insanlar acele ediyor Banlangen, Çin tıbbı yerli ürünlerin ışığı mı olacak?
Sunucu Yuansan uyumak için canlı yayından vazgeçti, "Yun Beng Di" ve "Yun Sleep" yanlış ateşi kayboldu
To Top