Birleşik öğrenmedeki en son araştırma trendleri

2019'daki federal yangın araştırmasındaki son araştırma ilerlemesine ne dersiniz?

Metin | Jiang Baoshang

Editör | Jia Wei

Federe öğrenme, kuşkusuz son zamanlarda AI endüstrisindeki en popüler teknik paradigmalardan biridir.Geçtiğimiz 2019'da, çok sayıda federal öğrenmeyle ilgili araştırma ortaya çıktı. Federe öğrenme, kullanıcıların farklı konumlarda dağıtılan çoklu veri kümelerini kullanarak makine öğrenimi modellerini eğitmesine olanak tanırken, veri sızıntısını önleyen ve katı veri gizliliği düzenlemelerine uyan bir makine öğrenimi çerçevesidir.

Veri sızmasını önleyebilir! Bu ayrıca, federe öğrenmenin veri hassasiyetini çözmenin önemli bir yolu olabileceği anlamına gelir. Yakın zamanda, Avustralya Ulusal Üniversitesi, Carnegie Mellon Üniversitesi, Cornell Üniversitesi, Google, Hong Kong Bilim ve Teknoloji Üniversitesi ve diğer kurumlardan akademisyenler ortaklaşa, alanın karşı karşıya olduğu açık sorunları ve zorlukları detaylandıran bir makale yayınladılar. Ve birçok değerli araştırma yönünü listeledi.

(Leifeng.com) Kağıt indirme adresi: https://arxiv.org/pdf/1912.04977.pdf

Bu gözden geçirme belgesi, girişte tanıtılan, cihazlar arası ayarlar dışındaki diğer birleşik öğrenme ayarlarını ve sorunları ve birleşik öğrenmenin verimliliğini ve etkinliğini nasıl geliştirebileceğini tanıtan 7 bölümden oluşmaktadır. Ayrıca kullanıcı verilerini, gizliliği ve modeli tartışır. Manipülasyon ve başarısızlık faktörleri gibi önemli sorunlar.

Giriş

Birleşik öğrenme, birden çok istemcinin (mobil cihazlar veya kuruluşun tamamı gibi), modelleri merkezi bir sunucu (bir hizmet sağlayıcı gibi) altında işbirliği içinde eğittiği bir makine öğrenimi ayarını ifade eder. Bu ayar aynı zamanda eğitim verilerinin merkezden uzaklaştırılmasını da sağlar.

Birleşik öğrenme, geleneksel merkezi makine öğrenimi yöntemlerinin neden olduğu bazı sistemik gizlilik risklerini ve maliyetleri azaltmak için kısmi veri toplama ve en aza indirme ilkesini kullanır. Federe öğrenme terimi ilk olarak 2016 yılında McMahan ve arkadaşları tarafından önerildi, ancak bu terim doğmadan önce, 1980'lerde ortaya çıkan bilgi işlem şifreleme verileri gibi veri gizliliğinin korunmasına adanmış birçok ilgili araştırma çalışması yapılmıştı. Şifreleme yöntemi. Birleşik öğrenme başlangıçta yalnızca mobil ve uç cihaz uygulamalarını vurguladı. Araştırmacılar bu iki ayarı sırasıyla cihazlar arası ve silolar arası olarak adlandırdı.

Bu iki değişkeni temel alan bu makale, birleşik öğrenmenin daha geniş bir tanımını verir: federe öğrenme, makine öğrenimi sorunlarını çözmek için birden fazla varlığın (istemcinin) birlikte çalıştığı bir makine öğrenimi ayarıdır. Merkezi bir sunucu veya hizmet sağlayıcıdadır. Koordinasyonunda

Her istemcinin orijinal verileri yerel olarak depolanır ve değiştirilemez veya taşınamaz. Federe öğrenme, öğrenme hedeflerine ulaşmak için kısmi güncellemeleri (anında toplama için kullanılır) kullanır. Bu tanımın, federe öğrenmeyi tamamen merkezi olmayan öğrenme teknolojisinden tamamen ayırdığını belirtmekte fayda var.

(Lei Feng Ağı)

Cihazlar arası birleşik öğrenme ayarı: Yukarıdaki şekil, birleşik öğrenim eğitiminin ve birleşik öğrenim sistemindeki birden çok katılımcının yaşam döngüsünü göstermektedir. İş akışı özellikle 6 bölümden oluşur: 1. Sorun tanımlama; 2. İstemci ayarı; 3. Model prototip geliştirme; 4. Federasyon modeli eğitimi; 5. Model değerlendirme; 6. Dağıtım.

Eğitim sürecine özel olarak, temel olarak şunları içerir: 1. Müşteri seçimi; 2. Yayın; 3. Müşteri hesaplama; 4. Toplama; 5. Model güncelleme. İstemci seçimi adımı esas olarak gereksinimleri karşılayan istemcilerden örnek almaktır; yayın adımı esas olarak geçerli model ağırlığını ve eğitim programını seçili istemciden sunucudan indirir ve istemci hesaplama, toplama ve model güncelleme aşamalarının ayrılması birleşik öğrenme değildir. Katı gereksinimler, ancak eşzamansız SGD gibi belirli algoritma kategorilerini hariç tutmaktadır.

Cihazlar arası ayarlar dışındaki diğer federe öğrenme ayarları ve sorunları

Federe öğrenme eğitiminde, sunucu merkezi bir rol oynamaktadır.İstemci sayısı çok fazla olduğunda, sunucu bir eğitim darboğazı haline gelebilir. Tam ademi merkezileştirmenin ana fikri, sunucu merkezli iletişim modelini noktadan noktaya bir yaklaşımla değiştirmektir.

Tamamen merkezi olmayan bir algoritmada, istemci bir düğüm görevi görür ve istemciler arasındaki iletişim kanalı bir kenar görevi görür.Kenarlar ve noktalar arasındaki bu ilişki birleşik bir öğrenme ağı oluşturur. Standart federe öğrenmede artık küresel durum olmadığını unutmayın.Süreç, tüm yerel modellerin istenen küresel çözüme yakınlaşması için tasarlanabilir.Başka bir deyişle, her model kademeli olarak bir fikir birliğine varır.

Tamamen dağıtılmış olmasına rağmen, öğrenme görevlerinin tahsis edilmesinden sorumlu olacak bir merkez vardır.Bu öğrenme görevleri şunları içerir: algoritma seçimi, hiperparametre seçimi, hata ayıklama vb. Bu merkezin seçimine güvenilmesi gerekir, bu, öğrenme görevini öneren müşteri tarafından yapılabilir veya oy birliği ile karar verilebilir.

(Lei Feng Ağı)

Birleşik öğrenme ve dağıtılmış öğrenmenin karşılaştırılması Ancak, makine öğreniminin merkezi olmayan çözümü hala çok sayıda algoritmik problemle karşı karşıyadır.Bazı problemler, ortak öğrenme için merkezi bir sunucu kullanmanın özel durumuna benzer ve diğer problemler tam dağıtımın yan etkilerinden kaynaklanmaktadır. . Algoritmalar açısından ana zorluklar, ağ topolojisi ve eşzamansızlığın dağıtılmış SGD üzerindeki etkisi, yerel olarak güncellenmiş dağıtılmış SGD, kişiselleştirme ve güven mekanizmaları, gradyan sıkıştırma ve niceleme yöntemleridir.

Silolar Arası Birleşik Öğrenme: Cihazlar arası ortak öğrenmenin özelliklerinin aksine, Silolar Arası Birleşik Öğrenme, genel tasarımın bazı yönlerinde çok esnektir. Birçok kuruluş sadece eğitim modellerini paylaşmak istiyor ancak verileri paylaşmak istemiyorsa, silolar arası ayar çok iyi bir seçimdir.

Cross-Silo federe öğreniminin ayarları temel olarak şu noktalara sahiptir: veri bölümleme, teşvik mekanizması, farklı gizlilik ve tensör faktörleştirme.

(Leifeng.com) İki ayrı öğrenme ayarı

Bölünmüş Öğrenim: Bölünmüş öğrenmenin temel fikri, istemci ve sunucu arasındaki her katmana dayalı bir bölümleme modeli yürütmek ve bunu eğitim ve çıkarıma uygulamaktır. Bölünmüş öğrenmenin en basit yapılandırması, her müşterinin hesaplamasının derin ağ üzerinden iletilmesi ve ardından kesme katmanının çıktısının, yani parçalanan verilerin başka bir sunucuya veya istemciye gönderilmesi ve ardından sunucu veya istemcinin kalan hesaplamaları tamamlamasıdır. Bu, paylaşılmayan verilerin ileriye doğru yayılması anlamına gelir; son olarak, gradyan, son katmanından kesme katmanına benzer şekilde geri yayılabilir. Bu işlemin yakınsamaya kadar devam edeceğini unutmayın.

Verimlilik nasıl artırılır

Makalenin bu kısmı, çeşitli teknolojileri araştıran açık bir bölümdür. Tartışılan sorular daha iyi optimizasyon algoritmaları geliştirmeyi içeriyor mu? Farklı müşteriler için farklılaştırılmış modeller nasıl sağlanır? Birleşik öğrenme bağlamında makine öğrenimi görevleri nasıl gerçekleştirilir? Yukarıdaki problemleri çözmenin birçok zorluğu vardır: Bunlardan biri IID olmayan (bağımsız ve aynı dağıtım gereksinimlerini karşılamayan) verilerin varlığıdır. Bu sorunun üç ana nedeni vardır: 1. Farklı müşteri dağılımı; 2. Bağımsızlık varsayımının ihlali; 3. Veri kümesi geçişi.

IID dışı verilerle nasıl başa çıkılır? En genel yöntem, mevcut algoritmayı değiştirmektir. Bazı uygulamalar için, verileri genişletmeyi seçebilir veya verileri istemciler arasında daha benzer hale getirmek için bazı yöntemler kullanabilirsiniz. Örneğin, küresel olarak paylaşılabilecek küçük bir veri kümesi oluşturun.

Verimliliği artırmanın bir başka yolu, birleşik öğrenme için algoritmaları optimize etmektir. Bazı tipik birleşik öğrenme görevlerinde, optimizasyon hedefi "belirli işlevleri" en aza indirmektir. Ortak optimizasyon algoritması ile standart dağıtılmış eğitim yöntemi arasındaki temel fark, IID olmayan verileri ve dengesiz verileri çözme ihtiyacı duymasıdır. Ek olarak, federe öğrenme algoritmasının bir diğer önemli pratik düşüncesi, durum bilgisi olan optimizasyon algoritmalarını (ADMM gibi) ve durum bilgisi olan sıkıştırma stratejilerini gerçek koşullara göre ayarlamak gibi diğer teknolojilerle birleştirilebilirliğidir.

Çok görevli öğrenme, kişiselleştirme ve meta-öğrenme, IID olmayan veriler karşısında çok etkilidir ve performansı en iyi paylaşılan küresel modeli bile aşabilir. Ek olarak, kişiselleştirme, karakterizasyon yoluyla elde edilir Bu tür girdiler, paylaşılan küresel modelin oldukça kişiselleştirilmiş tahminler üretmesine izin verebilir. Eğitim etkisini daha verimli hale getirmek için makine öğrenimi iş akışı ayarlanabilir.

Standart makine öğrenimi iş akışındaki veri geliştirme, özellik mühendisliği, sinir mimarisi tasarımı, model seçimi, hiperparametre optimizasyonu vb. Nedeniyle, dağınık veri kümelerine ve kaynak kısıtlı mobil cihazlara dağıtılırken birçok sorun ortaya çıkacaktır.

Kullanıcı verilerinin gizliliğini koruyun

Çeşitli tehdit modeli makine öğrenimi iş akışları, çeşitli katılımcıları içerir. Kullanıcı için, cihazla etkileşim kurarak eğitim verileri oluşturabilir. Makine öğrenimi mühendisleri için katılmanın yolu, modelin kalitesini eğitmek ve değerlendirmektir. İdeal bir durumda, sistemdeki her katılımcı, bilgilerinin sızdırılıp sızdırılmadığını kolayca çıkarabilir ve tüm katılımcılar, harekete geçip geçmeyeceğini belirlemek için bu çıkarımları kullanabilir.

Bu bölümde, çalışma mevcut sonuçlara genel bir bakış sunmakta ve sıkı gizlilik koruması sağlamak için nasıl tasarım yapılacağının yanı sıra ortak öğrenme sisteminin karşılaştığı zorlukları tanıtmaktadır. Elbette, kullanıcı gizliliğine yönelik saldırılara ek olarak, ortak öğrenmeye yönelik başka türden saldırılar da vardır; örneğin, rakip model eğitimini tamamen engellemeye çalışabilir veya modeli önyargılı yapmaya çalışabilir. Makalede ayrıca koruma sağlayabilecek çeşitli tehdit modelleri tartışılmakta ve ardından bazı temel araçlar ve teknolojiler listelenmektedir. Ayrıca, güvenilir sunucular hakkında varsayımlar yaptık ve düşman istemcilerin ve analistlerin korunmasındaki açık sorunları ve zorlukları tartıştık.

Saldırıya ve başarısızlığa karşı sağlamlık

Modern makine öğrenimi sistemleri sorunlara eğilimlidir. Bu sorunlar, ön işleme ardışık düzenindeki hatalar, gürültülü eğitim etiketleri, güvenilmez istemciler ve eğitim ve dağıtıma yönelik açık saldırılar gibi kötü niyetli olmayabilir. Bu bölümde makale, yeni başarısızlık modları ve saldırı yüzeyleri açan birleşik öğrenmenin dağıtılmış özelliklerini, mimari tasarımını ve veri kısıtlamalarını tanıtmaktadır.

Ek olarak, federe öğrenmede mahremiyeti korumaya yönelik güvenlik mekanizmalarının tespit ve düzeltmeyi çok zor hale getirebileceğini belirtmek gerekir. Makalede ayrıca farklı saldırı türleri ve başarısızlıklar arasındaki ilişki ve bu ilişkilerin federe öğrenmedeki önemi tartışıldı. Model performansına yönelik çekişmeli saldırılar: Saldırgan yalnızca modelin performansına saldırmakla kalmaz, eğitime katılan kullanıcıların özel verilerini de çıkarabilir. Veri zehirlenmesi, model güncelleme zehirlenmesi ve model kaçınma saldırıları dahil olmak üzere pek çok düşman saldırı örneği vardır.

Kötü Amaçlı Olmayan Hata Modları (Kötü Amaçlı Olmayan Hata Modları): Geleneksel veri merkezi modunun eğitimiyle karşılaştırıldığında, federe öğrenme, istemcinin kötü niyetli olmayan başarısızlıklarına karşı özellikle savunmasızdır. Düşmanca saldırılar gibi, sistem faktörleri ve veri kısıtlamaları da yol açabilir Kötü niyetli olmayan hata. Kötü niyetli olmayan hatalar genellikle kötü niyetli saldırılardan daha az yıkıcıdır, ancak daha sık meydana gelir, ancak genellikle kötü niyetli saldırılarla aynı kök ve karmaşıklığı paylaşırlar. Bu nedenle, kötü niyetli olmayan hatalarla başa çıkma yöntemi kötü niyetli saldırılarla başa çıkmak için de kullanılabilir.

Gizlilik ve sağlamlık arasındaki gerilimi keşfetmek: Güvenlik birleştirme teknolojisi genellikle gizlilik korumasını güçlendirmek için kullanılır, ancak genellikle düşman saldırılara karşı savunmayı zorlaştırır, çünkü merkezi sunucu yalnızca bir dizi istemci güncellemesi görür. Bu nedenle, araştırma güvenliği kullanır. Birleştirme sırasında düşman saldırılarına karşı nasıl savunma yapılacağı çok önemlidir.

Genel olarak, önce rakip saldırıları tanıtır, ardından kötü niyetli olmayan başarısızlık modlarını tartışır ve son olarak gizlilik ile sağlamlık arasındaki gerilimi tartışır.

Adalet ve önyargının ortadan kaldırılması

Makine öğrenimi modellerinin performansı genellikle şaşırtıcıdır. Bu davranış modelleri kullanıcılar için çok düşmanca olduğunda, araştırmacılar onları haksız olarak sınıflandıracaklar. Örneğin, benzer özelliklere sahip kişiler tamamen farklı sonuçlar alırsa, bu bireysel adalet standardını ihlal eder. Belirli hassas gruplar (ırk, cinsiyet vb.) Farklı sonuçlar alırsa, bu çeşitli demografik adalet standartlarını ihlal edebilir ...

Federe öğrenme, adalet araştırması için, bazıları federal olmayan ortamlarda önceki araştırma yönlerini genişleten, diğerleri ise federe öğrenmeye özgü olan çeşitli hususlar sağlar. Eğitim verilerinde önyargı: Makine öğrenimi modellerindeki adaletsizliğin itici güçlerinden biri, bilişsel örnekleme, raporlama ve onay önyargısı dahil olmak üzere eğitim verilerindeki önyargıdır.

Yaygın bir fenomen, bireysel özellik verilerinin genel veri setinde yetersiz temsil edilmesidir, bu nedenle model eğitiminden sonra elde edilen ağırlıklar sorunu temsil etmez. Ortak öğrenmede kullanılan veri erişim süreci gibi, veri seti kayması ve bağımsızlığı da getirebilir.

Hassas niteliklere erişim olmadan adalet: Irk, cinsiyet vb. Gibi demografik bilgilere açık erişim, adalet standartlarıyla ilgili tartışmaları tetikleyecektir. Bireysel hassas nitelikler mevcut olmadığında, federal öğrenmenin sıklıkla uygulandığı ortam, adaletle ilgili tartışmalara da neden olacaktır. Kişiselleştirilmiş dil modelleri ve uygun tıbbi sınıflandırıcılar geliştirin. Bu nedenle, adaletsizliği ölçmek ve düzeltmek, ortak öğrenme araştırmacılarının çözmesi gereken önemli bir sorundur.

Adillik, mahremiyet ve sağlamlık: Adalet ve veri gizliliği tamamlayıcı etik kavramlar gibi görünmektedir. Mahremiyet korumasının gerekli olduğu birçok gerçek ortamda adalet de çok gereklidir. Ortak öğrenmenin hem mahremiyet hem de adalet gerektiren hassas bir veri ortamında uygulanması büyük olasılıkla olduğundan, adalet ve mahremiyet sorunlarını çözmek çok önemlidir.

Model çeşitliliğini geliştirmek için federasyonu kullanın: Ortak öğrenme ile sağlanan dağıtılmış eğitim, önceden gerçekçi olmayan ve hatta yasadışı verilerin makul şekilde kullanılmasını sağlayabilir. Bazı güncel veri gizliliği koruma yasaları, şirketleri veri silolarında model olmaya zorlamıştır. Ek olarak, eğitim verilerinde temsil edilebilirlik ve çeşitlilik eksikliği, model performansında bir düşüşe yol açacaktır.Federasyonlu öğrenme, bu modellerin adilliğini iyileştirmek için hassas niteliklerle ilgili olabilecek verileri birleştirebilir ve böylece modelin performansını iyileştirebilir.

sonuç olarak

Birleşik öğrenme, dağıtılmış istemci cihazlarının, tüm eğitim verilerini cihazda depolarken, böylece makine öğreniminin yeteneklerini bulutta veri depolama ihtiyacından ayırırken, ortaklaşa öğrenip tahmine dayalı modelleri paylaşmasına olanak tanır.

Son yıllarda, federal öğrenme konusu hem endüstride hem de akademide patlayıcı bir büyüme yaşadı. Federal öğrenme, diğer disiplinlerdeki etkisini kademeli olarak genişletti: makine öğreniminden optimizasyona, bilgi teorisi ve istatistikten kriptografiye, adalet ve mahremiyete. Veri gizliliği ikili değildir, farklı varsayımlar altındaki tehdit modelleri, her modelin kendine özgü zorlukları vardır.

Makalede tartışılan açık konular kapsamlı değildir ve yazarın ilgisini ve geçmişini yansıtır. Bu makale, makine öğrenimi projelerinde çözülmesi gereken öğrenim dışı problemleri tartışmamaktadır.Sonuçta, bu problemlerin dağınık verilere dayanarak çözülmesi gerekebilir. Örneğin, temel tanımlayıcı istatistikleri hesaplamak, açık küme üzerindeki histogramın başını hesaplamak. Tartışılmayan bir diğer önemli konu, federal öğrenmenin kullanımına ilham verebilecek veya onu sınırlayabilecek yasal ve ticari konulardır.

COVID-19 ve influenzayı ayırt etmek için derin öğrenme nasıl kullanılır? İlk taramadan kritik hastalık tahminine kadar beş çalışma
önceki
Today Paper | Belirsizlik ölçümü; kenar algılama derinlik tahmini; binoküler derinlik tahmini; uyarlanabilir derinlik stereo eşleştirme, vb.
Sonraki
Sinir ağı yapısı arama serisi (1): Makineye otonom tasarım modeli "yeteneği" verir, yapı aramanın kökeni hakkında bir makale özeti
Canlı yayın | Luo Yonghao'nun mallarla birlikte ikinci canlı yayını, Hubei için portakal satışı
Douyin, Kuaishou, Taobao ve Tencent Live'ın trafik mantığı nedir? Süper Görüntü
Jinan, sahte KDV faturası düzenleyen üç özel girişim personelini "muaf tuttu"
Mou Zhongzhong'un "efsanevi en zengin adam" mahkumu ve Hubei'nin eski en zengin adamı, üç kez hapishanede kaldı ve şimdi tekrar aranıyor.
Tüm alıcılar "kamu paylaşımını iptal etmek" istiyor, uzmanlar şunları söylüyor: iptal etmemelisiniz, acı çekenler sizsiniz
322 gün sonra Huang Guangyu hapisten çıktı! "Gizlice" 3 büyük "düzen" ve karısı bir keresinde öyle demişti
Yoğun bir bahar günü
Sanya, Hainan: Bilimsel araştırma sağlamak için birden fazla önlem alın
Geçmiş 13,7 milyar yıl öncesine göz atmak mı? NASA James Webb Uzay Teleskobu bekleniyor
Yıldız canlı yayınının ilk aşaması, yüksek kaliteli projelere ve verimli sermaye bağlantılarına öncülük ederek güçlü bir şekilde başlatıldı.
Illinois Valisi, Chicago'nun Çin Mahallesi'nde zencefilli şeker satın aldı: Virüs özellikle belirli bir ırka işaret etmiyor
To Top