Veri gizliliği koruması altında yapay zeka büyük verileri nasıl paylaşılabilir? CCF TF "Federal Learning" semineri cevap verdi

Leifeng.com AI Teknolojisi Yorumu: 24 Mart'ta, CCF ev sahipliğinde ve WeBank ve Shenzhen Üniversitesi Weizhong Finansal Teknoloji Araştırma Enstitüsü tarafından ortaklaşa düzenlenen 14. Çin Bilgisayar Topluluğu Teknolojisi Ön Cephe Semineri, Shenzhen Üniversitesi Bilim ve Teknoloji Binası İkinci Konferans Salonu'nda başarıyla gerçekleştirildi. Düzenlenen seminerin teması "Birleşik Makine Öğrenimi: Teknoloji ve Veri Gizliliği Koruması" idi.

Bu seminere WeBank Baş AI Sorumlusu ve Hong Kong Bilim ve Teknoloji Üniversitesi'nden Profesör Yang Qiang ev sahipliği yaptı.Aynı zamanda Profesör Yang Qiang, "Data Island, AI for Good and Federal Migration and Learning" konulu bir açılış konuşması yaptı.

WeBank AI Başkanı, Profesör Yang Qiang, Hong Kong Bilim ve Teknoloji Üniversitesi

Resmi konuşmadan önce, Profesör Yang Qiang alçakgönüllülükle, "federal öğrenme" kavramı için öncülerinin, ilgili bilgileri herkese aktarırken taşları hissederek nehri geçmeye devam ettiklerini vurguladı. Bu nedenle, şimdilik Forumda, tek taraflı olarak öğretmek ve dinlemek yerine herkesin bu yeni kavramı birlikte keşfedeceğini umuyorlar. Ayrıca, üniversite profesörlerini, kurumsal araştırmacıları, yöneticileri ve hukuk uzmanlarını ve hayatın her kesiminden diğer kişileri hedefli diyaloglar ve değişimler için özel olarak davet ettikleri de bu düşünceye dayanmaktadır.

Konuşmanın başında Profesör Yang Qiang, yapay zeka için insanların en çok ilgilendiği güncel konunun toplumla olan ilişkisi olduğunu söyledi. Daha önemli konulardan ikisi Robin Li ve Ma Huateng tarafından iki seans sırasında önerilen "Veri Adası" dır. "Yapay zeka sonsuza kadar" sorusu.

"AI for Good" nedir? Profesör Yang Qiang şunları söyledi: Bu, yapay zekanın geleneksel alanlarda yalnızca birkaç kişinin yararlanabileceği bir araç olarak kullanılmasına atıfta bulunuyor, böylece genel halk, geçmişte VIP'ler tarafından yapay zeka ve kapsayıcı finans, kapsayıcı eğitim gibi özel hizmetlerden de yararlanabiliyor. Kapsayıcı sağlık hizmetleri, akıllı şehirler, felaket kurtarma, AI yoksulluğunun azaltılması, AI + tarım ve yapay zeka girişimlerinin dördüncü paradigması tarafından önerilen "Herkes için AI" sloganı vb. "AI for good" seçeneğinin önerilmesinin nedeni şudur:

  • AI sisteminin önyargısı. Örneğin, erkeklerin film değerlendirme verileri AI sistemine verilirse, elde edilen sonuçlar sadece erkeklerin görüşleridir ve kamuoyuna açıklandıktan sonra tüm toplumun görüşleri ile karıştırılır;

  • Yapay zeka sistemlerinin kontrol için savaşmak için insanlarla işbirliği yapması sorunu. Boeing uçağı örneğinde ise, Boeing uçağı sürüş hakları için insan pilotlarla yarıştı ve uçak kazalarına neden oldu Bu olay bize büyük bir aydınlanma getirdi: İnsanlara odaklanamazsak felaketlere neden olur;

  • AI sistemlerinin yorumlanabilirliği. Düzenleyici makam sistem modelini anlamazsa, sistem testi geçemez ve kullanılamaz.Örneğin, AB'nin yeni önerilen GDPR (Genel Veri Koruma Yönetmeliği) 'nde, otomasyon modelinin yorumlanabilir olmasını şart koşan bir yasa var;

  • AI sisteminin güvenilirliği. Mevcut YZ sistemi henüz bu yeteneğe sahip değildir Bu yetenek, YZ'ye sahip olunamayacağı anlamına gelmez, ancak toplumun buna dikkat etmediği, bu nedenle bilimsel araştırmacılar tarafından değer verilmesi gerektiği anlamına gelir;

  • Buna ek olarak, AI sisteminin güvenilirliği ve adaleti, "AI için sonsuza kadar" önemli temalardır.

Daha sonra, "yapay zeka" önemli bir konu olmasına rağmen, günün forumunun yapay zeka sistemleri için çok önemli olan veri yönetişimi konularına odaklanacağını belirtti: daha fazla veri, yapay zeka sisteminin performansı ve bu Eğer öyleyse, Google ve yerel BAT ve büyük miktarda veriye sahip diğer büyük şirketler gibi veri ve AI oligarkları ile sonuçlanacaktır. Bunun tersi, küçük şirketlerin karşılaştığı küçük veri senaryolarıdır.Örneğin, hukuk, finans ve sağlık hizmetleri uygulama senaryolarının çoğu küçük verilere ve "veri adalarına" sahiptir.

Küçük veriler için Profesör Yang Qiang, aşağıdakileri içeren teknik çözümler önerdi:

(1) Geçiş öğrenimi yoluyla büyük verilerin yeteneklerini küçük verilere aktarın (artık Bert büyük veri senaryoları için büyük modeller oluşturabilir);

(2) (Küçük) verileri entegre edin, gizlilik ve güvenlik gereksinimleri sağlayın ve bir federasyon modeli oluşturun.

Peki etkili veri adaları nasıl toplanır? Birincisi, gizlilik ve güvenlik modelleme araçlarını kullanın; ikincisi, gizliliği içermeyen iyi bir güvenlik sertifikasına ihtiyaç duyar; üçüncü, faydaların adil dağıtımı. Bu araçlarla, bu küçük veri sahipleri, sektörler arası bir federe öğrenme ittifakı oluşturabilir.

Konuşmanın sonunda, Federal Öğrenim İttifakı'nın kurulmasının tüm toplumu ilgilendirmesi gerektiğini vurguladı ve toplumun tüm kesimlerinin buna katılabileceğini umdu.

Profesör Yang Qiangın konuşmasının ardından, WeBankın AI departmanında kıdemli bir araştırmacı olan Dr. Liu Yang, "Federal Öğrenmenin Araştırılması ve Uygulanması" üzerine bir konuşma yaptı ve WeBankın Federe Öğrenme ve Federe Öğrenme üzerine çalışmalarından bazılarını tanıttı. Mevcut ilerleme ve gelecekteki gelişme yönü.

Dr. Liu Yang, Kıdemli Araştırmacı, WeBank AI Departmanı

İlk olarak, veri gizliliğini korurken büyük ölçekli kullanıcıların işbirliğine dayalı öğrenimi olan yeni "federal öğrenme" kavramını tanıttı. Spesifik olarak, "federal öğrenme" özerkliğin ve ortaklığın iki yönünü içerir: özerklik, kullanıcıların modelleri kendi terminal cihazlarında eğitmesi ve farklı veri sahiplerinin farklı modelleri eğitmesi anlamına gelir ve bu modellerin tümü farklı Parametreler; birleşim, modelin kümelenmesini sağlamak için modelin farklı parametrelerini buluta yüklemeyi ve ardından toplanan parametreleri kullanıcıya geri göndermeyi ifade eder.Bu süreç eğitim tamamlanıncaya kadar tekrarlanır - tüm süreç yalnızca model parametrelerini yükler, değil Gizliliği korurken veri paylaşımını gerçekleştirmek için verileri yükleyin.

Google, kişisel terminal cihazlarına dayalı "Yatay Birleşik Öğrenme" algoritma çerçevesini önermede başı çekti. Sonraki bir ila iki yıl içinde, algoritma çerçevesi de daha fazla ilerleme kaydetti:

  • Sistem verimliliğinin iyileştirilmesi ve optimizasyonu arasında model sıkıştırma, model optimizasyonu, optimum katılımcı seçimi ve birleşik öğrenme ve uç hesaplama kombinasyonu;

  • Model etkisinin iyileştirilmesi, eşit olmayan veri dağıtımı altında model performansının iyileştirilmesini ve kullanıcı terminallerinin kişiselleştirilmesini sağlamak için makine öğrenimi, çoklu görev öğrenimi vb. İle birleşik öğrenmeyi birleştirmeyi;

  • Veri güvenliği açısından ana husus, model parametrelerinin güncellenmesinin özel bilgileri koruyup koruyamayacağıdır.Bu alanda iki çözüm (gradyan) önerilmiştir: İlk yöntem, karışıklığı artırmak ve küçük verilerin tüm veriler üzerindeki etkisini azaltmaktır. ; İkinci yöntem, gradyan güncellemesini korumak için homomorfik şifrelemedir. Ayrıca Google, yerel eğitim, gizli paylaşım, kararlılık, kişisel gradyan bilgi sızıntısı olmaması ve yarı dürüst varsayımlarda yüksek performans sağlayan Güvenli Toplama'yı da önerdi.

Aynı zamanda, Dr. Liu Yang, şimdiye kadar federal öğrenmenin üç kategoriye yayıldığını da belirtti:

  • Yatay birleşik öğrenme - iki veri setinin kullanıcı özelliklerinin daha fazla çakışması ve kullanıcıların daha az çakışması durumunda, veri setini yataya (yani kullanıcı boyutuna) göre böler ve iki kullanıcının aynı özelliklere sahip olduğunu ancak kullanıcıların tam olarak aynı olmadığını çıkarırız. Eğitim verilerinin bir kısmı.

  • Boylamsal birleşik öğrenme - daha fazla kullanıcı çakışması ve kullanıcı özelliklerinin daha az örtüşmesi durumunda, veri setini dikey yöne (yani özellik boyutuna) göre böler ve iki kullanıcının aynı olduğunu ancak kullanıcı özelliklerinin tamamen aynı olmadığını çıkarırız. Eğitim verilerinin bir kısmı. Şu anda, lojistik regresyon modeli, ağaç yapısı modeli ve sinir ağı modeli gibi birçok makine öğrenimi modelinin bu federal sistem üzerine inşa edebildiği kademeli olarak onaylanmıştır.

  • Federe transfer öğrenme - İki veri setinin kullanıcı ve kullanıcı özelliklerinin daha az örtüştüğü durumda, verileri bölümlere ayırmayız, ancak veri veya etiket eksikliğinin üstesinden gelmek için transfer öğrenmeyi kullanabiliriz.

Bunlar arasında, boylamsal federe öğrenmenin belirli çalışma ilkelerini tanıttı. Dikey federe öğrenmenin amacı, taraf A ve taraf B arasında ortaklaşa bir model oluşturmak ve yalnızca bir tarafın Y etiketine sahip olduğunu ve hiçbir tarafın verileri ifşa etmediğini varsaymaktır.Ancak karşılaşılabilecek zorluk, yalnızca X tarafının bir model kuramaması veya iki tarafın değiş tokuş yapamayacağıdır. veri. Nihai beklenti, her iki tarafın da veri koruması elde etmesi ve modelin kaybolmamasıdır.

Bu nedenle, gizliliği korumak için makine öğrenimine geçmeden önce, üç önemli karşılaştırmayı içeren güvenliğin tanımlanması gerekir: yarı dürüst ve kötü niyetli; sıfır bilgi ve biraz bilgi; kötü niyetli merkez ve kötü niyetli veri düğümleri. Ardından, çok partili güvenli bilgi işlem, homomorfik şifreleme, Yao tarzı karışıklık devresi, gizli paylaşım ve farklı gizlilik dahil olmak üzere modellemek için gizlilik koruması altındaki teknik araçları kullanın.

Federe öğrenmenin mevcut ilerlemesini tanıttıktan sonra, Dr. Liu Yang ayrıca federe öğrenmenin mevcut zorluklarından ve gelecekteki araştırma beklentilerinden bahsetti. Bunların arasında, zorluk temelde iki yönden geliyor, biri model saldırı, diğeri veri saldırısı. Gelecekteki araştırma beklentilerine gelince, Dr. Liu Yang, federe öğrenmenin güvenlik uyumu, savunma saldırıları, algoritma verimliliği, teknoloji uygulamaları ve ittifak mekanizmaları yönünde geliştirilmesi gerektiğine inanıyor.

Son olarak, Dr. Liu Yang ayrıca finans alanındaki (İnternet şirketleri + bankalar), akıllı şehirlerdeki (görsel uygulamalar + kentsel yönetim) federal öğrenmenin mevcut uygulama örneklerini tanıttı ve federal öğrenme ekosisteminin inşasının açık kaynak, teknik standartlar ve iş tarafından güçlendirilmesi gerektiğine işaret etti. Üç unsurdan oluşur.

Dr. Liu Yang'ın konuşmasını bitirdikten sonra, WeBank'tan Araştırmacı Fan Tao, WeBank'ın "federal öğrenme" ve açık kaynak alliance AI çözümü FATE (Federated AI Technology Enabler) temelli bir ittifak AI sistemi geliştirdiğini herkese tanıtmak için sahneye çıktı. FATE, veri gizliliği korumasına dayalı güvenli bir bilgi işlem çerçevesi sağlayan endüstriyel düzeyde bir federal öğrenme çerçevesidir.Makine öğrenimi, derin öğrenme ve geçiş öğrenme algoritmaları için güçlü destek sağlar ve birden çok kurumun kullanıcı gizliliği korumasını karşılamasına etkili bir şekilde yardımcı olabilir, Veri kullanımı ve modelleme, veri güvenliği ve devlet düzenlemeleri gereklilikleri kapsamında gerçekleştirilmektedir. 2018 yılında başlayan proje GitHub ( üzerinden açık kaynaklı hale getirilmiştir.

Araştırmacı Fan Tao, WeBank Alliance AI Solution FATE Başkanı

Önceki konuşmacı, Federal Learning Alliance'a katılma nedenini teknik bir bakış açısıyla açıkladı.Nanyang Technological University, Nanyang Technological University'den Yardımcı Doçent Dr. Yu Han, yüksek veri sahiplerini oyun teorisi perspektifinden Federal Learning Alliance'a katılmaya nasıl teşvik edileceğini açıkladı. "Federal Öğrenmede Oyun Teorisi" dir.

Dr. Yu Han, Nanyang, Nanyang Teknoloji Üniversitesi'nde Yardımcı Doçent

Dr. Yu Han, bir veri ittifakının sürdürülebilir gelişiminin, yüksek kaliteli bireysel veya kurumsal veri sahiplerini katılmaya çekmeye devam edip edemeyeceğine bağlı olduğunu belirtti. Ancak yüksek kaliteli bireysel veya kurumsal veri sahiplerini katılmaya nasıl çekebilirsiniz? Önemli konulardan biri, bireylerin veya kurumların faydalarının nicelleştirilmesidir.

Bir çözüm bulmadan önce, ilk olarak şu anki olgunlaşmış üç tür kar dağıtım oyununda dağıtım şemalarını tanıttı:

  • Eşitlikçilik: Veri ittifakının ürettiği faydalar katılımcılar arasında eşit olarak dağıtılır;

  • Marjinal fayda: Bir katılımcının ittifaka katıldığında sağladığı marjinal faydaya dayalı olarak bir katılımcının hak ettiği faydayı belirleyin;

  • Marjinal kayıp: Bir katılımcının ittifaktan çekilmesinden kaynaklanan marjinal kayba göre hak ettiği faydayı belirleyin.

Sistem perspektifinden bakıldığında, genel amaç kolektif faydayı en üst düzeye çıkarmaktır.

Daha sonra, bu dağıtım şemalarının kendi dezavantajları vardır.Bu bağlamda, Federe Öğrenme Teşvik Edici (FLI) fayda dağıtımını önerdiler.Bu dağıtım planının özü, katkı ve maliyet açısından nasıl adil olunacağını düşünmektir. Katılımcıları tedavi etmek, veri ittifakının genel faydasını en üst düzeye çıkarırken, "pişmanlık" ve bekleme süresi olmak üzere iki boyutta katılımcılar arasındaki dengesizliği de en aza indirir. Bu durumda FLI, her veri sahibinin aynı anda birden fazla ittifaka katılabileceğini, ittifaka katılan / ayrılan katılımcıların sıralamasının önemini, ittifaka katılmanın maliyetini, ittifaka katılan katılımcının "pişmanlığını" ve katılımcının beklemesini aynı anda dikkate alabilir. Tam tazminat olarak harcanan zamanın dikkate alınması.

Konuşmanın sonunda Dr. Yu Han, bu mekanizmanın gerçek etkilerini tanıtmak için bu fayda dağıtım planına dayalı olarak Çin'in "Akıllı İnsanların Geçim Kaynakları" nda SmartHS uygulama örneğini kullandı. SmartHS süreç standardizasyonu, personel rolü tanımı standardizasyonu ve süreç akıllı yönetimini (federal sisteme dayalı olarak) elde ederken, mevcut e-devlet sisteminin hala araç seti tarzı bir çözüm olduğunu, sistem düzeyinde verimsizlik sorununu çözemediğini ve etkisinin açık olmadığını belirtti. Temel mekanizma tasarımı teorisini öğrenmek), sadece sıfır kuyruğa ulaşmakla kalmadı, aynı zamanda halkın harcadığı zamanı ve enerjiyi de düşürdü (hizmet sürecinin ortalama kullanım süresi% 90'dan fazlaydı) ve hükümet personelinin iş seviyesi de büyük ölçüde iyileştirildi. Projenin AAAI2018 "Yapay Zeka İnovasyon Uygulama Ödülü" nü de kazandığı bildirildi.

Pekin Guantao Zhongmao (Şangay) Hukuk Bürosu'nun ortağı olan avukat Wang Yuwei, bu forumdaki tek hukuk uygulayıcısı olarak veri gizliliğinin korunmasının yasal açıdan önemini vurguladı. Konuşma konusu "İnternet Güvenlik ve Veri Koruma Mevzuatı ve Uygulaması.

Pekin Guantao Zhongmao (Şangay) Hukuk Bürosu Ortağı Avukat Wang Yuwei

Avukat Wang Yuwei, Pang Lipengin Qunar ve Eastern Airlines ile olan gizlilik anlaşmazlıkları, Taobaonun haksız rekabet nedeniyle Meijing Şirketi ve Shanghai Shengpinin yasa dışı sürünmesi ile birleştirilen, bu yıl 15 Mart partisinde odaklandığı veri gizliliği konularını tanıttı. Bugünün Toutiao sunucusu video verileri vakası ve diğer tipik yurtiçi ve yurtdışı vakaları, şirketlerin nasıl bir veri uyumluluk sistemi kurabileceklerini ve giderek daha katı hale gelen yasalar ve sık sık kanun yaptırımı altında veri güvenliği yeteneklerini nasıl geliştirebileceklerini açıklamaktadır.

Avukat Wang Yuwei, Shanghai Shengpin vakasının Today's manşet sunucusunun video verilerini yasa dışı bir şekilde taramasını örnek alarak, bu vakada yer alan içeriğin günümüzde İnternet şirketlerinin karşılaştığı yaygın bir sorun olduğuna dikkat çekti. Bu durumda, Shanghai Shengpin Network Technology Co., Ltd., yakalamak için tarayıcı teknolojisini kullandı. ByteDance sunucu video verilerinin alınması yasa ve yönetmeliklere aykırı bir suçtur ve cezalar, cezai gözaltından sabit süreli hapis cezasına kadar uzanmaktadır.

Bu durum için ilgili şirketler için de karşı önlemler önerdi.Birincisi taranacak verinin açıklığını ve taranan tarafın istekliliğini değerlendirmek, diğeri ise verinin kişisel bilgi olup olmadığını belirlemek için veri türünü incelemek, Telif hakkıyla korunan içerik veya ticari sırlar.

Konuşmanın sonunda, veri gizliliği sorunlarının çözümünün, bir yandan özel verilerin ihlalini kısıtlamak için hükümet yasalarını gerektirdiğini, diğer yandan "Profesör Yang Qiang tarafından önerilen federal çalışma iyi bir fikir olabilir" dedi.

Dördüncü konuk konuşmacı, Fourth Paradigm'in kurucu ortağı ve baş araştırma bilimcisi Dr. Yuqiang Chen, konusu "Federal Öğrenme - Herkes İçin Yapay Zekaya Giden Tek Yol".

Dr.Chen Yuqiang, Fourth Paradigm'in kurucu ortağı ve baş araştırma bilimcisi

İlk olarak bilimdeki dört paradigmayı tanıttı: ilk paradigma keşif, kayıt ve tekrarlamayı vurgulayan deneysel bilimdir; ikinci paradigma, fenomenleri açıklamak için tasarım teorisini vurgulayan teorik bilimdir; üçüncü paradigma hesaplama bilimidir, yani Hesaplama fenomeni simüle eder; dördüncü paradigma veri bilimidir, yani fenomeni veriler aracılığıyla açıklar. Dördüncü paradigmanın bilimsel gelişimin geleceği olduğunu vurguladı.

Ardından temaya geri döndü ve "Herkes İçin Yapay Zeka" nın geçmesi gereken aşamaları sundu:

  • Başlangıç noktası, insan zekasının derecesini profesyonelliğe dayalı olarak belirleyen uzman sistemdir.Tüm sınırları aşmak zordur ve uygulama eşiği çok yüksektir;

  • İkinci aşama yüksek boyutlu öğrenmedir.Üretim ve standardizasyon problemini çözebilecek kanunu ve zeka eşiğini bulmak için karmaşık bir model oluşturmak gerekir;

  • Şimdi üçüncü aşama, akıllı inşaat eşiğini çözebilen, yani herkes kendi modelini oluşturabilen AutoML'dir. Ancak, şu anda çözülmesi gereken şey veri eşiği sorunudur, bu nedenle gelecekteki geliştirme yönü

  • Dördüncü aşama: Federal öğrenme.

Daha sonra, makine öğreniminin endüstriyel inişi perspektifinden bakıldığında, makine öğreniminin sektördeki en büyük özelliğinin ölçeklenebilirlik olması gerektiğine işaret etti - iki ölçeklenebilirlik düzeyi de dahil: Bir yandan, küme ve makine sayısı arttıkça veri işlemenin verimi artıyor. Öte yandan işin / verinin artması ile zeka / deneyim önündeki engeller artmaktadır. Endüstriyel büyük veri, yüksek VC boyutlu bir model gerektirir; bu, yüksek karmaşıklık modelleri veya işlevleri ve çok güçlü makine öğrenimi yetenekleri gerektirdiği anlamına gelir.

Genel olarak, endüstrinin ihtiyaç duyduğu yüksek VC boyutlu makine öğrenimi sisteminin, verilerin, özelliklerin ve modellerin üç yönünde iyileştirilmesi ve optimize edilmesi gerekir. Yüksek veri eşiği nedeniyle genel yaklaşım, özelliklerin ve modellerin iki yönünü takip etmektir.

  • Model yönü boyunca, büyük modeller elde etmek için genellikle doğrusal olmayan üç kılıç-Kernel, Boosting ve sinir ağını (şu anda en çok kullanılan yöntem) kullanan akademik topluluk (ICML, NIPS, ICLR) hakimdir. Bazıları, veri dağıtımı sorununu çözen ve sistemin yükünü azaltan bağımsız bir makineye yüklenebilir; endüstri, modeli uygulama için özelleştirir.Önemli nokta, hangi modelin sahne verileri, genelleme yeteneği ve doğrusal olmayan kombinasyon yeteneği için daha uygun olduğudur. Uzmanlar veya gözlemler tarafından yapılan varsayımlara dayanarak, bir makine öğrenimi sistemi oluşturmak için daha fazla parametre elde etmek için yeni modeller ve yapılar eklenecektir.

  • Karakteristik yönde yürümeye endüstri hakimdir (KDD, WWW). Kullanılan model nispeten basit ve kabadır (hem avantajlar hem de dezavantajlar) ve dağıtılmış hesaplama ve mühendislik özelliklerinde karşılaşılan zorluklar daha büyüktür, bu nedenle Önemli olan, verimli paralellik sağlamak ve hızlı yakınsamayı sağlamaktır. Bu bağlamda, endüstri genellikle özelliklerin nedenlerini ve yöntemlerini keşfetmeye ve özelleştirilmiş özelliklerin uygulanmasına yönelik özellikleri anlamaya odaklanır.

Ancak şu anda sektörde makine öğrenimi uygulamasında hala birçok sorun var.Bir yandan yapay zeka uygulama platformlarına büyük bir talep varken diğer yandan yapay zeka gerçekten her işletmeye büyük ölçekte uygulanmadı. Özellik mühendisliğini örnek olarak alırsak, bu alandaki araştırmacıların makine öğrenimi ve iş hakkında derinlemesine bir anlayışa sahip olmaları gerekir.Özellik mühendisliğini optimize etmek için kullanılabilecek mevcut yöntemler şunlardır: örtük özellik kombinasyonu (NN, FM), yarı açık görüntüleme Özellik kombinasyonu (GBDT) ve açık özellik kombinasyonu (özellik çapraz ürün).

Son olarak, artık "Herkes İçin Yapay Zeka" sorununu çözmeye çalıştıklarını ve bir sonraki adımın veri sorununu çözmek olduğunu söyledi. Dördüncü paradigma, federe öğrenme üzerine araştırma yapmak için Profesör Yang Qiang'ın rehberliği altındadır.Ana araştırma fikirleri arasında mahremiyetin korunması ve bilgi aktarımı yer alır ve ilgili sonuçlar tıp alanına uygulanmıştır.

Son konuşmacı, JD Smart City Araştırma Enstitüsü'nde kıdemli araştırmacı ve JD Urban Computing Bölümü AI Platform Departmanı başkanı Dr. Junbo Zhang idi. Konusu "Kentsel Hesaplama ve Alanlar Arası Öğrenme Ortak Modellemesi" idi. Kentsel bilgi işlemin kısmi uygulaması perspektifinden temelde federe öğrenmenin sahadaki önemi hakkında konuştu.

JD Akıllı Şehir Araştırma Enstitüsü kıdemli araştırmacısı ve JD Şehir Hesaplama Bölümü Yapay Zeka Platformu Bölümü başkanı Dr. Zhang Junbo

İlk olarak, kentsel verilerin toplanması, yönetimi, analizi ve madenciliği ve trafik, planlama ve çevre sorunlarını çözmek için hizmet sağlama yoluyla "Kentsel Bilgi İşlem" kavramını tanıttı. Bununla birlikte, verilerin zaman ve mekandaki heterojen, çok kaynaklı ve dinamik dağılımı nedeniyle, kentsel bilgi işlem şu anda kentsel olarak algılanan verilerin eksikliğinden kaynaklanan büyük bir zorlukla karşı karşıyadır. Bunlar arasında, mekansal-zamansal büyük veri, mekansal yakınlığı, hiyerarşisi, dönemselliği ve zamandaki eğilimi ve diğer özellikleri nedeniyle kentsel bilgi işlemde acilen çözülmesi gereken bir sorundur.

Ardından, JD'nin kentsel bilgi işlemlerini tanıtmak için kentsel alanlardaki insanların akışını ve dolaşımını, büyük verilere ve yapay zekaya dayalı hava tahminini ve yapay zekaya ve kentsel büyük veri boru hattı ağına dayalı su kalitesi tahminini tahmin etmek için yapay zekayı aldı. Bazıları işe yarıyor, ancak bu çalışmalar henüz mevcut veri birikimini iyi bir şekilde kullanamıyor: Akıllı şehirlerin inşasında çeşitli devlet kurumları tarafından kurulan çeşitli bilgi sistemleri veya veri platformları; büyük işletmeler, özellikle merkezi işletmeler ve devlete ait işletmeler, birikim Her türden büyük sayıları toplayın. Aynı zamanda, bazı önemli sosyal kalkınma projelerinin hükümet ile büyük işletmeler ve kurumlar tarafından ortaklaşa tamamlanması gerektiğinden, çeşitli kurumlar arasındaki veri engellerinin kaldırılması gerekmektedir.

Ve böyle bir talep bir dizi zorluğa karşılık gelir:

Birincisi veri güvenliği konusudur. Hem AB'nin GDPR'si hem de "Çin Halk Cumhuriyeti Siber Güvenlik Yasası" veri gizliliği konusunda katı düzenlemeler ortaya koymaktadır;

İkinci olarak, veri paylaşımı, veri adaları, farklı devlet kurumları ve işletmeler ve kamu kurumlarının farklı platform mimarileri, veri şifreleme kayıtları, veri türleri ve standart çeşitlendirmesi gibi platformlar arası senaryolar karmaşıktır;

Üçüncüsü, mevcut model algoritmaları, orijinal verilerin gizliliğinin sızmasını önleme, model doğruluğu ve verimliliği, ağ güvenliği, model yorumlanabilirliği ve güven sağlama hedeflerine tam olarak ulaşamaz.

Cevap olarak JD.com, "federal öğrenme + rastgele orman" federal rastgele ormanı, "federal öğrenme + lojistik regresyon modeli" ortak bir kurumsal kredi derecelendirme modeli ve alanlar arası öğrenme ortak modelleme yoluyla bir "federal öğrenme + arazi özelliği öğrenme" modeli oluşturdu. Veri engellerini aşmak ve veri adaları sorununu çözmek için akıllı grafikler (bölgeler) sıralama modelleri vb.

Bu forumun son halkası, Profesör Yang Qiang, Dr. Zhang Junbo, Dr. Chen Yuqiang, Dr. Yu Han, Avukat Wang Yuwei ve özel konuk, WeBank Yapay Zeka Bölümü Genel Müdür Yardımcısı Bay Chen Tianjian'ın katılımıyla bir yuvarlak masa forumuydu. "Federal Öğrenmenin Fırsatlarını ve Zorluklarını Keşfetmek" için.

Profesör Yang Qiang, Dr. Zhang Junbo, Dr. Chen Yuqiang, Dr. Yu Han, Avukat Wang Yuwei ve Bay Chen Tianjian yuvarlak masa forumuna katıldı

Aşağıda kaydedilmiş bir diyalog yer almaktadır:

1.

Profesör Yang Qiang: Yeni bir federe öğrenme teknolojisi olarak, insanların henüz aklına gelmemiş pek çok sorun olmalı. Örneğin, federe öğrenmenin verileri birleştirmesinden sonra, birleşme merkezindeki modellemenin etkisi en iyisidir, ancak çeşitli nedenlerden dolayı mahremiyetin aynı anda korunması ve verilerin çeşitli veri sahiplerinin terminallerine dağıtılması gerekir. Hiç şüphe yok ki kaybedecek bir şey var. Herkese sormak istediğim şey, kayıp nedir? Ve zarar endeksinin işletme üzerinde ne kadar etkisi var?

Bay Chen Tianjian : Bu sorunun hem artıları hem de eksileri var. Bir yandan, federe öğrenme herkes için büyük fırsatlar getirdi.Küçük veriye sahip şirketlerin artık büyük veriye sahip şirketlerin veri tekelini kırmaları gerekmiyor, ancak federe öğrenme teknolojisi sayesinde büyük verinin avantajlarından yararlanabiliyorlar; diğer yandan, Bu aynı zamanda bazı zorlukları da beraberinde getirir.Örneğin, geçmiş veriler füzyondan sonra tamamen şeffaftır ve çok geleneksel bir şekilde işlenebilir.Ancak, verileri birleştirmek için federe öğrenme yoluyla, verilerin özellikleri birleştirilmiş, şifrelenmiş ve diğer protokoller olmalıdır. Veri işlemeyi gerçekleştirin, bu durumda veriler belirli kısıtlamalara tabi olacaktır.

2.

Profesör Yang Qiang: İki Tencent sınıf arkadaşı bana özel olarak bir soru sordu: Ortak modellemede iki taraf işbirliği yaparsa, bir taraf Y'ye ve diğer tarafta Y'ye sahip değilse, Y'siz taraf modelleme yapamaz Bu sorun nasıl çözülür? Ne?

Bay Chen Tianjian: Aslında, Y'li taraf genellikle pratik uygulamaları olan taraftır ve sözleşmeyi şart koşmaktan sorumlu olmak çok makul ve adildir.

Dr. Chen Yuqiang: Ekle. Sanırım bir durum olabilir. Örneğin, Tencentin iş matrisi doğal olarak çok fazla veriye sahiptir. Yeni bir ürün piyasaya sürerse, bu üründe Y harfi olmayabilir. Aslında, böyle bir senaryo varsa, zaten Tüm verileri paylaşabilen bir teknoloji var ve etkisi oldukça iyi.

3.

Profesör Yang Qiang: Çok sayıda üniversite öğrencisi, yüksek lisans öğrencisi ve doktora öğrencisi olay yerine geldi, onlar da yeni araştırma konuları arıyorlar, onlara herhangi bir öneriniz var mı?

Dr. Zhang Junbo: Aslında, her aşamadaki öğrenciler farklı konular üzerinde çalışma eğilimindedir. Genel olarak, doktorlar bazı akademik konulara eğilimli olabilirken, lisans öğrencileri ve yüksek lisans öğrencileri daha uygulamaya yönelik bazı konular seçebilir.

Dr. Yu Han: Oyun teorisi perspektifinden ekleyeyim. Bir yandan, okulumuzun ortak araştırma enstitüsünde, federal öğrenmenin dağıtımı gibi öğrenci odaklı birçok araştırma projesi vardır; diğer yandan, diğer yönlerdeki konuları da düşünebilirsiniz, örneğin, iki taraf bir federal öğrenme ittifakı kurduğunda, üçüncü bir kişi var Sorun çıkarmak için, üçüncü bir tarafı dahil etmenin herhangi bir yolu var mı? Mevzuatın AI yeniliği üzerinde ne etkisi olacak?

4.

Profesör Yang Qiang: Yurtiçi veri kanunları genellikle küçük bir gecikmeyle birlikte belirli vakalar tarafından yönlendirilir. Neden iç mevzuat böyle bir fenomendir? Gelecekte değişiklikler olacak mı ve Avrupa gibi ilgili yasa ve düzenlemeleri önceden önerebilir ve dünyada lider bir rol oynayabilir miyiz?

Avukat Wang Yuwei: Mevcut iç mevzuatta gerçekten de bu tür sorunlar var. Ama gerçekte, bazı yasalar çok erken çıktı, ancak ulusal sistemdeki yasama döngüsü nispeten uzundur ve düz metnin nihai olarak ilan edilmesi gecikecektir. Aynı zamanda, herkesin bu yasalarla ilgili sezgisi çok güçlü değil, bu nedenle iç mevzuatın geride kaldığı izlenimi oluşacaktır. Bununla birlikte, iç mevzuatın seviyesi gerçekten o kadar yüksek olmayabilir, bu nedenle uygulama sürecinde, herkes genel olarak etkinin çok iyi olmadığını hisseder. Biz de bu statükonun değişeceğini umuyoruz, ancak bu, ulusal yasama organının sistemiyle ilgilidir.Avukatlarımız diğer avukatlarla iletişim kurmak için sık sık yurt dışına çıkacaklar ve bu alanda da gayret ve girişimlerde bulunuyorlar. Bunu dört gözle bekleyebilirsiniz.

(Bitiş)

Leifeng.com AI Teknolojisi İnceleme Raporu Leifeng.com

Yüksek bir fiyata bir varyete gösterisine davet edilen Jin Dong, reddetti! Gösteriş yapmak akıllıca mı?
önceki
Rahibe Shenxian kızdı ve iki huh gönderdi, Liu Yifei'ye ne oldu?
Sonraki
OPPO R19 koruyucu kapak pozu: kaldırma kamerası tasarımını + arka üç kamerayı kullanmaya devam edin
Volvo XC40'ın son fragmanı yayınlandı, yeni otomobil 21 Eylül'de resmen tanıtıldı
Bu hayran bebeği ile Virgil Abloh x Nike'ı alabilir misin?
USB-C arayüzü nihayet kullanıldı! 9to5mac: Apple bu ay yeni bir iPad Pro yayınlayacak
Zhang Yishan, bir cümleyle eğlence endüstrisinin gizemini söyledi: Bazen, her şeyi yenebilecek sadece güçle değil
OPPO, Breeno akıllı asistanını yayınladı, 5G döneminin düzenini geliştirdi ve "her şeyin etkileşimini" memnuniyetle karşılıyor
SAIC Roewe RX3 resmi resmi yayınlandı! Yeni otomobilin dördüncü çeyrekte satışa sunulması bekleniyor
Academia NIPS'de 6: 1 erkek / kadın oranıyla karşı karşıya kalan Li Feifei ve AI4ALL karar verdi ...
Green'i affetmek mi? OFF-WHITE x Timberland botları hakkında ne düşünüyorsunuz?
Platform tabanlı bir şirketin Pekin kültürü olmak için, 2017'de nasıl gidecek?
Orta seviye otomobil kıyaslaması Magotan ile karşı karşıya kalan Regal, buna meydan okuyacak güce sahip mi?
Çin'deki ISCA 2018'deki tek makaleyi kazanan Tsinghua Üniversitesi'nin Thinker ekibi, AI hesaplama çipleri için yeni bir depolama optimizasyonu yöntemi önerdi
To Top