İçbükey tapınaktan Xiaocha Qubit Raporu | Genel Hesap QbitAI
AI kağıtları, açık kaynak kodu zorlanmalı mı?
NeurIPS 2020 yakın zamanda resmi olarak açık kaynaklı bir kılavuz yayınladı. 2019'dan itibaren NeurIPS, kağıt kodun gönderilmesini "şiddetle tavsiye etti", ancak yine de zorunlu değil.
Ancak her durumda, yetkili bir sinyal gönderdi: AI akademik zirvesi açık kaynak kodu bir endüstri trendi haline geldi.
NeurIPS'in hareketi aynı zamanda "yıllık" bir tartışmayı da tetikledi: Akademik konferanslar gelecekte açık kaynak gerektiriyorsa, katkıda bulunanlar bunu reddetmeli mi?
Beklenmedik bir şekilde, birçok netizen şöyle düşünüyor: Kaynak açmazsam haklıyım.
Öncelikle açık kaynak kodunun amacı nedir? Diğer araştırmacıların sonuçları yeniden üretmesine izin vermek içindir.
Bir makale yeterli ayrıntı içeriyorsa, diğerleri içindeki formüle göre kendi kodlarını yazabilir ve bu tür kağıtlar için kod açıklanmayabilir. Ancak öncül, yeterli ayrıntı sağlamak olmalıdır.
Örneğin, Google'ın AlphaGo'sunun açık kaynak kodu yok, ancak kimse doğruluğundan şüphe duymuyor. Aslında, birçok kişi AlphaGo'yu Google kağıtlarına dayanarak yeniden üretti.
Ve yazarın kendi kodunda hatalar olabilir.Açık kaynak olmamasının bir avantajı, diğer araştırmacıların bağımsız olarak yeniden üretmesine izin vermektir.
Yazarın kodda açık olmayan bir "çukur" kazması durumunda, diğer insanlar da hendeğe alınmasını önlemek için onu atlatabilir.
Ayrıca, kodun değerini abartmayın.Klasik kağıtlar onlarca yıl dayanabilir, ancak on yıl sonra kodun çalıştırılması zor olabilir.
Elbette, AI için veri setlerinin daha önemli olduğu yönünde başka bir görüş daha var. Verisiz kod değersizdir ve birçok veri kümesi açılamaz, yani kodu alsanız bile SOTA sonuçlarını yeniden oluşturamazsınız.
Açık kaynak değil, aynı zamanda yazarın çeşitli özel durumlarıyla da ilgilenmek anlamına gelir.
Örneğin, bazı araştırmacılar saf teorik araştırmalarla meşguller. Bir netizen, Docker konteynerini nasıl inşa edeceğini bile bilmediğini söyledi.Çok sayıda makale yayınlandı ve kod GitHub'da açık kaynaklı olmasına rağmen, hiçbir zaman korunmadı.
Bu nedenle makalenin açık kaynak olup olmadığı kodun makale için önemine göre belirlenmeli ve herkese uyan tek beden olmamalıdır.
Ticari şirketlerde, makalelerini yazarken şirketin dahili özel yazılım kitaplıklarını kullanan araştırmacılar da vardır.Eğer açık kaynak zorlanırsa, kodu sıfırdan yeniden yazmaları gerekir, bu da zaman alıcı ve zahmetlidir ve bu insanlara haksızlık olur.
Kendileri için kaynak açmak istemeyen, ancak sonuçları bir süre korumayı ve makalenin yayınlanmasından birkaç ay sonra kodu açık kaynak kodlu olarak açmayı ümit eden yazarlar da vardır.Bu, tıp ve hukuk alanındaki bilim adamları için çok önemlidir.
Özetlemek gerekirse, muhalif netizenler zorunlu açık kaynağın çok aşırı olduğuna ve zorlamak yerine teşvik edilmesi gerektiğine inanıyor.
Her şeyden önce, petrol endüstrisinden bir netizen, kendi endüstrisindeki verilerin ticari sır olduğunu, bu nedenle herhangi bir veri ve kod yayınlamayacaklarını, hatta sonuçları gizlemek için makaledeki bazı formülleri bile kaybetmeyeceklerini söyledi ve doğruluk oranının% 98 olduğunu iddia etti. Sonuçlar nasıl ikna edici olabilir?
Veriyi ve kodu ifşa etmemenin bir makalenin tüm temel unsurlarını silmek gibi olduğuna inanır, bu tür bir araştırma yayınlansa bile değersizdir.
Diğerleri, açık kaynağı zorlamanın diğer sektörlerdeki makine öğreniminin önyargısını değiştireceğine inanıyor.
Diğer disiplinlerdeki pek çok kişi makine öğrenimini sahte bilim olarak görüyor. Neden? Çünkü AI alanındaki makalelerin yayınlanma süreci çok olgunlaşmamış.
Bilimsel yöntemin anahtarı tutarlılık ve tekrarlanabilirliktir. Tek bir göstergenin peşinde koşan herkes, büyük bir sorun olan SOTA'dan etkileniyor.
Açık kaynak, bu sorunu çözmenin bir yoludur.
Geçen yıl, tanınmış bir AI kadın bilim insanı olan Anima Anandkumar, kişisel blogunda kamuya açık bir şekilde bağırdı, kodu vermeden makale yayınlama davranışına şiddetle karşı çıktı ve akademik konferanslara zorunlu olarak gönderimleri gerektirmesi ve kodu ifşa etmesi çağrısında bulundu.
Açık kaynak kodunun, makaleleri gözden geçirmeye elverişli olmadığına, kağıt dolandırıcılığından sorumlu olmadığına ve hatta sektörde açık rekabete daha az elverişli olmadığına inanıyor.
Yayınlanan akademik makalelerin de kodu yayınlaması gerektiğini düşünüyor musunuz?
Referans bağlantısı:
https://www.reddit.com/r/MachineLearning/comments/fzss9t/d_if_a_paper_or_project_doesnt_publicly_release/
https://www.reddit.com/r/MachineLearning/comments/fzp8bu/d_official_neurips_2020_guidelines_for_making/
- Bitiş -
Qubit QbitAI · Toutiao İmzalı
Bize dikkat edin ve en son teknolojideki en son gelişmeleri alın