Wikipedia'daki en üretken yazar bir robottur

İnternette en çok kullanılan dil İngilizce olduğu gibi, Wikipedia'nın İngilizce sürümü de Wikipedia'nın dünyadaki 309 dil sürümü arasında en zengin olanıdır. Bu yılın Ocak ayında Wikipedia'nın İngilizce versiyonu resmi olarak 6 milyon girişi aştı.

Boston Review'den resim

Şaşırtıcı bir şekilde, dünyadaki ikinci en çok girişe sahip dil sürümü, İspanyolca ve Fransızca gibi "büyük dil" wiki'leri değil, wikinin Cebuano (Cebuano) sürümü ve toplam 5,38 milyon girişle.

Bu dili hiç duymadıysanız, normaldir.

Cebuano, Filipinler'de konuşulan küçük bir dildir ve Cebuano'yu konuşabilen 20 milyondan fazla insan yoktur. Dahası, Wiki'nin Cebu dil versiyonu beş milyondan fazla girişe sahip olmasına rağmen, sadece altı yönetici ve sadece 14 aktif kullanıcı var.Aksi halde, İngilizce versiyonda sadece 1143 yönetici var ve bu daha da aktif. 100.000'den fazla kişidir.

Honolulu Magazine'den resim

Aslında, Wiki'nin Cebu dili sürümündeki beş milyondan fazla girişin% 99'u "Lsjbot" adlı bir robot tarafından tamamlandı. Aynı zamanda Wikipedia'daki en üretken yazardır.

İyi durumda, günde 100.000 giriş oluşturabilir

Lsjbot'un "babası" Sverker Johansson, aynı zamanda dilbilim, ekonomi ve inşaat mühendisliği alanlarında derecelere sahip İsveçli bir fizikçi. Karısı Filipinli ve Cebuano konuşuyor, bu nedenle Lsjbot Wikipedia'nın hem İsveççe hem de Cebuano sürümlerinde içerik yazmıştır.

Johansson, her zaman "her şeyin kökeni" ile ilgilendiğini ve Wikipedia'nın gelecekte "herkesin her şeyi bilmesine izin vermesi" gerektiğine inandığını söyledi. O zamandan beri, Wikipedia'yı "her şey dahil" vizyonuna itmek için daha hızlı bir yol kullanmak isteyen Lsjbot'u yazmak için birkaç ay harcadı.

Sverker Johansson, "Wall Street Journal" dan bir resim

Lsjbot'un yaptığı şey biraz "boş araziyi açmak" gibidir, 0'ı 0.5'e çevirir.

Zengin bir girdi sistemi yazmaz, sadece bir girdi oluşturur ve en temel bilgileri koyar Bu tür girdilere, kullanıcılar tarafından daha fazla tamamlanması ve zenginleştirilmesi gereken "saplama" adı verilir. Lsjbot'un odak noktası da nispeten dar, esas olarak biyolojik türler ve coğrafya ile ilgili.

Lsjbot genellikle bunun gibi küçük girişler üretir, resim Wikipedia'dan alınmıştır

Lsjbot içerik oluşturma süreci de oldukça stilize edilmiş. İlk olarak, Johansson, önce belirli bir alan içeriği için bir şablon yazacak ve ardından bilgi kaynağı olarak güvenilir, makine tarafından okunabilir bir veritabanı arayacak ve ardından Lsjbot'un şablona göre "boşlukları doldurmasına" izin verecek ve yayın sonrası çalışmayı tamamlayacak. Verimlilik yüksek olduğunda, Lsjbot günde 100.000 küçük girişi tamamlayabilir.

Bu iş tanımını dinlediğinizde, Lsjbot'un milyonlarca giriş başlığı olmasına rağmen, içeriğin aslında sadece kuru bir "omurga" olduğunu, insan yaratıcılığından ve düşüncelerinden yoksun olduğunu ve doğal olarak bazı aktif wiki yazarlarının ilgisini çektiğini hissedebilirsiniz. Memnuniyetsizlik.

Genel olarak, robotların ürettiği küçük eşyalara karşıyım. (Bunlar) sadece aşağı yukarı doğru sınıflandırma bilgisi içerir, ancak hayvanın görünümü gibi önemli bilgilerden yoksundur.

41 yaşındaki Achim Raschka, Wikipedia'nın Almanca versiyonuna aktif olarak katkıda bulunduğunu ve belirli bir bitki hakkında derinlemesine bir makaleyi tamamlamanın genellikle birkaç gün sürdüğünü söyledi.

Johansson, Lsjbot tarafından oluşturulan içeriğin gerçekten sıkıcı olduğunu da kabul etti, ancak içeriğin de kendi değerine sahip olduğu konusunda ısrar ediyor. Ona göre, Lsjbot'un girişleri orijinal wiki topluluğunda temsil edilmeyen bazı alanları tamamlayabilir.

"Bağlan" dan resim

Wikipedia yazarlarının çeşitliliği uzun zamandır eleştiriliyor.Araştırmalar, Wikipedia'da yazan kişilerin çoğunun kuzey yarımkürede gelişmiş ülkelerde yaşayan, teknoloji ürünlerinde iyi olan beyaz yakalı erkekler olduğunu ortaya koydu. Johansson, İsveç Wikipedia'sında "Yüzüklerin Efendisi" ndeki karakterler hakkında 150'den fazla giriş olduğunu, ancak Vietnam Savaşı ile ilgili 10'dan az girdi olduğuna dikkat çekti:

Tolkien ile bir sorunum yok ve Sauron tarafından başlatılan savaşa ("Yüzüklerin Efendisi" nde) "Çin Yeni Yılı Taarruzu" ndan (Vietnam Savaşı) daha aşinayım, ama bu gerçekten dengeli bir ansiklopedi mi?

Lsjbot'un içeriği "kuru" olsa da Johansson, bu bilgi omurgalarının ilham kaynağı olabileceğini ve gelecekteki wiki yazarlarına orijinal topluluğun "rahat bölgesi" dışındaki içerikleri keşfetmeleri için ilham verebileceğini umuyor.

Bu yüzden, "öncü bir boğa" olan Lsjbot'un 0'ı 0.5'e çıkardığını düşünüyorum, çünkü insan yazarların yaratıcı katılımını 0.5'e 1'e taşımak gerekiyor.

Aslında Wikipedia'da Lsjbot'un yanı sıra farklı işlevler taşıyan çok sayıda robot var ve bunlar bu topluluğun vazgeçilmez üyeleri haline geldi.

Wikipedia'nın "Robot Ordusu"

imgurdan resim

Herkesin topluma olan bağlılığını takdir edebilmesi için robotların greve gitmesi gerektiği konusunda sık sık şaka yapıyoruz.

(Robot yoksa) Bu web sitesi daha fazla iş yapmamızı gerektirecek ve editörün aşırı yüklenme oranı büyük ölçüde artacaktır.

Avustralya'da yaşayan Chris Grant, Wikipedia topluluğunda robotların yönetiminde uzmanlaşmış bir kuruluş olan Bot Onayları Grubu'nun (BAG) bir üyesi olduğunu söyledi.

Evet, Wikipedia'daki robot uygulamalarının geçmişi o kadar uzun ve kapsamlıdır ki, BAG, robotları gözden geçirmek ve yönetmek için 2006 yılında kurulmuştur.

Süreç açısından, bir wiki yazarı robotu topluluk içinde kullanmak isterse, önce BAG'ye robotun işlevini, programlama dilini ve içermesi beklenen sayfa sayısını açıklayan bir başvuru göndermelidir. Daha sonra, BAG üyeleri çeşitli yönlerden olası etkisini kapsamlı bir şekilde tahmin edecek ve geçip geçmeyeceğine karar verecektir. İncelemeyi geçen bir robot için bile, geliştirici ona her özellik eklediğinde robotun onay için yeniden göndermesi gerekir.

2018 itibariyle Wikipedia'da kullanılan robot sayısı bini aştı ve geliştirmeye devam ediyor. "Robotların Wikipedia'da Oynadığı Rolleri" 2019 tarihli bir makale Wikipedia'daki botları analiz edip analiz etti ve onları işlevlerine göre dokuz kategoriye ayırdı: "Lsjbot gibi sayfalar oluşturmak için diğer veri kaynaklarını kullanan Jeneratör (Jeneratör)". ) "," Köprülerin ve belgelerin onarımından sorumlu "Fixer", verileri güncelleyen ve kullanıcı durumunu kaydeden "Clerk", wiki yazarlarına danışmanlık yapan "Advisor" vb.

Wikipedia'da dokuz robot kategorisi

Bu robotların çoğu, insan editörlerin topluluktaki çok karmaşık toplu işleri tamamlamasına yardımcı olur ve ayrıca içerik yazarken yeni üyeler için yardım önerileri sağlar ve her türlü kötü amaçlı içeriği ortadan kaldırır. Elbette robotlar da hata yapar.Wiki'nin düzenleme sisteminin değişiklik kayıtları üzerindeki şeffaflığı göz önüne alındığında, yöneticiler de hataları düzeltebilir ve robotları zamanında optimize edebilir.

Robotlar olmasaydı Wikipedia karmakarışık olurdu.

BBC ile yaptığı röportajda kendisine Hersfold diyen bir Wikipedia yöneticisi söyledi.

İnsanlar Lsjbot'a karşı olduğunda, neye karşı çıkıyorlar?

Giphy'den resim

Wikipedia'da robotların varlığı uzun bir geçmişe sahip olduğundan ve Lsjbot gibi epeyce genel içerik üretme türü olduğundan, insanlar neden hala Lsjbot'un varlığının rasyonelliği hakkında tartışıyorlar?

Aslında Wikipedia doğduktan sonraki ilk yıl, ilk uygulanan robot "rambot" doğdu ve aynı zamanda Lsjbot'a benzer içerik üreten bir robottur.

O zamanlar rambot, ABD Nüfus Sayımının kamuya açık verilerinden coğrafi bilgileri çıkardı ve Wiki'nin İngilizce versiyonunda Amerikan şehirleri ve kasabaları hakkında 30.000 küçük giriş oluşturdu ve aynı zamanda Wikipedia'daki ilk robottu. Daha sonra, bu öğeler insan yazarlar tarafından kademeli olarak geliştirildi ve zenginleştirilerek çeşitli tarihi olaylar ve seyahat bilgileri eklendi.

2009 itibariyle, Wikipedia'nın İngilizce sürümünde robotları ve yardımcı programları içeren editörler toplamın% 28.49'unu oluşturuyordu.

Benzer şeyler yapan Lsjbot neden sürekli saldırıya uğruyor?

Esas olarak bir orantı sorunudur.

Makalenin başında da belirtildiği gibi, wikinin Cebu dil versiyonunun sadece bir düzine aktif kullanıcısı var, Lsjbot ise 5 milyondan fazla giriş oluşturuyor.Bazı insanlar bu küçük topluluğun bu kadar büyük miktarda iyileştirme çalışmasını tamamlayamayacağını düşünüyor.

Bu nedenle, Wikipedia'nın bu dil sürümüne yeni bir kullanıcı geldiğinde, gördükleri tek şey düşük kaliteli girdilerdir ve düzenleme katkılarına katılmak için motivasyonlarını bırakır veya kaybederler.

2017'de, wikinin Cebuano sürümündeki içeriğin çoğu makine tarafından oluşturulmuş olduğundan, KATMAKROFAN kullanıcısı wikinin dil sürümünü kapatmayı önerdi.

Sonunda komite, konuyla ilgili tartışılan halka açık sayfada, "bu projede robot tarafından oluşturulan içerik sorununu anlamak gerçekten dikkat gerektiriyor" ve "içerik kalite kontrolünü sıkılaştırın" tavsiyesinde bulunarak teklifin reddedildiğini duyurdu.

Dolayısıyla insanların tartıştığı şey aslında topluluk operasyonu meselesidir.Aynı zamanda robotlar tarafından üretilen içeriğin insanların yaratma coşkusunu nasıl etkilediğini ve robotların yarattığı içeriğin kalitesini kapsamadığını tartışıyorlar.

Johansson, bu yıl Vice ile yaptığı bir röportajda, topluluğun "tutum değişikliğini" göz önünde bulundurarak, Lsjbot'un wikinin Cebu dili sürümünde artık yeni girişler oluşturmadığını ve yalnızca bakım görevlerini yerine getirmekten sorumlu olduğunu belirtti.

Lsjbot artık yeni girişler yaratmasa ve onlar gibi robotların çalışmalarına "yaratma" denilmese de, insanlar yazma robotlarını keşfetmeyi asla bırakmadı.

Bazı algoritmalar yazıyor, bazı algoritmalar sessizce insan yazımını etkiliyor

"Bağlan" dan resim

Geçen yıl, Washington Üniversitesi ekibi aniden sahte haberlerle mücadele etmek için eğrisel bir yöntem düşündü - sahte haberleri tespit etmek için en iyi algoritmayı mı oluşturmak istiyorsunuz? Belki de yalan haber yazmada iyi olan bir algoritma yazmalıyız.

O zamandan beri Grover doğdu.

Sadece başlığı girin ve Grover bir parça sahte haber oluşturabilsin. "Fastcompany" editörü bir keresinde "Trump neden günde 100 şınav yapıyor?" Diye yazmıştı. "Başlık olarak, Grover'ın oynamasına izin verin:

Şınav dendiğinde akla gelen ilk imaj kesinlikle Amerika Birleşik Devletleri Başkanı değil.

Silahlı kuvvetlerin başkomutanı olarak Trump'ın sağlığı pek iyi değil. Başkan seçildikten sonra egzersiz yapacağına söz verdi ve "Flying Up" da, Trump'ın "Trump tarzı şınav" yapmasını engelleyebilecek hiçbir şey yoksa, Arnold Schwarzenegger'in tekniğiyle alay etti. .

Ancak Trump bile, işiniz sizin için ne kadar iyi olursa olsun, vücudunuzu kontrol etmenin son derece zor olduğunu kabul ediyor. Peki, silahlı kuvvetlerin başkomutanını doğru yolda yapan nedir? Cevap 100 şınav.

Bu pasaj uygunsuz görünse de, yine de Trump'ın konuşma tarzını iyi bir şekilde kavradığını ve oldukça "yaratıcı" olduğunu inkar edemez. Bunu görünce, Xiao Ai'nin yazdığı dizeleri de düşünebilirsiniz. Grover'ın makalesinin ilk yazarı Zellers, algoritma yazımındaki yaygın sorunları özetledi:

Yazı düzgün görünse de, Grover ve diğer sinirsel dil üreteçleri tarafından yazılan makaleler, makinelerin kökenlerini ortaya çıkaran, makinelere özgü dil tuhaflıkları içerir.

Algoritmalar tarafından yazılan makalelerin "tuhaflığı" yüzünden, insan yazarların ilham bulması için bir araç haline geliyorlar.

Romancı Sigal Samuel ilk olarak OpenAI'nin yazma algoritması GPT-2'yi meraktan denedi. Bu algoritma, bir kişinin giriş kelimelerine veya cümlelerine göre "bir konuşmayı kabul edebilir".

Samuel, algoritmadan gelen geri bildirimlerin çok rastgele olmasına rağmen, zaman zaman bazı beklenmedik içeriklerin ona ilham verebileceğini düşünüyor. Bu nedenle, "kabızlıktan ilham aldığında" bazen "hayal etmek" için GPT-2'yi kullanır:

Bir yazar olarak her zaman yaratıcı bir seminerde olamaz veya fikirleri tartışmak için doğru arkadaşları bulamazsınız. Bu yüzden, bir danışman ve işbirlikçi olarak böyle bir yapay zekaya sahip olmak iyidir.

Aynı zamanda, insan yazısının geleceğini daha ince bir şekilde şekillendirmesi muhtemel olan yazmayan algoritmalar da var.

Amerika Birleşik Devletleri'nde, öğrenci makalelerini puanlamak için algoritmalar kullanan okullar en az 21 eyalette bulunmaktadır. Bu algoritmaların "temeli", insan öğretmenler tarafından incelenen yüzlerce makale ve geri bildirimdir. Tıpkı röportaj algoritması gibi, bu makale değiştiren algoritmalar da önyargıyla suçlanıyor.

Vice'den resim

Ebeveynlerden, algoritmanın makaleleri düzeltme şeklinin çocuklarının yazmayı daha iyi anlamasını sağlamadığı, ancak yüksek puanlar karşılığında her türlü abartılı kelimeyi kullanmaya teşvik ettiği yönünde geri bildirimler var.

Ancak, algoritmik inceleme ile manuel inceleme arasındaki en önemli fark şeffaflıktır - bir makale manuel olarak incelendiğinde ve kafa karışıklığı veya anlaşmazlık ile karşılaştığınızda, makalenin içeriğini değiştiren kişiye bunun nedenini sorabilirsiniz. Ancak bir algoritma ise değerlendirme kriterlerini ve nedenlerini asla bilemeyeceğiz.

İster kendi başına yazmak için bir algoritma, ister insanlara yazmada yardımcı olmak için kullanılan bir algoritma olsun, bu araçlar ancak gelecekte artacaktır.

Belki de "dil tuhaflıkları" çok açıktır - bu, Lsjbot tarafından oluşturulan küçük parçaların "kuru hissi" veya Grover'ın "ilk bakışta pürüzsüzlüğü" olabilir, ancak bu iyi bir fikir olmamalı. Onları görmezden gelmemizin nedeni. Beğenseniz de beğenmeseniz de, insan yazısının yaratılışını değişen derecelerde etkileyecekler.

Nietzsche bir daktilo ile yazmaya başladığında, arkadaşları onun düzyazısının daha sağlam hale geldiğini ve bir tür "güçlü güce" sahip olduğunu keşfettiler. Ve kendisi de "yazma araçlarımızın düşünmeyi şekillendirmeye katkıda bulunacağına" inanıyor. Robotlu algoritmalar çağında yazımız nasıl gelişecek?

Resim Giphy'den

OPPO saatler yapar, hırs ekolojide yatar
önceki
Gündüz fayans ekleyen ve gece duvarları yıkan bu mühendisler, Apple'ın sırrını gökyüzüne taşıdı.
Sonraki
Red Magic 5G deneyimi: Çalışan oyun cep telefonu 144Hz çağına giriyor
Salgın başlangıç silahını ateşler, Alipay "yüz değişikliğine" başlar
Karanlık modun arkasında bilmediğin "kara tarih" var
Bu yerli yapay et firmasının ürünleri bugün paket servis olarak yenebilir.
Bir fincan kahvenin arkasındaki teknoloji
2000 balonundan ve 2008 mali krizinden kurtulduktan sonra Buffett bu sefer haklı mı?
vivo NEX 3S deneyimi: biraz taze, biraz ileriye dönük
Saç kurutma makinesinden sonra Dyson, İnanılmaz diye bağırmanıza izin veren başka bir saç düzleştirici yaptı.
Tüccarlar bir "kriz anı" ile karşılaşır: altın bile atılır ve dolar sıkıntısı baş gösterir
Küresel pazar üzüntülerle dolu: Bir hisse senetleri düştü ve "kaynaşma dalgası" devam ediyor (resim ve metin canlı yayın)
Piyasaya çıkmadan önce mutlaka okunması gereken bir şey ABD hisse senetleri dört günde iki kez kaynaşıyor ve küresel borsalar paniğe kapılıyor
Hizmet sektörü şirketlerinin% 80'i salgın sırasında zarar gördü ve çoğu şirket ikinci çeyrek hakkında iyimser
To Top