g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

"Sarı fırtına" videosu psikolojik gölgeyi gösteriyor, içerik incelemeciler AI tarafından kurtarılabilir mi?

Yeniden basıldı: Büyük Veri Özeti

Yazar: Liu Junhuan

Bu makale 4423 Word, önerilen okuma 8 dakika.

Bu makale, yapay zekanın video içeriğinin incelenmesinde büyük bir fark yaratıp yaratmayacağını açıklamaktadır.

Video çağı geliyor.

Bu hafta yayınlanan "2019 Douyin Veri Raporu", Douyin'in günlük aktif kullanıcı sayısının 400 milyonu aştığına işaret etti. 2019 yılında YouTube tarafından yayınlanan verilere göre dünya genelinde günlük aktif kullanıcı sayısı 1,9 milyarı geçti.

Büyük miktarda video içeriğinin ortaya çıkmasıyla birlikte, şiddet içeren ve pornografik içerik de İnternet'e girdi ve kullanıcıların video taramasında bir "saatli bomba" haline geldi.

Yapay zekanın her şeyi güçlendirdiği bu çağda, yapay zeka video içeriğinin incelenmesinde büyük bir çaba gösteriyor gibi görünüyor.

2018'de Facebook, içeriği anlamak için derin bir sinir ağı mimarisi kullanan DeepText'i başlattı; YouTube, pornografi ve şiddet içeren yasa dışı videoları izlemek ve silmek için uzun süredir Content ID'yi başlattı ve yıllar boyunca bu teknolojiye 100 milyon dolardan fazla para harcadı. Pek çok medya bile, büyük miktarda veriyi düzenleme yeteneği sayesinde yapay zekanın yakın gelecekte manuel incelemenin yerini alacağını tahmin ediyor.

Ama gerçekten durum bu mu?

Kısa süre önce, tanınmış denizaşırı teknoloji medyası TheVerge, Google'ın Austin, ABD'deki manuel içerik inceleme ekibini ziyaret etti. Çok sayıda şiddetli eleştiri nedeniyle ekip üyelerinin korkunç travmasını bildirdi.

Youtube video incelemesi hiçbir şekilde basit bir iş değildir.

Şu anda, dünyada yaklaşık 50 milyon bağımsız YouTube içerik oluşturucusu var ve dakikada video yükleme uzunluğu 500 saate kadar çıkıyor, bu da video yorumculara büyük bir çalışma baskısı getiriyor.

Austindeki toplam Google denetçisi sayısı şu anda Yüzden fazla insan , Çoğunlukla şiddet içeren pornografi gibi ekstrem videoları incelemekten sorumludurlar.Aynı zamanda, inceleme ekibi, iş yardımı için Orta Doğu'dan düzinelerce düşük ücretli göçmenle donatılmıştır.

Verimliliği sağlamak için Austinin içerik inceleme ekibi Herkes her gün 5 saatten fazla şiddet içeren pornografi izlemelidir , Denetçinin saatlik maaşı 18.50 ABD Dolarıdır ve yıllık maaşı yaklaşık 37.000 ABD Dolarıdır, ancak son iki yılda herhangi bir artış olmamıştır. YouTube CEO'su Susan Wojcicki medyaya Google'ın geçen yıl içerik incelemecilerinin günlük iş yükünü 4 saate düşürme sözü verdiğini ancak henüz uygulanmadığını açıkladı.

Aşırı videolara uzun süre maruz kalması nedeniyle, Google ekibinin eleştirmenleri ağır psikolojik travmaya maruz kaldı. Google, denetçiler için birinci sınıf tıbbi hizmetler ve avantajlar sağlasa da, birçok denetçi yine de tespit edilecektir TSSB ve uzun süreli kaygı gibi zihinsel sorunlardan muzdarip olmak .

Not: Travma sonrası stres bozukluğunun tam adı olan TSSB, kendisini veya başkalarını içeren bir veya daha fazla fiili ölüm yaşayan, tanık olan veya bunlarla karşılaşan veya ölümle tehdit edilen veya ciddi yaralanma veya fiziksel bütünlüğe yönelik tehditle karşılaşan bir kişiyi ifade eder Daha sonra, bireylerin neden olduğu ruhsal bozuklukların gecikmiş görünümü ve kalıcılığı.

Video incelemeciler her gün ne izler?

Benim izlenimime göre, yorumcunun işi, kullanıcılar tarafından web sitesine yüklenen videolara bakmaktır, ki bu muhtemelen ... her gün vibratoyu kaydırarak kolayca para kazanabilirsiniz, rüya gibi bir iş olduğu söylenebilir.

Ancak ister YouTube ister Çin olsun, video incelemesi Özet kadar iyi değildir.

Zhihu'da ilgili konuların sayfa görüntülenme sayısı 167951'e ulaştı. Bunların arasında netizen @white, "IŞİD'in rehine öldürme videosu beni utandırdı. Afrika halkının cani tarafı beni korkuttu. Çok korkuyorum, ABD karanlık olduğunda korkunç bir renk yayıyor! Belki de insanın özü öldürüyor. Boğazları çılgınca kesilen insanlar, koyu kırmızı kan yavaşça akıyor ve Japon intiharının derin ormanındaki iğrenç cesetler ... "

Konu bağlantısını bilin:

https://www.zhihu.com/question/24738486

Benzer şekilde, YouTube içerik incelemecileri olarak işleri kolay değildir.

YouTubeun içerik incelemecisi Peter, TheVerge'e her gün şiddet içeren aşırılıkçılık video incelemesinden sorumlu olduğunu söyledi. Bu, tüm inceleme çalışmasının en iç karartıcı bölümü olduğu söylenebilir. Yukarıda belirtildiği gibi, Google inceleme ekibi için bir inceleme ekibi geliştirdi. Sıkı çalışma planı, yeterli miktarda şiddet içeren pornografik video izlemelidir.

"Her gün birinin insanları hacklediğini veya akrabalarınızı ve arkadaşlarınızı vurduğunu görürsünüz," dedi Peter, "Bu dünyanın çılgın olduğunu düşüneceksin, seni Rahatsız hissedin ve yaşamaya devam etmek bile istemeyin . Neden birbirimize böyle davranmalıyız? "

Geçen yıl, Peter ve meslektaşlarının yaşamları büyük ölçüde etkilendi. Bir meslektaş acı çekiyor Nevrasteni , Başka bir meslektaşım işyerinde anksiyete ve depresyondan muzdaripti, yemek yeme, iş ve dinlenme yavaş yavaş bozuldu ve sonunda Akut vitamin eksikliğinden muzdarip Tedavi için hastaneye kaldırılmalıydı.

Yalnızca Peter ve meslektaşları değil, başka bir video incelemecisi olan Daisy, Google videolarındaki terörizm ve çocuk istismarı içeriğini incelemekten sorumluydu. Bunu yaptıktan sonra çocuklarla iletişim kurmakta zorluk çekti. Bir psikiyatrist tarafından teşhis edildikten sonra, TSSB teşhisi kondu ve hala tedavi görüyor .

Raporlara göre, gözden geçirenler iş başvurusunda bulunduklarında, genellikle aşırı videoların nasıl fiziksel ve zihinsel zarara yol açabileceğini anlamıyorlar. YouTube incelemecileri tarafından açıklanan içeriğe bakılırsa, Google'ın adaylara açıkladığı inceleme ve iş gereksinimleri sayısı genellikle çok düşüktür .

Google, tam zamanlı denetçiler için ilgili sağlık hizmetleri standartları oluşturmuş olsa da, işi ve yaşamı ciddi şekilde etkileyen psikolojik sorunları çözmek için aylarca izin alabilirler, ancak bu yalnızca Google içinde bildirilen bir durumdur. Dünya çapında daha fazla bildirilmemiş vaka var. Bildirilen içerik incelemecisi psikolojik travma geçirdi ve şirket tarafından acımasızca görmezden gelinmiştir.

AI, video incelemecilerini kaydedebilir mi?

Yapay zekanın video denetimlerine katılımı son yıllarda yeni değil, 2000 civarında şirketler bunu yapmaya çalışıyordu. Ancak o sırada video incelemesi, sarı kabuğun alan dağılımı gibi yapay olarak belirlenmiş özellikler ve kurallar gerektiriyordu. Derin öğrenmenin gelişmesine kadar video incelemesi nihayet "esnek" hale gelmedi.

Bununla birlikte, video incelemesinde, mevcut endüstri hala genel olarak "insan-makine kombinasyonu" yaklaşımını benimsiyor ve el emeği bunun önemli bir bölümünü oluşturuyor.

YouTubeun algoritma mühendisi, YouTube'daki videoların çoğunun hala manuel olarak incelenmesi gerektiğini ortaya çıkardı. İncelenen videolardan bazıları AI tarafından tespit edildi ve bazıları da kullanıcılar tarafından bildirildi. Sonunda, profesyonel bir denetçinin ihlal olup olmadığını kontrol etmesi gerekir. .

İQiyi'nin algoritma mühendisi Leo'nun tanıtımına göre, şu anda sektörde iki yaygın "insan-makine işbirliği" denetim yöntemi bulunmaktadır:

Yapay zeka, görece belirli videoları sınıflandırır, ardından bazı kullanıcılara önerilerde bulunur ve kullanıcı tepkilerini gözlemler; bunların arasında ilk önce yüksek profilli videolar manuel olarak incelenir;
Diğeri ise yapay zekanın videoyu "iyi" veya "kötü" olarak işaretlemesidir. İnceleyen kişi "kötü" olarak işaretlenmiş bir videoyla karşılaştığında, videoyu dikkatlice inceleyecek ve bu da inceleme verimliliğini artıracaktır.

IQiyi şu anda ikinci modeli benimsiyor. Video, makine denemesi ile ön değerlendirmeye alınacak ve ardından ilk deneme ve inceleme manuel olarak yürütülecektir Makine denemesinin sonuçları esas olarak işçiliğe yardımcı olmak için bir referans olarak kullanılır ve ayrıca bir video envanter mekanizması da vardır.

Yapay zekanın manuel incelemenin yerini aldığı argümanına gelince, Leo bunun çok erken olduğuna inanıyor. Yapay zeka, nesnel videoların incelenmesinde yeterince iyi bir iş çıkarsa da, bağlam ve anlambilimle ilgili öznel içeriği içerdiğinde, uzatılacaktır.

AI denetiminin iki teknik zorluğu vardır, biri Algoritma doğruluğu sorunu . Sektörde bir söz vardır: "Veri seti olmadan doğruluktan bahsetmek hayduttur." Bu, veri setiyle eğitilen AI modelinin gerçek davranışla eşleşmediği ve kullanıcı davranışı sapması gibi birçok etkileyen faktör olduğu anlamına gelir. AI incelemesinin doğruluk oranı% 99'a ulaştı. Kullanıcılar tarafından yüklenen videoların miktarı göz önüne alındığında, kümülatif miktarın kalan% 1'i de şaşırtıcı.

Bir eksiklik olduğunda, video sitesi büyük riskler taşıyacaktır.

Başka bir zorluk da İçeriğin öznel yargısı . Basitçe söylemek gerekirse, tüm müstehcen içerik pornografik değildir ve tüm pornografik videolarda çıplaklık yoktur. Ek olarak, video içeriğinde yer alan metin ve ses karışıktır, bu da insanların yargılaması için daha kolaydır, ancak Makineler için birden fazla algoritmanın çakışması gerekir.

Leo bize, örneğin ses içeriğini işlerken bir yandan metne dönüştürmek için ASR'yi kullanmamız gerektiğini, diğer yandan hırıltı gibi bazı anlamsız sesleri içeren sesi sınıflandırmamız gerektiğini söylüyor. Resimde hala metin görünüyorsa, metni videodan çıkarmak için OCR kullanmanız gerekir, ancak sonunda metni anlama olan NLP'yi kullanmanız gerekir.

Bu nedenle, manuel inceleme hala tüm inceleme alanının hayati bir parçasıdır. İQiyi tarafından yapılandırılan profesyonel inceleme ekibi, esas olarak kullanıcılar tarafından yüklenen videoların içeriklerinin taranmasından ve ulusal yasalara, düzenlemelere ve platform standartlarına uymayan içeriğin taranmasından sorumludur.

Hassas içerik mi tanımlıyorsunuz? AI: Cariye yapamaz

AI denetimleri için, AI için hala çözülemeyen yukarıdaki doğruluk ve öznel içerik yargılarına ek olarak, hassas içeriğin tanımının kendisi de göz ardı edilemeyecek önemli bir nedendir.

Çin'de, yasadışı içerik genellikle Radyo, Film ve Televizyon Devlet İdaresi tarafından eşit şekilde düzenlenir. Video web siteleri kural tanımında pasif görünürler. Radyo, Film ve Televizyon Devlet İdaresi tarafından belirlenen standartlara göre sıkı bir şekilde kendi kendini incelemeleri gerekir. Hatta bazı şirketler radyo ve televizyon okumak için özel yasal danışmanlık pozisyonları bile kurarlar Genel İdare'nin politikası.

Küresel ölçekte, kendi hassas içeriklerini tanımlamaktan daha fazla video web sitesi sorumludur. Ama tam da daha büyük inisiyatiflere sahip oldukları için daha büyük sorumluluklar üstleniyorlar. Küresel ölçekte birleşik bir denetim standardı istemek kuşkusuz çok zor bir iştir.Yerel kültürel faktörler dikkate alınmazsa, ciddi durumlarda, video web siteleri hükümet ve halkla şiddetli bir savaşa girecektir.

Örneğin, Temmuz 2018'de Endonezya hükümeti, Douyin'in uluslararası versiyonu olan popüler kısa müzik video prodüksiyon uygulaması TikTok'u yasakladı. Kısa bir süre önce, ABD ordusu da güvenlik nedenleriyle TikTok'u açıkça yasakladı.

Endonezya medyasında çıkan haberlere göre Endonezya hükümeti, uygulama çok fazla olumsuz video içerdiği için TikTok'u yasakladı ve Hindistan ve Asya'daki kamuoyu duyarlılığı genellikle TikTok'un gençler tarafından kullanılmasına karşı çıkıyor çünkü bazı videolar gençler üzerinde kötü bir etkiye sahip olacak. Videolardan biri şöyle: Dansla başladı ve sonra kamera aniden bir cesedi kesti.İlgili departman tarafından yapılan incelemeden sonra cesedin fotoğrafçının akrabası olduğu ortaya çıktı.

Ölümle ilgili yukarıda bahsedilen videolara ek olarak, aşağıdaki videolar dünya çapında oldukça ihtiyatlı:

Şiddeti teşvik eden dini nefret söylemi
Sahte haberler ve siyasi amaçlarla yayılma
Bireylere / kuruluşlara karşı karalayıcı dil

"Video şiddeti" ile ilgili içeriğin yanı sıra, "video pornografisi" tanımı da son derece öznel ve keyfidir. Daha önce Instagram "erkek meme uçlarına" izin veriyordu ancak "kadın meme uçlarını" yasaklıyordu, bu da birçok kadının yazılımı protesto etmesine neden oluyordu.

Instagram ile karşılaştırıldığında, bazı sosyal ağ sitelerinin kuralları çok "gevşek" görünüyor ve bazı özel durumlarda çıplak davranışlara izin veriyorlar.

Örnek olarak içerik kurallarını kısa süre önce güncelleyen Tumblr'ı ele alalım. Bundan bazı ilginç açıklamalar görülebilir: "Yasaklanmış içerik, insan cinsel organlarının fotoğraflarını ve videolarını, meme uçlarını gösteren kadınları ve resimler dahil olmak üzere cinsel davranış içeren her türlü medyayı içerir. Koşullar arasında çıplak klasik heykeller ve çıplakların yer aldığı siyasi protestolar yer alır. Yeni yönergelerde metin hariçtir ve pornografiye yine de izin verilmektedir. Cinsel davranış açıkça tasvir edilmediği sürece, çıplak resimlere ve sanat eserlerine yine de izin verilmektedir. Aynı şey emzirme ve doğum sonrası fotoğraflar için de geçerli. "

Burada ayrıca Facebook ve Reddit dahil olmak üzere dünya çapında büyük trafiğe sahip dört sosyal platformun "pornografi" ve "çıplaklığı" ile ilgili ilgili kuralları da karşılaştırabilirsiniz:

Görülebileceği gibi, farklı değerlere, hizmet kullanıcı gruplarına ve kültürel duyarlılıklarına dayanarak, onlara özel kurallar ve istisnalar sağlamak gerekir. Diğer bir deyişle, içeriğin öznelliği nedeniyle, bir kez ve herkes için küresel bir içerik standardı yaratmak çok zor ve zordur.

AI içerik inceleme çalışmasında ne yapabilir?

Pek çok sınırlama ve eksikliğe rağmen, AI denetimlerinin engellenmemesi genel bir eğilimdir.

Şu anda, içerik incelemesi açısından AI, spam ve kötü niyetli mesajlar gibi aşırı metin içeriğini değerlendirebilir ve tespit edebilir.Bazı sosyal platformlarda AI, yasadışı görüntüleri de yakalayabilir ve hatta bağlamsal anlayışa dayalı olarak taciz ve zorbalığı araştırabilir. .

Ancak, içerik incelemesi için AI kullanılırken aşağıdaki üç hususa dikkat edilmelidir:

İçeriğin gözden geçirilmesi, kültürel farkındalık ve ilgili topluluğun "standartlarının" bağlamsal olarak anlaşılmasını gerektirir. Yapay zeka ön koşullandırmayı gerçekleştirebilir ve manuel incelemenin iş yükünü azaltmaya yardımcı olabilir, ancak manuel katılım yine de vazgeçilmez bir bağlantıdır.
AI, halkın güvensizliği, özellikle bilinçsiz insan veya teknolojik önyargılarla karşı karşıya. Ek olarak, algoritmalar ihlalleri tespit edemeyebilir. Buna cevaben, bir yandan algoritmayı düzenli olarak analiz etmek ve ayarlamak gerekirken, diğer yandan paydaşlar AI'nın şeffaflığını sağlamalıdır.
Biçimlerin çeşitliliği ve içeriğin karmaşıklığı nedeniyle, kullanıcı tarafından oluşturulan video içeriğinin analiz edilmesi gittikçe zorlaşıyor. İhlalleri tanımlamak için bir bütün olarak yorumlanmaları gerekiyor. Kullanıcı davranışını daha iyi anlamak ve yasadışı ve zararlı içerik tanımını zamanında güncellemek için, paydaşların daha iyi kültürel farkındalık ve bağlamsal anlayış kazanmalarına yardımcı olan veri setlerini platformlar ve hizmet sağlayıcılar arasında paylaşmak en iyisidir.

İdeal bir durumda, AI yukarıdakilerin hepsini yapabilirse, işe yarayacak mı?

Tekrar içerik incelemesine dönelim Yapay zeka incelemesi büyük ölçüde optimize edildiğinde ve incelemecinin iş verimliliği büyük ölçüde iyileştirildiğinde, inceleme ekibinin psikolojik sorunları hala beklemede görünüyor.

Görüşme sırasında, daha doğru ve kullanışlı bir inceleme algoritması tasarlamak için video inceleme ekibine ek olarak, algoritma mühendislerinin de günlük olarak çok sayıda şiddet içeren pornografik video izlemesi gerektiğini ve bu nedenle kaçınılmaz olarak bundan etkilendiklerini öğrendik. Teknolojik ilerlemeyi kimse durduramasa da, Medyanın ve halkın büyük umut duyduğu yapay zekanın büyümesi, kişisel fedakarlıklar da taşımaya mahkumdur. .

Teknolojik torrentin izleyicileri olarak, denetçilerin veya algoritma mühendislerinin çalışmalarını değiştirme hakkımız veya yeteneğimiz yok, ancak en azından bu gruba daha fazla dikkat verebiliriz. Daisy'nin dediği gibi: "Bu çalışmaya katılmak için daha fazla insana ihtiyacımız var, ancak Bu kişileri desteklemek ve sorunların üstesinden gelmeleri için araçlar ve kaynaklar sağlamak için tüm sistemi ve çalışma yapısını değiştirmeye daha fazla ihtiyaç vardır Aksi takdirde sorun daha da kötüleşecektir. "

İlgili raporlar:

https://www.theverge.com/2019/12/16/21021005/google-youtube-moderators-ptsd-accenture-violent-disturbing-content-interviews-video

-Bitiş-

Tsinghua-Qingdao Veri Bilimi Enstitüsü'nün resmi WeChat kamu platformunu takip edin " THU Veri Pastası "Ve kız kardeş numarası" Veri Pastası THU "Daha fazla ders avantajı ve kaliteli içerik elde edin.

Büyük veri! 2020 Bahar Şenliği Yolcu Akışı Tahmini ve Analizi burada

TMD2019: Baytlar radikal bir şekilde atıyor, Meituan sessizlikte bir servet kazanıyor, Didi adını almak için mücadele ediyor