Otomatik olarak Twitter oluşturmada neredeyse hiç kusur yok! MIT, ünlü bir konuşma simülatörü yapmak için GPT-2 modelini kullandı

Bronz ruh, içbükey tapınaktan gelir

Qubit Üretildi | Genel Hesap QbitAI

Çeşitli ünlülerin tweet'lerini taklit etmek artık dakikalar içinde yapılabiliyor.

MIT'de araştırma bilimcisi ve derin öğrenme öğretmeni olan Lex Fridman yeni bir uygulama yaptı:

DeepTweets , Bir kişinin önceki Twitter içeriği aracılığıyla içeriği taklit edebilir ve otomatik olarak yeni sözde tweetler oluşturabilir.

10 saatlik paylaşımdan sonra 500'den fazla kişi netizen Lex Fridman'ın araştırmasını beğendi Netizen @ArthDubey, büyük miktarda veriye dayanarak arama, sorgulama ve tweet attığınızda eğiliminizi bir dereceye kadar çıkarmanın kolay olduğunu söyledi. Tahmin.

Sonuçları göster

DeepTweets'in sahte Twitter'ının gerçek etkisine bir göz atalım.

Örneğin, Twitter'da tüm yıl boyunca aktif olan "ağ ünlüsü" Musk'ı ele alalım. Musk daha önce çok katmanlı tüneller hakkında bir tweet yayınladı:

Çok katmanlı tünellerin temel avantajı, şehrin bir bölümünden diğerine katlanmış bir alan gibi bağlanan şeritleri herhangi bir yönde seçebilmenizdir.

Tamam, şimdi DeepTweets çalıyor. Şarkıcı Justin Bieber'ın tonunu taklit etti ve Twitter'a sahte bir cevap gönderdi:

Çok katmanlı tünellerin temel avantajı trafik veya yol yüzey suyu konusunda endişelenmenize gerek olmamasıdır Çok katmanlı tüneller bizi güvenli kılar.

Doğru, dil tutarlılığı veya içerik mantığı olsun, bu sahte tweet biraz kusursuz.

Amerikalı rapçi Kanye West'ten bir göz atın:

Çok katmanlı tünelin avantajı, robotun bilinmeyen faktörlerden korkmaması ve Elon'un hızlanmasıdır.

Evet, bu ev sahibi ile etkileşim için bile kullanılıyor.

Aşağıya bakınca Amerikalı kadın şarkıcı Kate Perry de eğlenceye katıldı:

Çok katmanlı tünellerin avantajı ... ödediğinizin karşılığını alabilmenizdir, ne düşünüyorsunuz bebeğim?

DeepTweets herkesin deyimine gerçekten hakim oldu ...

Bunun gibi pek çok örnek var mesela "Hayatın anlamı" ile başlayalım ve ünlülerin tweet'lerini taklit edelim:

Küçük erkek kardeşi Lex Fridman, Trump, Obama, Musk (Lex Fridman ile sıklıkla etkileşim kurar), talk show sunucusu Conan OBrien ve Alan De gibi birçok ünlü Twitter yanıt modelini eğittiğini söyledi. Bu modeller birbiri ardına piyasaya sürülecek.

GPT-2 başka bir katkı yaptı

Yazar, DeepTweets'in açık kaynak dil modeli olan GPT-2 üzerinde eğitildiğini söyledi. Dil modelleme görevinde, GPT-2 sadece gökyüzüne karşı var olur.

Herhangi bir alan verisi üzerinde özel olarak eğitilmemiş bir model olarak, belirli alanlar için oluşturulan modellerden daha iyi performans gösterir ve ana dil modelleme görevlerini süpürür.

Farklı dil modelleme görevlerinde GPT-2 test sonuçları (soldan sağa: veri kümesi adı, gösterge türü, GPT-2 test sonucu, önceki en iyi sonuç, insan seviyesi)

Basitçe söylemek gerekirse, GPT-2, Transformer mimarisine dayalı büyük ölçekli bir modeldir.

GPT-2, GPT algoritmasının GPT parametrelerinden 10 kat daha büyük olan, 1.5 milyara ulaşan ve veri hacmi 10 kat artırılan "evrimsel sürümü" dür. 8 milyon web sayfası içeren, toplam 40GB veri seti kullanır.

Bu devasa algoritma, dil modellemeyi bir eğitim sinyali olarak kullanır, bir Transformatörü büyük bir veri kümesinde denetimsiz bir şekilde eğitir ve daha sonra belirli görevleri çözmesine yardımcı olmak için modeli daha küçük bir denetlenen veri kümesinde ince ayarlar.

Yukarıdaki şeklin sol kısmı, çalışmada kullanılan Transformer mimarisi ve eğitim hedefidir. Doğru kısım, belirli görevler için ince ayarlanmıştır. Tüm yapılandırılmış girdiler belirteç dizilerine dönüştürülür, önceden eğitilmiş model tarafından işlenir ve ardından doğrusal + softmax katmanı tarafından işlenir.

GPT-2 söz konusu olduğunda, eğitim hedefi basittir: verilen metindeki önceki tüm kelimelere dayanarak bir sonraki kelimeyi tahmin edin.

Başlangıçta OpenAI, netizenler tarafından "ClosedAI" olarak alay edilen 117M'nin önceden eğitilmiş küçük bir modelini yayınladı. OpenAI, bunun açık kaynak olmadığını, ancak zamanın gelmediğini söyledi.

Geçtiğimiz ay OpenAI, 345M önceden eğitilmiş modelinin açık kaynağını ve Transformer'in 1.5B parametrelerini duyurdu.

Portal

Son olarak, GPT-2 ile ilgili öğrenim materyallerini ekleyin.

GitHub kod adresi:

https://github.com/openai/gpt-2

GPT-2 veri seti adresi:

https://github.com/openai/gpt-2-output-dataset

OpenAI tanıtım ana sayfası:

https://openai.com/blog/better-language-models/#update

Lex Fridman'ın GPT-2 açıklama videosu (bilimsel ziyaret gerektirir):

https://youtu.be/O5xeyoRL95U

- Bitiş -

Samimi işe alım

Qubit, editörleri / muhabirleri işe alıyor ve merkezi Pekin, Zhongguancun'da bulunuyor. Yetenekli ve hevesli öğrencilerin bize katılmasını dört gözle bekliyoruz! Ayrıntılar için, lütfen QbitAI diyalog arayüzünde "işe alım" kelimesiyle yanıt verin.

Qubit QbitAI · Toutiao İmzalama Yazarı

' ' Yapay zeka teknolojisi ve ürünlerindeki yeni eğilimleri takip edin

Pokemon'da hangi çelik serisi kalkanlar için uygun değildir? Büyük çelik yılan resimli kitaptan çıkmalı mı?
önceki
ICML'nin yeni araştırması, genelleme yeteneği değerlendirmesi için yeni bir indeks ortaya koyuyor: doğrudan vektör kosinüs mesafesinin yukarısına ve sorun değil
Sonraki
ESIM'den daha gelişmiş olan ISIM teknolojisi operatörlerde devrim yaratabilir
İhmal ölüme neden olur! Araç alev aldığında çağrıyı "sakinleştiren" adam gözaltına alındı
Tek tıkla soyulma AI şifre çözme: açık kaynak algoritması, Nvidia Berkeley tarafından araştırıldı, ne karmaşık ne de gizemli
CVPR en iyi makalesi için kısa listeye alınan bu temel yapay zeka araştırması bizi dişlere bakmamızı sağladı
"Pokemon" Xiaozhi beş kara elfini fethetti, bunlardan biri bir zamanlar ittifakın ana gücü müydü?
Benden farklı olarak güvenli değil. Apple bu sefer başka birinin pastasına dokundu.
Baojun CN202M resmi haritası yakın zamanda ortaya çıktı ve bu yılın ikinci yarısında listelenmesi bekleniyor
"Pokemon" duyguları her şeyi mi temsil ediyor? Her zaman yetkililer tarafından tercih edilen ilk nesil elfler hangileridir?
Çinli AI şirketinin konferans salonunun adının kısa bir geçmişi
Bilgi çalmak yerine, Baidu'nun Rus versiyonuna saldırmak için Prism Gate hacker yazılımını kullanın, sadece büyük bir V yüklemek isteyin, FBI yakalandı
Mustang Bojun, 1.5T + 6MT güç kombinasyonu ile performans versiyonu modelleri ekliyor
Pokémon'un Üç Sütunu'ndaki Regis Chiru, çelik bir sisteme sahip olduğu için en iyisi mi?
To Top