Bu rüya gibi sokak sahnesinin tamamı AI tarafından şekillendirilmiştir (GAN saniyelerini pisliğe çevirir) Ekli kağıt

Li Shan Li Lin Derleyin ve organize edin

Qubit Raporu | Genel Hesap QbitAI

"Bütün görünüşler boşuna"

Almanya'daki bir sokağın yukarıdaki resmi ilk bakışta araç içi kamera ile çekilmiş gibi görünüyor, ancak aynı zamanda retro filtreli Google Street View'a benziyor.

Aslında bu kompozit bir resim.

Google Haritalar'da böyle bir cadde bulunamıyor. Bir sinir ağı, eğitim sürecinde gördüğü gerçek sokaklara dayanarak onu üretir.

GAN'dan daha güçlü

Bu fotoğrafı oluşturacak algoritma, Intel Labs tarafından hazırlanan yeni bir makaleden alınmıştır. Kademeli İyileştirme Ağları ile Fotografik Görüntü Sentezi , Fotoğraf oluşturmak için basamaklı optimizasyon ağı kullanın.

Makalede, Stanford Üniversitesi'nden Dr. Qifeng Chen ve Intel Labs'ın vizyon grubunun yöneticisi Vladlen Koltun, anlamsal düzene dayalı fotoğrafları sentezlemenin bir yöntemini gösterdi. Sözde anlamsal düzen, resimdeki çeşitli nesnelerin konumunu işaretleyen şu şekildedir:

Ve algoritmaları bir render motoru olarak değerlendirilebilir.Yukarıdaki resmi girmek, resmin ortasında bir yol olduğunu, yolda arabalar, üst kısımda ağaçlar, trafik ışıkları ve sağ üstte bazı yayalar olduğunu söylemekle eşdeğerdir ve ardından resimdeki talimatları izleyin. Düzen, gerçekçi bir fotoğraf çıktısı.

Chen Qifeng blogunda "Bir makinenin hayal ettiği bir resim gibi" dedi.

Alman caddelerine ait 3000 fotoğraf üzerinde eğitim aldıktan ve giriş düzeninde "araba" olarak işaretlenen kısımla karşılaştıktan sonra, birçok arabayı gören bu algoritma kendi başına bir araba oluşturacak ve orayı dolduracaktır.

Şimdi, görüntü üretme veya sentezleme söz konusu olduğunda, çoğu insan hemen düşman üretim ağını (GAN) düşünebilir. Bununla birlikte, Chen Qifeng ve diğerlerinin algoritmaları düşmanca eğitim kullanmaz, yalnızca uçtan uca eğitimli bir ön yüz kullanır. Ağı besleyin.

Yalnızca küçük boyutlu görüntüler oluşturabilen çeşitli GAN'ların aksine, önerilen yöntemleri 1024 × 2014 piksel görüntülerde bile yüksek çözünürlüklere "sorunsuz bir şekilde genişletilebilir".

Elbette, makalede algoritmalarının çeşitli GAN tabanlı üretken modelleri saniyeler içinde nasıl cüruf haline getirebileceğini de gösterdiler:

Bu makale, bu yıl Ekim ayında Venedik'te düzenlenen Uluslararası Bilgisayar Görme Konferansı ICCV 2017 için seçildi.Sözlü bir rapor vermek için, ilgili kaynak kodu GitHub'da zaten 402 yıldız aldı ve ayın başında GitHub Hot Project Python listesinin en üstüne ulaştı.

Gerçeklik, rüya

Cornell Üniversitesi Bilgisayar Bilimleri Bölümü'nde doçent olan Noah Snavely, derinden etkilendi. Gerçekçi yapay sahneler yaratmanın çok zor olduğunu söyledi. Bugün en iyi yöntemler bile bunu yapamaz. Ancak Chen Qifengin sistemi en büyüğü üretti En detaylı yapay sahne.

Bu teknolojinin insanların bir dünyayı tanımlamasına ve ardından yapay zekanın onu sanal gerçeklikte yaratmasına izin verdiğine inanıyor. "Sihir gibi gerçekçi sahneleri sadece yüksek sesle anlatarak çağırabilirseniz harika olur." Dedi.

Chen Qifeng, bu teknolojinin gelecek vaat eden bir geleceğe sahip olduğuna ve nihayetinde gerçek dünyayı gerçekten simüle eden oyun sahneleri oluşturmak için kullanılabileceğine inanıyor. Dedi ki: "Video oyunlarını işlemek için derin öğrenmenin kullanılması gelecekteki bir trend haline gelebilir" Şimdi, bu algoritmayı "Grand Theft Auto V" deki oyun sahnesinin yerini almak için kullanmaya başladı.

Ancak yine de bu sistemden memnun değil: Sentezlenen resim yeterince gerçekçi değil. Chen Qifeng, bu sinir ağının ayrıntıları işleme yeteneği hala beklentilerimizi karşılayamadığı için, şu anda üretilen resimlerin biraz bulanık, biraz rüya gibi olduğunu söyledi. Sistem işlevlerini iyileştirmeyi umarak daha büyük bir sürüm geliştiriyor.

Bu noktada Snavely, yazardan daha iyimser. Sanal gerçeklik sahneleri oluşturmaya gelince, bu rüya benzeri efektin mutlaka kötü bir şey olmadığını ve ille de tamamen gerçekçi bir etkiye ihtiyacımız olmadığını söyledi.

Daha çok beklediği şey, bu sistemin yolların ve iç mekan düzenlerinin dışında sahneler oluşturmasına izin vermektir. Snavely, sistemin potansiyelini gerçekten gerçekleştirmek için gerçek dünyanın çeşitliliğini gerçekten yakalayabilecek bir dizi veri setine hala ihtiyaç olduğunu söyledi.

Ama söylemesi yapmaktan daha kolay ... Bu sistemi dünyanın çeşitli sahnelerini oluşturmak için kullanmak istiyorsanız, eğitimde kullanılan resimleri detaylı olarak işaretlemek için çok fazla insan gücüne ihtiyacınız var.

Chen Qifeng hakkında

Bu makalenin yazarı Chen Qifeng, efsanevi bir deneyime sahiptir. Chen Qifeng, Haziran 1989'da doğdu ve Guangdong Eyaleti, Zhongshan Şehrinde büyüdü. İlkokulda Chen Qifeng, Ulusal Beste Yarışması'nda ikincilik ve Olimpiyatlarda birincilik ödülünü kazandı.

2006 yılında, 17 yaşındaki Chen Qifeng bir makale yayınladı ve Boyut Dengeli Ağaç (SBT) veri yapısını önerdi. 2007'de Chen Qifeng, IOI'de (sekizinci sıra) altın madalya kazandı; 2008'de Chen Qifeng, ortaokul öğrencisi olarak Zhongshan'da "En İyi On Genç" unvanını aldı.

Yine 2008'de Chen Qifeng, Tsinghua Üniversitesi'ne tavsiye edilme hakkından vazgeçti, Hong Kong Bilim ve Teknoloji Üniversitesi'ne girdi ve 540.000 Hong Kong doları tutarında tam burs aldı. Bu süre zarfında 22 bilgisayar kursunun tamamı A + aldı. 2010 yılında Chen Qifeng, Baidu Yıldız Programlama Yarışması'nda üçüncü oldu.

Chen Qifeng, 2011 yılında ACM Uluslararası Üniversite Öğrenci Programlama Yarışması'nda altın madalya kazandı (dünyadaki ikincisi, Kuzey Amerika şampiyonu). Aynı yıl Hong Kong Üniversitesi Öğrenci Programlama Yarışması'nı da kazandı.

2012 yılında, Stanford, Harvard, Massachusetts Institute of Technology, Princeton, University of California, Berkeley, Columbia, Cornell, UCLA ve University of Michigan-Ann Arbor dahil olmak üzere dokuz üniversite, Chen Qifeng'e tam burslu yüksek lisans derecesi için kabul edildi. Stanford'a kaydoldu.

Son olarak, Chen Qifeng'in Haziran ayında doktora mezuniyetinin fotoğrafını çekin.

İlgili Bağlantılar

Proje ana sayfası:

kağıt:

Kod:

https://github.com/CQFIO/PhotographicImageSynthesis

- Bitiş -

Samimi işe alım

Qubit, editörleri / muhabirleri işe alıyor ve merkezi Pekin, Zhongguancun'da bulunuyor. Yetenekli ve hevesli öğrencilerin bize katılmasını dört gözle bekliyoruz! İlgili ayrıntılar için lütfen QbitAI diyalog arayüzünde "işe alım" kelimesini yanıtlayın.

Qubit QbitAI

' ' Yapay zeka teknolojisi ve ürünlerindeki yeni eğilimleri takip edin

Takımda 3 All-Stars var, 3 veride takımda birinci ve 1,3 milyon tabandan yıllık maaşı çok pahalı değil.
önceki
Warcraft'ta ne gibi aptalca şeyler yaptın? İskelet Savaş Atı için siyah altın satın alarak, bir haftalığına bloke edildi!
Sonraki
Pekin Otomobil Fuarı'ndaki bu arabalar izlemek zorunda
Milli futbol takımı henüz dışarı çıkmadı, bu yüzden önce düşüyor Asya Kupası zaten tatsız mı? Lippi ününü dehşete düşürdü
2 yıl oyun oynamadıktan sonra, 37 + 22 nihayet yeteneklerini yerine getirdi ve ligdeki ilk oyuncu olmaya çalışıyordu!
Faker'den daha güçlü önlenemez! LOLun eski dünya şampiyonu orta koridorları artık başlamıyor
Tek bir sezonda en çok 50'den fazla olan kim? Harden 7! Ürdün 8! Kobe 10! En üstteki yer Kobe'den 4 kat fazla!
Futbol çemberindeki düşük akımlar? Dalian futbolunun vaftiz babası Yunnan'a gidiyor! Tüm öğrenciler bir milli takım kurabilir
Yize'nin çok genç olan ilk şovu online mobil terminalde oynandı
Sevimli, çekici ve çekici cheongsam kıyafetleri! Çin'deki en güzel iki boyutlu kızlar burada!
Yeni polisi ağırlamak için silah arkadaşlarına veda, 16 polis övüldü
Üçgen Canavar Paylaşım Kaydı Baş Bilimcisi: Tartışmalı Öğrenmeye Dayalı Üretken Diyalog Modeli
fanatizm! Sezon bitmedi, Harden, Curry'nin 3 sayılık şut rekorunu kırdı! Tarihte 1 numara!
Milli futbol takımı Luneng U23 ile ısınmak istiyor Orta ve ikinci kademe takımlar 2 gol attı Genç yetenek kaç gol atmayı planlıyor?
To Top