Bilgelik içeriği her yıl düzenlenir
Giriş: MIT-IBM Watson Yapay Zeka Laboratuvarı tarafından geliştirilen "GAN Paint Studio", AI aracılığıyla fotoğraflardaki nesneleri ekleyebilir, silebilir ve değiştirebilir.
Smart Things, 1 Temmuz'da yapay zeka ve derin öğrenmenin geliştirilmesinin, görüntü son işlemenin ilerlemesi için yeni olanaklar sağladığını bildirdi. MIT-IBM Watson Yapay Zeka Laboratuvarı, kullanıcıların herhangi bir fotoğrafı yüklemesine ve tasvir edilen nesnenin görünümünü kendi iç düşüncelerine göre düzenlemesine olanak tanıyan, halka açık bir araç olan "GAN Paint Studio" geliştirdi.
Bu araç, görüntü işleme alanında büyük bir ilerlemedir, ancak aynı zamanda belirsizlikle de doludur, ancak yine de, AI görüntü işleme alanında bir devrim yaratır.
GAN Paint Studio arayüzü
Yeni araştırmalar, yapay zeka ve makine öğreniminin görüntü sonrası işlemenin gelişimi için yeni umutlar getirdiğini gösteriyor. Nvidia mühendisleri kısa süre önce bir yapay zeka sisteminin (GigGAN) ince havadan ikna edici ve gerçekçi manzara fotoğrafları oluşturabileceğini gösterdi ve Microsoft bilim adamları geçen ay doğal dil ifadelerine dayalı görüntüler oluşturabilen teknik bir çerçeve önerdi.
MIT-IBM Watson Yapay Zeka Laboratuvarı kısa süre önce, kullanıcıların herhangi bir fotoğrafı yüklemesine ve tasvir edilen binaların, bitki örtüsünün ve armatürlerin görünümünü kendi iç düşüncelerine göre düzenlemesine olanak tanıyan halka açık bir araç olan "GAN Paint Studio" geliştirdi. . Etkileyici olan, yerleşik bir araçla yeni bir nesne eklemek, aslında yakındaki nesneler üzerinde bir etkiye sahip olmasıdır (örneğin, ön plandaki ağaçlar arkalarındaki yapıyı gizleyecektir).
MIT Bilgisayar Bilimi ve Yapay Zeka Laboratuvarı'nda doktora öğrencisi olan David Bau, "Mevcut makine öğrenimi sistemi bir kara kutu gibidir. Nasıl geliştireceğimizi her zaman bilmiyoruz. Bu eski TV setlerini vurarak tamir etmeniz gerekiyor gibi" dedi. İlgili alanlarda araştırmaların ön saflarında yer alan bir yazar olduğunu söyledi. "Bu araştırma gösteriyor ki, TV'yi parçalara ayırıp tüm kablolara bakmak korkutucu olsa da, daha anlamlı bilgiler olabilir."
GAN Paint Studio düzenleme örneği
Peki nasıl çalışıyor? Giriş fotoğrafı göz önüne alındığında, GAN Paint Studio'nun temelini oluşturan makine öğrenimi sistemi ilk önce onu gizli bir temsil arayarak yeniden işler, böylece orijinal fotoğrafla neredeyse aynı bir fotoğraf oluşturabilir. Kullanıcılar, fotoğraflarını dönüştürmek için görüntü düzenleme ayarlarının araç setine tıkladıklarında, sistem gizli gösterim formunu güncelleyecek ve her düzenlemeye göre değiştirilen sonuçları sunacaktır.
Bu modelin geliştirilmesi, GAN içindeki nesnelerin türleriyle ilgili tanıma birimlerinin (kapılar gibi) tanımlanmasını gerektirir.Bu, örnekleri üreten bir jeneratör ve üretilen örnekleri gerçek örneklerden ayırt etmeye çalışan bir ayırıcıdan oluşan iki parçalı bir sinir ağıdır. Araştırmacılar, bu birimleri ortadan kaldırmanın belirli hedeflerin kaybolmasına mı yoksa görünmesine mi yol açacağını anlamak için ayrı ayrı test ettiler ve farklı birimleri izole ederek genel görüntü kalitesini kademeli olarak iyileştirmeye çalıştılar.
Makalenin ortak yazarı ve IBM araştırma bilimcisi Hendrik Strobelt, "Daha önce, GAN'lar gerçekçi olmayan görüntüler ürettiğinde, kimse nedenini bilmiyordu" dedi. "Bu hataların belirli birimlerin bir kombinasyonu tarafından tetiklendiğini gördük ve şimdi bu birimlerin ifadesini gizleyerek görüntü kalitesini iyileştirebiliriz."
Daha önce bahsedildiği gibi, bu sistem nesneler arasındaki ilişkiler hakkında bazı temel kuralları öğrenir. Mantıksal olarak birbiriyle ilişkili olmayan şeyleri (gökyüzündeki pencereler gibi) yerleştirmez ve ayrıca içeriğe göre farklı görsel efektler oluşturur. Örneğin, GAN Paint Studio'dan iki farklı binaya kapı eklemesini istemek aynı kapıların görünmesine neden olmaz, tamamen farklı görünebilir. Ve bu buzdağının sadece görünen kısmı. GAN Paint Studio ayrıca kapalı başucu lambalarını "açabilir", ilkbahar veya sonbahar için çalıları yeniden yerleştirebilir, dairelerin içine pencereler yerleştirebilir ve binalara çatı kubbeleri ekleyebilir.
Ekip, daha sofistike GAN tabanlı dinamik boyama araçlarının bir gün tasarımcıların görsel efektleri dinamik olarak ayarlamasına izin vereceğine ve bu da bilgisayar grafik editörlerinin belirli bir resim için gerekli nesnelerin düzenlemesini hızlı bir şekilde oluşturmasına olanak tanıyacağına inanıyor. Elbette, bu teknolojinin kötüye kullanılabileceğini de kabul ediyorlar, ancak devam eden araştırmanın kötüye kullanımı önlemenin en iyi yolu olduğunu iddia ediyorlar.
Makalenin ortak yazarı ve MIT'de bir CSAIL doktora sonrası öğrencisi olan Zhu Junyan (harf çevirisi), "Rakibinizi savunmadan önce tanımanız gerekiyor," dedi. "Bu anlayış, yanlış görüntüleri daha kolay tespit etmemize yardımcı olabilir."
Haziran ortasında, Adobe ve California Üniversitesi, Berkeley'den araştırmacılar, Photoshop'un Yüze Duyarlı Sıvılaştırma aracının yüz ifadesi resimlerini değiştirdiğini fark edebilen bir yapay zeka programını detaylandırdı. (Testte doğru tanıma oranının% 99 kadar yüksek olduğunu, eğitimsiz insanlar için ortalama başarı oranının% 53 olduğunu iddia ediyorlar). Ek olarak, Güney Kaliforniya Üniversitesi Bilgi Bilimi Enstitüsü'nden bilgisayar bilimcileri, anormal eylemleri ayırt edebilen bir sistem tasarladı. Bu sistem, yapay zeka yazılımı tarafından üretilen sahte videolardaki anormal eylemleri yakalayabilir.
Yapay zekanın gelişimi, görüntü işleme için yeni olanaklar getirdi.GAN Paint Studio, AI aracılığıyla fotoğraflardaki nesneleri ekleyebilir, silebilir ve değiştirebilir. Bu teknoloji, görüntü işleme alanında büyük bir gelişmedir.
Ancak bu teknoloji, diğer AI teknolojileri gibi suistimal edilme potansiyeline sahiptir, ancak araştırmacıların söylediği gibi, sürekli araştırma kötüye kullanımı önlemenin en iyi yoludur.
Makale kaynağı: venturebeat