Biriktirilerek tasarlanan 1 milyar poster, Ali AI tasarımcısı "Luban" ın temel teknolojisi ayrıntılı olarak açıklanıyor

21 Nisan 2018 tarihinde Alibaba UCAN Kullanıcı Deneyimi Tasarım Forumu'nda "Luban" kurucusu ve Alibaba Akıllı Tasarım Laboratuvarı başkanı Le Cheng, "Luban" tasarım yeteneklerini izleyicilere sergiledi ve izleyiciler alkışlandı.

Bu, ana izleyici olarak tasarımcıların olduğu bir forumdur. Tasarımcılar için çalışmaları genellikle malzemeleri kırpma, resim boyutlarını ayarlama ve beyaz dengesini düzeltme gibi çok sayıda tekrarlayan el emeği gerektirir. Bununla birlikte, temelde "Luban" Yukarıdaki içeriğin çoğunu kapsayabilmek, tasarımcının ellerini büyük ölçüde serbest bırakır.

"Luban" Alibaba tarafından geliştirilmiş, kendi geliştirdiği bir tasarım yapay zeka ürünüdür.Şu anda toplam 1 milyar poster tasarlanmıştır. Leifeng.com'un AI Araştırma Ajansı'na göre, 2017 Double 11 döneminde Luban günde 40 milyon poster üretti ve her poster ürün görselinin özelliklerine göre özel olarak tasarlandı.

Le Cheng'e göre, "Luban" ın tasarım yeteneği, kıdemli tasarımcıların seviyesine yakın. "Luban" ın dört temel özelliğini açacaklar: tek tıkla oluşturma, akıllı oluşturma, akıllı düzen ve tasarım genişletme. Şu anda 100 ücretsiz kapalı betalar var. Kontenjan için luban.aliyun.com'a tıklayarak başvurabilirsiniz. Gelecekte tasarıma yeni başlayanların bile "Luban" üzerinden tek bir tıklama ile kendi posterlerini oluşturabileceklerini söyledi.

"Luban" ın çekirdek algoritma teknolojisi, Alibaba Dharma Akademisi'nin Makine Zekası Teknoloji Laboratuvarı tarafından geliştirilmiştir.Londra Koleji, Tsinghua Üniversitesi ve Zhejiang Üniversitesi ekiplerine pekiştirmeli öğrenme, grafik tasarım estetiğinin kantitatif değerlendirmesi ve bilgi grafikleri konularında katılmıştır. Derin öğrenme, gelişmiş öğrenme, Monte Carlo ağaç araması, görsel arama ve diğer teknolojiler ve büyük miktarda tasarım verisi sayesinde, "Luban" kendi kendine çalışma yoluyla tasarım yetenekleri kazanabilir.

Leifeng.com AI Araştırma Enstitüsü, "Luban" ın üç temel bölümden oluştuğunu öğrendi: planlama ağı, mobil cihaz ve değerlendirme ağı.

Resim: "Luban" öğrenme stili

Ağı planlamanın temeli, tasarımcının yaratıcı tasarım şablonundan ve temel öğe malzemelerinden gelir.Tasarımcı, çok sayıda tasarım malzemesini yapılandırılmış verilerle işaretleyecek ve sonunda bir alan + görsel tasarım çerçevesi oluşturmak için bir dizi yapay zeka ağı aracılığıyla öğrenecek.

Şekil: Öğe sınıflandırıcı, girdi malzemesini tanır ve sınıflandırır

"Luban" tarafından alınan tasarım gereksinimlerine göre, aktör, öğrenme ağından tasarım prototiplerini çıkarır, öğe merkezinden öğeleri seçer, birden çok optimal üretim yolunu planlar ve çıkarır ve resim tasarımını tamamlar.

Şekil: Luban eylem cihazı optimum tasarım üretimini planlıyor

Değerlendirme ağının çalışma prensibi, Luban'ı tasarımın kalitesini değerlendirmek üzere eğitmek için çok sayıda tasarım resmi ve puanlama verisi girmektir.

Şekil: Değerlendirme puanı

Alibaba'nın akıllı tasarım laboratuvarının başkanı olan Le Cheng, esas olarak "Luban" ın verilerinden, ürünlerinden, tasarımından ve işlerinden sorumludur ve Dharma Akademisi'nin makine zekası teknoloji laboratuvarında kıdemli bir algoritma uzmanı olan Xingtong, algoritma teknolojisi ve arka plan vizyon oluşturma motor sisteminden sorumludur. Veri analizi ve işleme, çevrimiçi ve çevrimdışı süreçler ve çeşitli makine öğrenimi algoritmaları üzerine araştırmalar dahil. Leifeng.com Yapay Zeka Araştırma Enstitüsü, aşağıda özetlenen "Luban" ın arkasındaki teknik ayrıntıları onlarla tartıştı.

Soru: "Luban" ileri insan tasarımcılar seviyesine ulaşmak üzere, bu tasarım seviyesi nasıl ölçülüyor? Özel hususlar nelerdir?

Cevap: Lubanın tasarımı insan girdisine bağlıdır. Girdi seviyesi çıktı seviyesini belirler. "Luban" ı eğitmek için özel bir ekibimiz var. Şu anda, onu öğrendikten sonra orta düzey tasarımcı seviyesine ulaşabilir. İleri seviyeye ulaşmak istiyorsanız, kullanmanız gerekir. Bu yılın ikinci yarısında daha büyük ölçekli verilerin hayata geçirilmesi bekleniyor.

Tasarım seviyesinin ölçülmesi için, birden çok boyutu göz önünde bulundurmamız gerekir:

Birincisi, tasarım rasyonalitesi ve estetik perspektifinden bakıldığında, bu tasarım endüstrisinin tasarımcıların seviyesini yargılaması için daha genel bir standarttır.

İkincisi, oluşturulan resimleri kullanmanın etkisi nedir?

Üçüncüsü, estetik ve sanat açısından buradaki farklı insanların farklı görüşleri olabilir, bu kısım da tasarımcıların değerlendirmeye katılmasını gerektirir.

Soru: 2015'in sonundaki başlangıcından bu yana "Luban" projesi için en önemli zaman noktaları nelerdir?

Cevap: Genel olarak üç düğüm vardır.

  • Luban'ı iki yıldan daha uzun bir süre önce geliştirme fikrimiz vardı ve ilk düğüm olan ilk demoyu yaptık.

  • İkinci düğüm 2016'da Double Eleven'dır. Bu sistemi gerçek ölçekte uygulamak istiyoruz.O zaman grubun özel senaryoları için bir versiyon geliştirdik.Bu versiyonun en önemli katkısı, onu büyük ölçekte gerçekten destekleyebilmektir. Çevrimiçi sistem.

  • Ama o dönemde "Luban", Ali'nin dış hedef gruplarının ihtiyaçlarından farklı bazı senaryolarını hedefliyordu ve daha sonra bu alanda araştırma ve geliştirmeye ağırlık verdik, şimdiye kadar farklı grupların ihtiyaçlarını karşılayabilir. Bu üçüncü daha önemli düğümdür.

Zaman birikimi, giderek daha fazla kaynak girdisi ve herkesin sıkı çalışması sayesinde, Luban artık belirli senaryolarda çok iyi sonuçlar elde edebiliyor.

Soru: "Luban" ın donanım gereksinimleri nelerdir?

Cevap: "Luban" GPU'lara dayanır ve şu anda yüzlerce GPU gerektirir. Aynı zamanda, bu sistem ölçeklenebilirdir.Çift Eleven olaylarının en yoğun olduğu dönemde, daha fazla GPU gerekir, ancak normal zamanlarda nispeten daha azdır.

Soru: "Luban" sisteminin tasarım sürecinde gerekli olan ham veri miktarı nedir?

Cevap: 2016'da Double Eleven'da 170 milyon afiş tasarlamak için "Luban" kullandık, bu nispeten erken bir keşifti. 2017'de Double Eleven'da "Luban" 400 milyon poster tasarladı. O sırada ondan fazla tasarımcıdan oluşan bir ekibe yatırım yaptık. Bunlar, Double Eleven'ın gereksinimlerini karşılayan az sayıda öğe ve temel veri oluşturacaklardı. Bir yandan, o zamanki tohum verilerinin büyüklüğü bin mertebesindeydi, uygulama ölçeğinin genişletilmesiyle, tohum verileri de büyüklük sıralarına göre genişletildi.

Soru: Verilerin etiketlenmesi açısından çok fazla işçilik maliyeti gerekiyor, bu sorunu nasıl çözüyorsunuz?

Cevap: Genel olarak, başlangıç aşamasının tohumları (çok fazla insan girdisi gerektiren veriler) ilk aşamada vazgeçilmezdir, ancak Luban, kendi kendini değerlendirme yeteneklerine sahip, gelişen bir kapalı döngü sistemidir.Makine tarafından üretilen verilerin bir kısmı doğrudan kullanılabilir. , Daha sonra temizlenebilecek, düzenlenebilecek ve manuel katılımla işaretlenebilecek başka bir bölüm daha var. Gün geçtikçe daha fazla veri işlendikçe algoritmanın gücü güçlenecek ve güçlenecek, işçilik maliyeti düşmeye devam edecek, bundan sonra sistem daha iyi ve daha iyi olacak ve veriler bir kartopu gibi ilerleyecektir.

Soru: "Luban" sistemini destekleyen temel teknolojiler nelerdir?

Cevap: "Luban" sistemini AI algoritmalarının bir konsantrasyonu olarak düşünebilirsiniz.

  • Bu sistem, tasarım verileri için sınıflandırma ve bölümleme algoritmaları dahil olmak üzere daha karmaşıktır;

  • Çevrimiçi plan oluşturulduğunda, bazı sıralı öğrenme algoritmaları vardır;

  • Aynı zamanda, bazı çok-ajanlı pekiştirmeli öğrenme algoritmaları da kullanılmaktadır;

  • Ayrıca bazı GAN yöntemlerini de kullanıyoruz;

  • Büyük ölçekli geri alma veya özellik ifadesi gibi bir dizi başka yöntem vardır.

Algoritma düzeyinde, temel olarak nispeten yeni teknolojileri ele alıyoruz. Ek olarak, büyük ölçekli dağıtılmış veri işleme teknolojisini de kullanacağız.

Soru: "Luban" ın arkasındaki temel teknik zorluklar nelerdir?

Cevap: "Luban" sistemini incelemek için iki yıldan fazla zaman harcadık, çünkü daha önce başvurulacak iyi durumlar yoktu ve birçok teknoloji ve çözümü kendi başımıza araştırmak zorundaydık.

Endüstride üretim için GAN'ın kullanıldığı birçok durum olsa da, bu teknolojiler hedefimize, kontrol edilebilir dijital içerik üretmeye ulaşamıyor.

Ek olarak, sadece kontrol edilebilirliği karşılamakla kalmamalı, aynı zamanda kullanıcıların istediği içeriği üretebilmeliyiz, aynı zamanda resim kalitesini ve üretim hızını da sağlamalıyız.

Buna ek olarak, birkaç tipik sorun vardır: orta yapıyı kaba yapıda ince yapıyı oluşturmak için çok etmenli pekiştirmeli öğrenmenin nasıl kullanılacağı; çeşitli öğeleri tanımlamak için bazı özel özelliklerin nasıl kullanılacağı; ve en temel görüntü anlayışı ve nesnesi Segmentasyon sorunları.

Şu anda, "Luban" sistemi genel bir derin öğrenme algoritması gibi olamaz. Hedefe doğrudan uçtan uca ulaşabilir. Nispeten, mantığı daha karmaşıktır ve tek bir algoritma hedefimize ulaşamaz.

Soru: Daha önce bahsedilen çok ajanlı pekiştirmeli öğrenme, bu teknolojiyi "Luban" da özel olarak açıklayabilir mi?

Cevap: Bu, UCL Wang Jun'un ekibiyle işbirliği yaptığımız bir tekniktir.

Spesifik olarak, sistem, kullanıcının ihtiyaçlarına göre çok kaba bir sonuç elde edecektir. Örneğin, bir resmi veya bir hedefi birden çok bileşene dönüştürür. Bu bileşenler, öğeler veya nicel birimler olarak adlandırılabilir ve şu şekilde değerlendirilebilir: Bir temsilci için, bu temsilciler tek başına sonucun iyi mi yoksa kötü mü olduğuna karar veremez, yalnızca birden fazla temsilci aynı anda karar verebilir. Bunun kombinatoryal bir optimizasyon problemi olduğu düşünülebilir ve burada çok etmenli pekiştirmeli öğrenme teknolojisi kullanılacaktır.

S: Gelecekte mevcut algoritmalara dayalı olarak ne gibi iyileştirmeler ve yenilikler yapılacak?

Cevap: Gelecekte hala çalışılması gereken birçok alan var.

Birincisi, bir dizi GAN öğrenimine, özellikle de fotoğraf seviyesi ve piksel seviyesi oluşturma algoritmalarına dayanarak, akademi veya endüstri ile sürekli işbirliği ve deneyler yapmayı umuyoruz.

İkincisi, sistemimiz hala çok karmaşık, bu nedenle tüm yönleri daha verimli hale getirmek için daha iyi bir sistem mühendisliği yöntemi bulmak istiyoruz.

Üçüncüsü, bilgi grafikleri tasarlama alanında, onu daha eksiksiz ve esnek hale getirmek için dış dünya ile işbirliği yapmayı umuyorum.

Dördüncüsü, üretim etkisini daha iyi ölçmeyi umuyoruz. Tasarım düzeyini ölçmek zordur. Burada bazı keşifler ve iyileştirmeler yapmayı umuyoruz.

Şimdiki vizyonumuz, "ne düşünüyorsun görüyorsun", yani kullanıcıların ne istediği, "Luban" nasıl bir imaj oluşturduğu. Aynı zamanda, çeşitli senaryolar için HP ile gerçek zamanlı, çevrimiçi ve verimli bir şekilde yüksek kaliteli görüntüler üretebilen yardımcı bir sistem oluşturmayı da umuyoruz.

Nisan ayında NSO üyeleri için ücretsiz FC oyunları: "Super Mario Bros. 2", "Fist Fighting" ve "Star Warrior"
önceki
Redmi 4'ün 4 Kasım'da piyasaya sürüleceği söyleniyor: Redmi Pro'nun düşük profilli versiyonu
Sonraki
En iyi otomobil şirketleri ile işbirliği yapan Daimler, Audi, Volvo, Ali Tmall Elf, otomobil ve ev ara bağlantısını başlattı
"Altın Kardeş" Kanton fragmanının Hong Kong versiyonunu ifşa ediyor, kardeşlik bu hayatta ve bir sonraki hayatta bir gizem haline geliyor
Gionee M6 güvenlik amiral gemisi yol açar: yüksek değerli cep telefonu çift onbir satın al satın al!
Duygusal zekası yüksek bir pirinç çiftçisi olmak nasıl bir deneyim?
A'dan B'ye tarz, yeni nesil Sagitar, yeni orta sınıf araba satın almanın sıkıntılı noktalarını vurabilir mi?
Gündüz ve gece, yoğun otoyollar Bahar Şenliği için günlük rutinidir.
Youku ile diyalog: iQiyi'yi tebrik ederiz, listelemeden listeden çıkarmaya kadar geçen yolu geçtik
Meizu kutusu ambalajından çıkarma deneyimi: samimi bir güzellik ve kullanım kolaylığı
"Mission Impossible 6" gişede toplam brüt yaklaşık 700 milyon oldu
Vivo X9 ön çift kamera SLR fotoğraflar çekiyor: dünyanın ilk IMX376 sensörü
Bai Baihe erkek modeli aldattı! Kavun yiyiciler Yu Fan'ın pozisyonunu açıklamasını bekledi ama onun düşündüğü şey...
Tüm sıcak noktalardan kaçınan tam ekran olmayan bir Meizu 15 olduğunuzu onayladım
To Top