Vivo, yapay zeka araştırmalarında yeni ilerlemeyi duyurdu: cep telefonlarına "Glory of the King" oynamayı öğretmek

Cep telefonu yapmak için tek yürek var, kötü bir cep telefonu olmalı.

25 Ocak sabahının erken saatlerinde, destansı bir insan-makine savaşı "sessizce başladı". Makine adına, Google'ın AI şirketi DeepMind tarafından geliştirilen yeni AI programı AlphaStar, yeni AI programı AlphaStar'dı. Diğer taraf, 2018 WCS Circuit'te 13. sırada ve en güçlü 10 Protoss oldu. İnsan oyunculardan biri MaNa.

Sonuç, 2 yıldan daha uzun bir süre önce Go AI AlphaGo (DeepMind tarafından da geliştirilmiştir) gibidir.AlphaStar, 10: 1'lik bir rekorla insan profesyonel ustaları "tamamen kötüye kullandı".

"StarCraft 2" oyununun Go'dan çok daha karmaşık olduğunu bilmelisiniz: Örneğin, Go'da yalnızca 361 satranç pozisyonu vardır ve StarCraft 2, küçük bir 84x84 çözünürlük olsa bile çeşitli beceriler ve pozisyon kontrolü içerir. Ekranda ayrıca 100 milyondan fazla olası işlem var. Aynı zamanda, "StarCraft 2" oynama sürecinde, oyuncu tüm savaş alanının bilgilerini göremez, hatta kendi planlamanızı ve karar vermenizi yapmak için rakibin hareketlerini tahmin etmeniz ve tahmin etmeniz gerekir.

İnsanları yenmek zor ve AI'nın son birkaç yıldaki ilerlemesi "çok açık."

Aslında, insanlar yapay zekayı her zaman eksik bir şekilde kavradığından ve yapay zeka teknolojisi ve uygulama keşif süreci çoğu zaman çok fazla veri gerektirdiğinden, istenildiği zaman deneme yanılma yapılabilen ve çok sayıda insan verisi içeren video oyunları her zaman en iyi yapay zeka olarak görülmüştür. Deneysel platformlardan biri. Çünkü oyunun kendisi, insanların belirli bir beceri veya test beceri seviyesini kazanmalarına yardımcı olacak bir araç olarak kabul ediliyor.

Otonom sürüş gibi bazı özel yapay zeka yönlerinde, insanlar yapay zeka eğitimi için bir ortam olarak video oyunlarına benzer sanal bir dünya yaratmayı bile düşünüyor.

Yukarıda bahsettiğimiz DeepMind'in yanı sıra pek çok yerli firma aslında vivo dahil oyun ortamında yapay zeka yetiştirmeye çalışıyor ve ülkenin en popüler mobil oyunlarından birini hedefliyor. Bir: "Kralın Zaferi".

"Kralın Glory" ile savaşmak için AI eğitimi

Vivo'nun "Glory of the King" üzerindeki yapay zeka etkisi adına, "vivo AI Lab" Temmuz 2018'de kuruldu. İkincisinin kurulması, 2018'in başlarında vivo strateji konferansında vivo tarafından alınan bir karardı.

Bu "vivo AI Laboratuvarı" nda kullanılan pekiştirmeli öğrenme mimarisi

Bu "Kralın Glory" meydan okumasının arkasında, "vivo AI Lab" özellikle yeni bir katmanlı pekiştirmeli öğrenme modeli önerdi ve kullandı. Bu sinir ağı modeli, yalnızca insanları taklit ederek makro stratejiler formüle etmekle kalmaz, aynı zamanda pekiştirmeli öğrenmeye dayalı mikro işlemleri de sağlar. Özellikle gerçek zamanlı strateji oyunlarının (RTS) operasyonel gereksinimlerine uyum sağlayın.

"Zafer Kralı" söz konusu olduğunda, temel genel görüş, "nereye gideceğiz", "takım arkadaşlarını ne zaman desteklemeye gitmeliyiz", "takım arkadaşlarının takım savaşlarına ne zaman katılmaları gerektiği" vb. Önemli rafine operasyonlar arasında "ne zaman yanıp sönmeli", "büyük hamleyi ne zaman devretmeli", "çok oyunculu bir takım savaşında nasıl hareket edilir", "bir takım savaşında becerilerin nasıl serbest bırakılacağı" ve benzeri yer alır.

Bu iki işletim gereksinimi aslında oldukça farklıdır ve genel görüşün ölçülmesi ve hesaplanması aslında zordur, bu nedenle asıl önemli olan, ilk önce taklit öğrenme ve uzman rehberliği için insan verilerine başvurmaktır. Geliştirilmiş operasyonda, "vivo AI Lab" doğrudan "çoklu ajan" adı verilen bir takviye öğrenme yöntemini kullanır. Sanal takım savaşlarında, beceri sürümlerinde ve yalnızca en iyi performans gösterenlerin kalabileceği diğer operasyonlarda hareket eden yüzlerce robot olarak düşünebilirsiniz. Sürekli karşılaşma yoluyla, makine doğal olarak en uygun çalışma yöntemini öğrenir.

Nihai eğitim sonucu: Bilgisayarın açıldığını, hemen yanıp söndüğünü ve açmak için açıldığını ve tek seferde yapıldığını gözlemleyin (şekildeki kutu görüntü tanıma nesne çerçevesidir)

"Vivo AI Laboratuvarı" nın resmi sonuçlarına göre, bu sinir ağları serisi tarafından eğitilen model, 1V1 modunda% 100 kazanma oranı ile oyunda yerleşik AI'yı yenebilir ve 5V5 modunda bir AI ekibi gibi davranabilir. Daha iyi bir sinerji performansı.

Oyun yapay zekasına ek olarak, vivo daha fazlasını da "yapar"

Yeni derin öğrenme modelini denerken, "vivo AI Lab" de oyunun API arayüzünü kullanmak yerine daha zor bir yol seçti - oyundan çeşitli bilgileri doğrudan izlemeyi ve almayı seçti. Karakteristik veriler.

DeepMind, OpenAI ve Tencent AI Lab gibi şirketler ve kurumların tümü daha önce video oyunlarında yapay zeka zorlukları başlattı ve temel olarak oyunun API arayüzünü benimsedi. Yapay zeka, oyundaki her bir birimin ve ortamın verilerini görüntü analizi ve diğer yollara gerek duymadan doğrudan öğrenebiliyor ki bu da bir dereceye kadar "hile" olarak nitelendirilebilecek.

"AlphaStar" tarafından elde edilen oyun verileri açıkça çok özlü

Örnek olarak oyun performansında en iyisi olan DeepMind'in AlphaStar ını ele alalım, birim bilgilerini doğrudan görüntülerden elde etmiyor, oyun motorundan karakteristik bilgileri okuyor.Bu görüntüler, bir askerin veya fabrikanın nerede olduğunu doğrudan işaret ediyor.

"Vivo AI Lab", oyun verilerini toplamak için özel olarak tasarlanmış bir derin öğrenme ağı setidir

"Vivo AI Lab", "Honor of Kings" deki beş kahramanın özelliklerini yakalamak için başka bir derin öğrenme ağı seti kullanmayı seçti. Spesifik olarak, beş kahramana karşılık gelen büyük harita ve küçük harita verileri birleştirildi. Sinir ağı bilgileri çıkarır, çok hedefli tespit ile çıkarılan özellik vektörlerini birleştirir ve yukarıda bahsedilen katmanlı sinir ağına girer. Daha sonra her kahraman kendi durumuna ve çevresine göre farklı eylemlere karar verir ve kendi durumlarına karşılık gelen işlemleri gerçekleştirir.

Bu süreç göze çarpmasa da aslında yapay zekanın performansı üzerinde büyük bir etkiye sahip olabilir. Sonuçta, gerçek kullanıcılar bilgileri cep telefonlarında görüntülenen görüntülerle elde ederler Yapay zeka API arayüzlerinden bilgi alırsa, bu bilgilerin seviyesinin ve doğruluğunun insanların görüntülerden elde ettikleriyle tutarlı olmasını nasıl sağlayabilirsiniz?

Vivo'nun bu süreci doldurmak için fazladan çaba harcamasının nedeni, yapay zekanın ekrandaki görüntüyü görmekten gerçek operasyona kadar tüm insan sürecini tam olarak simüle etmesine izin vermek, böylece yapay zekanın çalışma ortamının sıradan kullanıcılara daha yakın olmasını sağlamaktı.

Dağıtılmış sinir ağı eğitim ortamı

Aynı anda birden fazla kahramandan veri toplamak ve tüm "Honor of Kings" yapay zeka modelinin örnekleme verimliliğini, örnek çeşitliliğini ve eğitim hızını iyileştirmek için "vivo AI Lab" ayrıca tam bir "dağıtılmış takviye öğrenme ortamı" oluşturdu: Cep telefonu, oyunun çalıştırılmasından, eyleminin yürütülmesinden ve veri toplanmasından sorumludur; bilgisayar, güçlendirme öğrenme algoritmasını ve eylem karar biriminin çalışmasını seçmek için cep telefonunu ve sunucuyu bağlamaktan sorumludur; bulut GPU sunucu kümesi, tüm sinir ağının çalışması ve depolanmasından sorumludur.

Bu ortamda, "vivo AI Lab" ayrıca, HTTP 2.0 çağındaki temel veri çerçevesi olan tamamen açık kaynaklı gRPC teknolojisini daha evrensel olarak doğrudan kullanır. Bu aynı zamanda "dağıtılmış pekiştirmeli öğrenme ortamının" tamamına büyük ağ oluşturma potansiyeli sağlar.

Notları aşma girişimi

Cep telefonu üreticilerinin oyun yapmak için kullandığı yapay zeka ilk başta gerçekten kafa karıştırıcı. Sonuçta, nihayet eğitilen yapay zekanın oyunlara veya gerçekliğe uygulanması pek olası değil.

Ancak, "vivo AI Lab" zorluğunun ayrıntılarına bakılırsa, bunu basitçe "oyun yapay zekası yapmak" olarak sınıflandırmak sizin için zordur. Oyunun API arayüzünü kullanmama ve bunun yerine oyun arayüzünün görüntüsünden veri alma seçimini örnek olarak almak, bu sadece teknik bir zorluk değil, aynı zamanda Vivo'nun bu AI girişiminin gelecekteki uygulanabilirliğine odaklanmasıdır.

Tüm derin öğrenme sürecindeki veriler doğrudan mobil terminalden örneklendiğinden, benzer oyunlara, benzer temel işlem gereksinimlerine ve benzer görüntü tanımaya sahip diğer oyunlara ek olarak, vivo da bu girişimle aynı mimariyi kullanabilir (mobil görüntü tanıma + Cep telefonlarında çeşitli senaryoları öğrenmek ve özetlemek için özel derin öğrenme sinir ağı + derin öğrenme ağ ortamı). Son olarak, vivo telefon sizi her yönden daha iyi anlayacaktır.

İkincisi, yapay zeka öğrenim ortamının tamamının veri iletimini oluşturmak için gRPC teknolojisini kullanmaktır. Mevcut yapay zeka geliştirme sürecinde, "yeterli örnek veri nasıl toplanır" ve "olabildiğince çok kullanıcının nasıl büyük çaba harcaması sağlanacağı" "Eğitimli sinir ağı" hala temel zorluktur. Bunları çözmek için "ağ oluşturma" tek uygulanabilir yoldur.

Yani bir bütün olarak bakıldığında, vivo'nun oyun yapay zekası yapma girişimi değil, gelecekteki cep telefonları için yapay zeka geliştirme girişimi.

Bu ileriye dönük ve cesur girişim, aynı zamanda vivo'nun her zaman ısrar ettiği şeydir. 2018 yılının Mart ayının başlarında, vivo, X21'de ilk kez "Jovi" yapay zeka asistanını piyasaya sürdü ve bu da doğrudan ekrandaki insanları, kuryeleri, manzaralı noktaları ve adresleri tanımlayabiliyor. Web sitesi adresleri gibi anahtar bilgiler; tek ekranlı "akıllı sahne", işe gidip gelme süresi, bilet otel rezervasyonları, adımlar ve hava durumu gibi bilgileri entegre etmede ve görüntülemede daha etkilidir. Eylül 2018'de vivo, Jovi'nin bir dizi akıllı ev ürününe kolayca uyarlanmasını sağlayan ve Jovi'yi "insanları ve dijital dünyayı birbirine bağlamanın" kontrol merkezi haline getiren yeni bir IoT stratejisi "Jovi Internet of Things" yayınladı.

Çünkü dünyanın sürekli dijitalleşmesinin mevcut ve gelecekte, insan bilişinin veri genişleme hızına ayak uydurması giderek zorlaşıyor.İnsan yeteneklerini geliştirmek için AI kullanmak önemli bir çözüm olacaktır. Ve vivo, açıkça, kullanıcılarının önce bu tür insanlar olmasına yardımcı olmak istiyor.

Wuhan'daki bir topluluğun 8. katında çıkan yangında, sakinlerin ısıtıcılarla giysi pişirmelerinden kaynaklandığından şüphelenilen yoğun duman yayılıyor.
önceki
Stanford Bao Zhenan ekibinin son atılımı, "yeni bir elektronik dünya" geliyor
Sonraki
Karayolu üzerinde bir grup ördekle karşılaşırsam ne yapmalıyım? Bu adamın yaklaşımı birçok netizeni övmeye çekti
95 sonrası "ileri ekip", yeni metro hattı için her yerde "hataları topluyor" ve kabadan sert kapağa geçişe tanık oluyor
Film temalı otel "Youxi", Seri A finansmanında 100 milyon RMB aldı; Pinduoduo, 3 milyar ABD doları tutarında finansman sağladı ...
Bitcoin çıktı! Yatırım olarak Ethereum daha da iyi olacak
3D baskı geleneksel yağlı boya tablolarla çarpışıyor, YiN / D resimlerin çerçeveden geçmesini istiyor
Sosyal + O2O: Sosyal görünümün dayanak noktasında, Yan Zhihui "yüz üstü yemek" i gerçeğe dönüştürmek istiyor
Qianjifeng'in kurucusu Tan Yichuang IMIO, üçüncü taraf akıllı donanımı "birleştirmek", çekirdek olarak AI uşağı ile akıllı bir ev ekosistemi oluşturur
Google Brain Papers: Makine öğrenimi aldatılacak ve kötü muhalif örnekler insanları kandırabilir mi?
Çin Bilimler Akademisi'nin yeni araştırması fare tümörlerini başarıyla "aç bıraktı"! Tamamen otonom bir DNA nanorobot oluşturun
Bahar Şenliği seyahati için tren biletleri açık! Her istasyonun bilet çıkış saatleri farklı, bu yüzden hemen yapamadım Günaydın Wuhan
Merkezi hükümet, gelecek yıl çabaları hızlandırmak için özel girişimlerin gelişimini destekliyor ve Wuhan'daki özel girişimciler başka bir "güvence" alacaklar.
Tencent Müzik, 12 Aralık'ta ABD'de listelenecek, Momo satılan verilere yanıt veriyor
To Top