IJCAI 2018 Uluslararası Reklam Algoritması Yarışması Göç Öğrenimi Şampiyonayı Kazandı, Çin Birinci, İkinci ve Üçüncü Oldu

Xinzhiyuan Raporu

Kaynak: IJCAI-18 Alimama Uluslararası Reklam Algoritması Yarışması

Yayıncı: Wen Qiang

Xin Zhiyuan Rehberi IJCAI-18 Alimama Uluslararası Reklam Algoritması Yarışması geçen hafta sona erdi ve Çin'den gelen ekip birinci, ikinci ve üçüncü oldu. Şampiyon programı bir transfer öğrenme yöntemi kullanır ve temel kod yalnızca bir sayfadır.

IJCAI 2018 Alimama Uluslararası Reklam Algoritması Yarışması geçen hafta başarıyla sona erdi. 50'den fazla ülke ve bölgeden 6.000'den fazla oyuncudan oluşan 5.300'den fazla takım (700'den fazla yurt dışından) katıldı.

Çin takımı ilk üçe girdi.

Aslında finallere giren sekiz takımın tamamı Çin'den.

Alimama başkan yardımcısı Zhang Qin, son savunmada yaptığı konuşmada, bu, Çin'in tüm İnternet algoritmalarının büyük veri ve yapay zeka araştırma ve geliştirmesinde uluslararası ile senkronize olduğunu ve hatta gelişmiş olduğunu gösteriyor.

Şu anda, büyük şirketler, akademi ve sektördeki en iyi yetenekleri çekmek için veri, araç ve gerçek iş senaryoları sağlayan algoritma yarışmaları düzenlemektedir.

Google'ın, Microsoft'un Github'u satın alması olan Kaggle'ı satın alması, en büyük faktörlerden biri ikincisinin geliştiricilerinde yatıyor.

Algoritma rekabetinin kendisi daha geniş bağlamda bir rekabettir.

Reklam tahmin algoritması: Yüz milyarlarca dolar değerinde akademik bir problem

IJCAI ve Ali'nin yarışmalarda uzun yıllara dayanan bir işbirliği geçmişi var. IJCAI'nin tam adı Uluslararası Yapay Zeka Konferansı'dır.Makine öğrenimi, hesaplama sürdürülebilirliği, görüntü tanıma, ses teknolojisi, video teknolojisi vb. Konuları kapsayan yapay zeka alanındaki en iyi akademik konferanslardan biridir ve akademik çevrede yüksek bir üne sahiptir.

Geçtiğimiz yıllarda IJCAI, Alibaba Group ile rezerve edilmiş bir proje haline gelen makine öğrenimi yarışmaları düzenledi. IJCAI konferansının temsilcisi ve Sydney Teknoloji Üniversitesi Veri Bilimi Okulu Dekanı Profesör Zhang Chengqi, Alibaba'nın Alibaba'ya dikkat etmesi için daha fazla insanı çekiyor ve IJCAI, Alibaba yarışmasıyla IJCAI için daha fazla ilgi ve destek çekiyor.

Bu yılki yarışma, Alimama ile ortaklaşa düzenlendi ve Şubat ayı başlarında resmi olarak başlatıldı. En fazla katılımcıya ve en geniş kapsama sahip olan yarıştı Antarktika dışında 6 kıtadan yarışmacılar var .

Bu yılın Nisan ayındaki kayıt durumu itibariyle oyuncu kapsamı çok geniş.

Bu algoritma yarışmasının teması reklamcılıktır.

Mevcut İnternet ekosisteminde, arama reklamcılığı en yaygın kullanılan pazarlama yöntemlerinden biridir. Reklamverenler, ürün için birkaç anahtar kelime belirler ve ardından ürünü, bu anahtar kelimeleri arayan kullanıcılara önerir. İstatistiklere göre, 2017 sonu itibariyle, arama ağı reklamcılığının toplam geliri 100 milyar ABD dolarını aşarak toplam İnternet reklamcılığı gelirinin% 50'sinden fazlasını oluşturuyor. Arama ağı reklamcılığı, Google ve Facebook gibi çoğu İnternet şirketine gelirin çoğuna katkıda bulunur.

Arama reklamcılığı, muazzam ticari değeri ve araştırma değeri ile çok sayıda uzman ve akademisyenin ilgisini çekmiş ve akademik alanda kapsamlı bir şekilde incelenmiştir.

Bu rekabet, Ali e-ticaret reklamcılığını araştırma nesnesi olarak alır ve Ali Mom tarafından sağlanan devasa gerçek işlem verilerini, kullanıcının satın alma niyetini, yani reklamın dönüşüm oranını tahmin etmek için bir tahmin modeli oluşturmak için kullanır.

Karmaşık bir ekosistem olarak, e-ticaret platformu Kullanıcı davranış tercihi, ürünlerin uzun kuyruklu dağıtımı ve sıcak etkinlik pazarlaması gibi faktörlerin tümü, dönüşüm oranı tahmininde çözülmesi zor problemlerdir. .

Yarışmanın jüri üyeleri Xinzhiyuan'a bu tür bir iş senaryosunun farklı olduğunu ve katılmanın zorluğunun farklı olduğunu söyledi; metin alaka düzeyine odaklanan geleneksel arama motorundan farklı olarak, alışveriş senaryosunda modelin kullanıcı niyetlerini daha iyi anlaması gerekir. anlayış. Bu nedenle, yarışmacılar kullanıcının davranış özelliklerini tam olarak analiz etmeli ve özellik tasarımı ve teklifinde daha fazla yeniliğe sahip olmalıdır.

Mama Ali bu yarışmayı çıkardı İşlem senaryolarında kullanıcının gerçek verileri , Kullanıcının gerçek serileştirilmiş alışveriş davranışını içerir. Ön tur yaklaşık 600.000 veri setine sahipti ve finaller 10 milyonu aştı.

Şampiyon teknoloji paylaşımı: reklam dönüşüm tahmini yapmak için aktarım öğrenme yöntemini kullanma

5 Haziran'da finale giren sekiz takım, Hangzhou'daki Alibaba merkezinde son savunmalarını yaptı.

Oyuncuların ortalama yaşı 25 yaşın altında, üniversitelerden ve endüstriden, bu oran yaklaşık yarı yarıya. Maç öncesi ankete göre çoğu kişi ilgi ve egzersiz nedeniyle katıldı.Tabii ki bazı insanlar mezun olduktan sonra Alimama için çalışmak istediklerini açıkça belirtti.

Şanghay Jiaotong Üniversitesi'nde yardımcı doçent olan Zhang Weinan, Bilim ve Teknoloji Bakanlığı'nın bulut bilişim uzmanları grubunun üyesi Xue Guirong, Tianyang Intelligent'in kurucusu ve CEO'su, Alibaba araştırmacısı Wu Bo, Alibaba algoritma uzmanı Yang Hongxia ve Alimama kıdemli algoritma uzmanı Liu Kaipeng, savunmaya jüri olarak katıldı.

Yarışmanın hakimleri, bir bütün olarak Bu yarışma için planların çoğu oldukça sistematik . Oyuncular veri analizinde çok fazla iş yaptılar ve iş senaryolarını tam olarak anladılar. Özellik mühendisliğinde çok detaylı ve kapsamlıdır ve ayrıca birçok yeni ve özel özellik tasarımları da vardır. Model seçiminde veri ölçeği ve iş özellikleri tam olarak dikkate alınır ve model seçimi makuldür.

Yarı final sonuçlarına ve saha savunmasının performansına göre birincilik, ikincilik ve üçüncülük ödüllerinin her biri için bir ödül ve iki yenilik ödülü seçildi.

  • Büyük ikramiye : KÖPEK (Hua Zhixiang)
  • ikinci ödül : Mavi Balina Yanan Tütsü Takımı (Zhou Yao; Li Zhi; Guo Pengbo)
  • Üçüncülük ödülü : Yalan Takım (Chen Bocheng, Zhejiang Teknoloji Üniversitesi; Robin Li, Orta Güney Üniversitesi; Wu Hao, Tianjin Üniversitesi)
  • İnovasyon Ödülü (iki):

i) Stajlar için iş bulmak yasaktır (Zhang Weimin, Institute of Computing Technology, Chinese Academy of Sciences; Zhuang Xiaomin; Chinese Academy of Sciences; Li Haoyang, Hong Kong University of Science and Technology)

ii) Qiangdong Ekibi (Li Qiang, Jilin Üniversitesi; Shen Dongdong, Shandong Üniversitesi; Jiang Haoran, Orta Güney Üniversitesi)

Şampiyon programı: transfer öğrenmeyi kullanın, temel kod sadece bir sayfadır

Jüriyi etkileyen şey, bu yarışmanın şampiyon takımıydı - bir "takım" olmasına rağmen sadece bir kişi vardı, Hua Zhixiang.

Şampiyon Hua Zhixiang ve yarışma hakimleri

Hua Zhixiang, veri yarışmalarında deneyimli bir kişidir ve yurtiçi ve yurtdışında çoklu algoritma yarışmalarında şampiyonluğu kazanmıştır. Sloganı / sloganı da çok basit: "Tek kelime, yap şunu."

Jüri, DOG'un programın en büyük özelliğine ilişkin genel görüşünün çok kısa olduğunu ve tasarım fikirlerinin net olduğunu söyledi. Bu yarışmada test verilerinin ve eğitim verilerinin dağıtımındaki farklılığa yanıt olarak, bu çözüm, eğitim verilerini kullanmak için bazı aktarım öğrenme yöntemlerini kullanır. Özellik tasarımında parlak noktalar var, Birçok özelliği birleştirmek için şiddet yoktur, ancak veri özellikleri için çok kısa bir özellik tasarımı . Proje de çok kısa ve kodun tamamı iyi bir pratikliğe sahip olan tek bir sayfadır.

Şampiyon şeması modeli şematik

Bu kez, rekabet soruları, Taobao platformu iş senaryoları ve farklı trafik özellikleriyle birleştirilerek, günlük dönüşüm oranı tahmini (ön) ve özel tarihlerdeki (final) dönüşüm oranı tahmini olarak ikiye ayrılır. Ön eleme turu, 8. günü tahmin etmek için ilk 7 günün kayıtlarını sağlamak, yarı finaller ise 8. günün öğleden sonrasındaki durumu tahmin etmek için ilk 7 gün ve 8. günün sabahı kayıtlarını sağlamaktır.

Hua Zhixiang, analiz sayesinde, ön turun dönüşüm oranının temelde her gün benzer olduğunu, ancak yarı finallerde ilk 7 ve 8. günün çok farklı olduğunu buldu. Bu duruma dayanarak finalde bir model yaptı, Transfer öğrenme yöntemini kullanarak, 1. günden 7. güne kadar olan verileri kullanarak, 8. günün sabah ve öğleden sonrasını tahmin edin ve her ikisi birlikte tahmin edin .

Özellikler açısından, dört tür istatistiksel özellik, zaman farkı özellikleri, sıralama özellikleri ve karakterizasyon özellikleri kullanılmaktadır. İstatistiksel özellikler, kullanıcının tıklama sayısı, görüntülenen sayfa sayısı, aranan saatler ve tıklanan kategori sayısıdır. Zaman farkı, kullanıcı ile ürün öğesi arasındaki zaman mesafesidir; gerçek bir senaryoda, kullanıcının zamanını yalnızca son seferden kullanabiliriz, bir sonraki seferde kullanamayız. Oyunun tamamında, bunun belirli bir veri penetrasyonu vardır. Yani nihayet kullanılan şey, kullanıcının belirli bir kategoriyi, son seferden ve sonraki seferden tıklamasıdır. Sıralama özelliği, kullanıcı ile ürün öğesi arasındaki etkileşimlerin sayısıdır. Son olarak, etkileşimli özellikler ne kadar yakınsa satın alma olasılığı o kadar yüksek olacak şekilde, kullanıcının ilgilendiği özellikleri ve tıklanan ÖĞE'nin sahip olduğu özellikleri karakterize edin.

Nihai kod yalnızca bir sayfadır.

Yenilikçi çözümler: özellik tasarımı ve uçtan uca model

Özellikle yarışmada en yüksek inovasyon puanlarına sahip iki takımı, yani yasaklı stajyer takımı ve özel ödülü kazanan güçlü doğu takımı tanıtıyoruz. İki ekipten biri özellik tasarımında daha yenilikçiydi ve diğeri modellerin kullanımında daha yeni bir model uyguladı.

Bunların arasında staj ekibi yasaktır Kullanıcının Taobao sahnesindeki ticari eşya mağazalarına sıralı göz atma davranışını tam olarak araştırdı , Kullanıcının serileştirme davranışının özelliklerini tasarlamak için yeni bir yöntem önerdi ve daha iyi sonuçlar elde etti.

Güçlü doğu ekibi, CVR tahmin problemini çözmek için end2end'in derin öğrenmesini kullanmaya çalıştı.Diğer ekiplerle karşılaştırıldığında, daha yenilikçi ve önerilen yöntem endüstrinin mimarisine yakın.

NN modeli büyük veri altında büyük avantajlara sahip olacaktır.Manuel tasarım özelliklerine dayalı geleneksel makine öğrenimi çözümlerinin aksine NN, daha az eğitim süresi, küçük bellek ayak izi ve manuel tasarım özelliklerine ihtiyaç duymadan CVR veya CTR tahmin problemlerine uygulanır. , Uçtan uca eğitim elde etmek için, verilerden otomatik olarak üst düzey özellikleri çıkarın. Bu şemada, eşit olmayan uzunluktaki çok değerli Alan özellikleri, orijinal seyrek özellikleri eşlemek için aynı uzunluğu doldurmak için dolgu yoluyla Gömme katmanına girilir.DIN ağı fikrine dayanarak, çok değerli özellikleri ağırlıklandırmak için bir Dikkat katmanı oluşturulur. Birinci dereceden LR katmanı, tekli özellikleri öğrenmek için modele eklenir, ikinci dereceden FM katmanı ikinci dereceden geçiş özelliklerini öğrenir, MVM katmanı sonsuz sıralı geçiş özelliklerini öğrenir ve yüksek dereceli doğrusal olmayan kombinasyon ilişkilerini öğrenmek için derin bir katman eklenir.

Xinzhiyuan 300.000 Okuyucu Anketi

Topluluğa katıl

Xinzhiyuan AI teknolojisi + endüstri topluluğunun işe alımında, AI teknolojisi + endüstrisiyle ilgilenen öğrenciler küçük bir WeChat asistanı hesabı ekleyebilirler: aiera2015_3 Gruba katılın; incelemeyi geçtikten sonra sizi gruba katılmaya davet edeceğiz. Topluluğa katıldıktan sonra, grup açıklamalarını değiştirmeniz gerekir (isim-şirket-pozisyon; profesyonel grup incelemesi katıdır, lütfen anlayın).

Rolls-Royce SUV üretmek üzere, Ferrari Chrysler'in acelesi yok
önceki
Jeep Rehberi: Kenarları ve köşeleri düzelttikten sonra, rekabet gücüne bakın
Sonraki
Ağır! Hanchuan'ın iki kasabasına ilçe düzeyinde idari yetki verildi!
Qichen T90 "Ucuz Nissan" şapkasını çıkarabilir mi?
Wu Dajing bir faulden hüküm giydi ve oyun dışındaydı. Maçtan sonra ceza inanılmazdı. Kore'de böyle olmasını beklemiyordum
Bugünlerde sana bir araba ödünç verebilecek arkadaşlar, aşkı ve adaleti önemseyen gerçek erkeklerdir.
Çin'de öl! Tarihin en eksiksiz yemek haritası, kaç tane yedin?
Turing Ödülü sahibi olma ihtimali, Moore Yasasını ne kurtarabilir?
Kalibrasyon mühendisinin gözünde Jeep Freeman nasıl bir araba?
Musk ile birlikte gizemli bir organizasyon oluşturmak için insanlığın ve yapay zekanın geleceğini yeniden yazıyor
En Çinli kim | Ailesine dönüş
İlkbaharda Çin'deki en güzel 10 üniversite, geri dönmek ve bir ilişki kurmak istiyorum!
Muhtemelen Jaguar XFL'nin en kapsamlı değerlendirmesi
`` Face Change AI Yükseltilmiş Versiyonu '' yüz ifadeleri, vücut hareketleri ve görme yönlerinin tümü gerçek zamanlı olarak taşınabilir.
To Top