Endüstri sınırı: TF Sıralaması: en gelişmiş sıralama öğrenimi TensorFlow kitaplığı

Sıralama, öğeleri tüm listenin faydasını en üst düzeye çıkaracak şekilde sıralama sürecidir.Arama motorlarından ve öneri sistemlerinden makine çevirisine, diyalog sistemlerine ve hatta hesaplamalı biyolojiye kadar çok çeşitli alanlar için geçerlidir.

Bu uygulamalarda, araştırmacılar genellikle sıralama öğrenimi adı verilen bir dizi denetimli makine öğrenimi tekniği kullanır. Çoğu durumda, bu sıralama öğrenme teknikleri çok büyük veri kümelerine uygulanabilir. Bunlar arasında, TensorFlow'un ölçeklenebilirliği bir avantaj olabilir, ancak şu anda TensorFlow'a sıralama öğrenme teknolojisini uygulamak için hazır bir teknik destek bulunmamaktadır. Eksik istatistiklere göre, şu anda özel olarak büyük ölçekli sıralama öğrenme tekniklerini uygulayan başka hiçbir açık kaynaklı kitaplık yoktur.

Bu amaçla, bu makale, öğrenmeyi sıralamak için genişletilebilir bir TensorFlow kitaplığı olan TF-Ranking'i önerir. TF-Ranking, en gelişmiş sıralama öğrenme algoritmalarını içeren birleşik bir çerçeve sağlar ve ikili veya liste kaybı işlevlerini, çok maddeli puanlamayı, sıralama ölçütü optimizasyonunu ve tarafsız sıralama öğrenimini destekler.

TF-Ranking hızlıdır ve kullanımı kolaydır ve yüksek kaliteli sıralama modelleri oluşturabilir. Birleşik çerçeve, ML araştırmacılarının, uygulayıcılarının ve meraklılarının tek bir kütüphanede bir dizi farklı sıralama modelini değerlendirmesine ve seçmesine olanak tanır.

Ek olarak, pratik bir açık kaynak kitaplığının anahtarı, yalnızca makul varsayılan değerler sağlamak değil, aynı zamanda kullanıcılara kendi özel modellerini geliştirme yetkisi vermektir. Bu nedenle, TF-Ranking, kullanıcıların kendi özel kayıp işlevlerini, puanlama işlevlerini ve göstergelerini tanımlayıp ekleyebilecekleri esnek bir API sağlar.

Mevcut algoritmalar ve ölçümler desteği

Sıralama öğrenme algoritmasının amacı, öğe listesinde tanımlanan kayıp işlevini en aza indirgemek, böylece verilen tüm uygulamalar için liste sıralamasının etkinliğini optimize etmektir. TF Sıralaması, çok çeşitli standart noktasal, eşleştirme ve liste kaybı işlevlerini destekler.

Bu, TF-Ranking kütüphanesini kullanan araştırmacıların önceden yayınlanmış referansları kopyalayıp genişletebilmelerini ve uygulayıcıların uygulamaları için en bilinçli seçimi yapabilmelerini sağlar.

Ek olarak, TF-Ranking, yüz milyonlarca eğitim örneğini katıştırarak ve ölçeklendirerek seyrek özellikleri (orijinal metin gibi) işleyebilir.

Bu nedenle, gerçek dünya veri yoğun sıralama sistemleri (web araması veya haber önerileri gibi) oluşturmakla ilgilenen herkes, güçlü ve ölçeklenebilir bir çözüm olarak TF-Ranking'i kullanabilir.

Deneyim değerlendirmesi, tüm makine öğrenimi veya bilgi alma araştırmalarının önemli bir parçasıdır. Önceki çalışmayla uyumluluğu sağlamak için TF Sıralaması, Ortalama Karşılıklı Sıra (MRR) ve Normalize İndirimli Kümülatif Kazanç (NDCG) dahil olmak üzere yaygın olarak kullanılan birçok sıralama göstergesini destekler. TF-Ranking, TensorBoard'da (açık kaynak TensorFlow görselleştirme panosu) eğitim sırasında bu ölçümleri kolayca görselleştirebilir.

TensorBoard'da gösterilen eğitim adımının (X ekseni) NDCG metriği (Y ekseni) örneğine göre, eğitim sırasında göstergenin genel ilerlemesi. Farklı yöntemler doğrudan kontrol panelinde karşılaştırılabilir. En iyi model, göstergelere göre de seçilebilir.

Birden çok derecelendirme

TF Sıralaması, birden fazla maddenin (web sayfaları gibi) birlikte puanlanabildiği yepyeni bir puanlama mekanizmasını destekler.Bu, tek bir maddenin bağımsız olarak puanlandığı geleneksel puanlama modunun bir uzantısıdır.

Çok maddeli puanlamanın bir zorluğu, maddelerin alt gruplar halinde gruplanması ve puanlanması gerektiği konusunda karar vermenin zor olmasıdır. Ardından her bir maddenin puanı toplanır ve sıralama için kullanılır.

TF-Ranking, bu karmaşık projelerin toplam puanlarını kullanıcılar için şeffaf hale getirmek amacıyla, tüm bu mantıkları dışa aktarılan TF modelinde paketlemek için bir List-In-List-Out (LILO) API'si sağlar.

TF Sıralaması kitaplığı, geleneksel tek madde puanlama modelinin bir uzantısı olan çok maddeli bir puanlama sistemi yapısını destekler.

Çok maddeli puanlama, halka açık LETORbenchmark'taki en gelişmiş sıralama öğrenme modelleriyle (RankNet, MART ve LambdaMART gibi) daha rekabetçidir.

Dizin optimizasyonunu sıralama

Sıralamada öğrenmede önemli bir araştırma zorluğu, sıralama göstergelerinin (yukarıda belirtilen NDCG ve MRR gibi) doğrudan optimizasyonudur. Bu göstergeler, derecelendirme sisteminin performansını standart sınıflandırma göstergelerinden (eğri altındaki alan (AUC) gibi) daha iyi ölçebilmesine rağmen, süreksizlik veya istikrarsızlık dezavantajına sahiptirler. Bu nedenle, bu göstergelerin standart stokastik gradyan iniş optimizasyonunun bazı sorunları vardır.

Son çalışmada, Google AI, sıralama indeksi optimizasyonu için ilkeli bir olasılık çerçevesi sağlayan yeni bir yöntem olan LambdaLoss'u önerdi.

Bu çerçevede, göstergeler tarafından yönlendirilen kayıp fonksiyonu, beklenti maksimizasyon programı ile tasarlanabilir ve optimize edilebilir. TF-Ranking kütüphanesinin en son gelişmesi, doğrudan ölçüm optimizasyon çerçevesinin entegrasyonu ve LambdaLoss'un uygulanmasıdır. Bu, sıralama indeksi optimizasyonu gibi önemli alanlarda derinlemesine araştırmamızı teşvik edecek ve ilerletecektir.

Tarafsız sıralama öğrenimi

Önceki araştırmalar, sıralı bir öğe listesi verildiğinde, kullanıcıların ilgilerine bakılmaksızın ilk birkaç sonuçla etkileşime girme olasılıklarının daha yüksek olduğunu göstermiştir. Bu gözlem, araştırmacıların tarafsız sıralama öğrenmeye olan ilgisini uyandırdı ve yeniden ağırlıklandırma eğitim örneklerine, önyargısız değerlendirme ve birkaç tarafsız öğrenme algoritmasına dayanarak geliştirildi.

TF-Ranking kütüphanesinde, göstergeler tarafsız tahmini desteklemek için uygulanır ve makine, kullanıcı etkileşimi veri setindeki doğal önyargının üstesinden gelmek ve önyargısız öğrenme kaybını telafi etmek için yeniden ağırlıklandırmayı destekler.

TF Sıralamasına Başlarken

TF-Ranking, eğitim, değerlendirme, tahmin ve ihracat hizmetlerini kapsayarak makine öğreniminin programlama zorluğunu büyük ölçüde basitleştiren TensorFlow Estimator arayüzünü uygular. TF-Ranking, zengin TensorFlow ekosistemi ile mükemmel bir şekilde entegre edilmiştir.

Yukarıda belirtildiği gibi, NDCG ve MRR gibi sıralama göstergelerini görselleştirmek için Tensorboard'u kullanabilir ve en iyi model kontrol noktasını seçmek için bu göstergeleri kullanabilirsiniz. Modeliniz hazır olduğunda, TensorFlow Sunumu kullanarak üretime dağıtmak kolaydır.

Mücadele ediyorum Ma Yun bilimsel araştırmalarla uğraşıyor ve 2 milyar insana hizmet etmek ve 100 milyon iş sağlamak istiyor Bu ne için?
önceki
Cep telefonlarının kârı düşüyor Cep telefonu üreticileri neden cep telefonu setlerini dağıtmaya başlıyor?
Sonraki
Bugünün Xinsheng | Xiaomi, bir mal sıkıntısına derinden karışıyor, Lei Jun, üretimi sağlamak için vidaları vidalamak için fabrikaya mı gidiyor?
Para kazanmak ya da yapmamak ona kalmış mı? Yapay zeka finans sektörünü nasıl değiştiriyor?
Muhtemelen en eksiksiz EZ revizyon bilgisi, revizyondan sonra orijinal becerilerin büyük bir özeti
LOL yeni bir tasarıma öncülük etti, yeni rütbe rozetinden memnun musunuz?
Kod ayrıntıları: TensorFlow'u simülasyon API'si aracılığıyla anlama
Gel! Sizi bu Cumartesi OnePlus 5 yaz partisine davet ediyoruz
Xinsheng Today | Her taraftan utanan Ofo, Gold Coin Alışveriş Merkezi'ni başlattı: Para yatırma işlemi doğrudan mallarla değiştirilebilir
Rahat ofis klavyesi, sizi rahat ettirecek doğru klavyeyi seçin!
Mob Big Data, 2017 Yunqi Konferansı'na katılıyor, Youzu panoramik bir veri hizmeti platformu oluşturuyor
Makine öğrenimi postalarınızı ve vaatlerinizi yönetebilir!
Mi Fan Card'ın mobil versiyonu nihayet burada, 1 yuan 1G ulusal trafik sınırsız 2 yuan
Bağırmayı kes, Özil bu sefer gerçekten yedek kulübede değil.
To Top