"Baidu" nun arkasında: derin öğrenme teknolojisinin en son uygulaması

Dünyanın en büyük Çin arama motoru olarak, "Baidu'ya tıklayın" a hiç yabancı değilsiniz. Ancak, görünüşte basit olan arama kutusunun birçok son teknoloji temel yapay zeka teknolojisi içerdiğini biliyor muydunuz?

Son yıllarda, yapay zekanın temel teknolojisi olarak derin öğrenme, görüntü, konuşma ve doğal dil işleme alanlarında birçok önemli atılım yaptı. AI inişi için tipik bir senaryo olarak, derin öğrenme teknolojisi Baidu arama sisteminde derinlemesine uygulanmıştır.

Mevcut durum ve zorluklar

2013 yılında Baidu Search, metin anlamsal eşleştirme özelliklerinin otomatik olarak çıkarılmasını gerçekleştiren büyük kullanıcı geri bildirim verilerine dayanan SimNet-BOW semantik eşleştirme modelini başarıyla başlattı.Bu, derin öğrenme teknolojisinin endüstriyel arama motorlarına başarıyla uygulandığı ilk kez.

O zamandan beri, derin öğrenme modeli, Baidu'nun arama zekasının temel itici gücü olarak sürekli iyileştirildi. Baidu, veri özellikleri, indeks nesne modellemesi, model yapısı vb. Hakkında çok sayıda derinlemesine araştırma yaptı ve bağımsız olarak SimNet-CNN, çok alanlı BOW, SimNet-RNN ve diğer modelleri geliştirdi ve piyasaya sürdü, bu da uzun soğuk aramanın sıralamasını büyük ölçüde iyileştirdi. etki.

Ancak önceki çalışmanın iki ana sorunu var. Her şeyden önce, mevcut modeller, arama terimleri ile dizin nesnesi başlıkları ve bağlantı metinleri arasındaki anlamsal eşleşmeyi modeller ve dizin nesnelerinin içeriğinin yeterli modellemesinden yoksundur. İkinci olarak, arama terimi vektörü ile indeks nesnesi vektörü arasındaki etkileşim çoğunlukla modelin yüzeyinde gerçekleşir ve birçok eşleşen ayrıntı kaybolur. Bu iki problem yetersiz modellemeye yol açar ve anlamsal eşleştirme modelinin genel etkisini etkiler.

Bu iki sorunu çözmek büyük zorluklarla karşı karşıyadır. Bir yandan, başarıyla uygulanan modeller çoğunlukla kısa metinleri modellemektedir ve uzun metinlerde doğrudan uygulamanın etkisi ideal değildir. Öte yandan, uzun metinler üzerinde çevrimiçi hesaplamalar yapmak ve daha fazla eşleşen ayrıntı eklemek, sistem mimarisi ve hesaplama yetenekleri için çok zorlu bir test olan model hesaplamalarının miktarında keskin bir artışa neden olacaktır.

Baidu, kullanıcı deneyimini sürekli iyileştirme amacından yola çıkarak kısa süre önce arama zekası alanında yukarıdaki iki zorluğun üstesinden gelen iki büyük yeniliği başlattı. Derin öğrenme modelinde Baidu, indekslenen nesne içeriğinin anlamsal alaka düzeyini ilk kez başarıyla gösteren ve anlamsal eşleme hakkında ayrıntılı bilgi sağlayan İçerik-Eşleştirme-Matris içerik anlama modelini yayınladı; temel mimaride, Ranking-Service arama akıllı mimarisini başarıyla geliştirdi. , GPU'yu ilk kez büyük ölçekli arama motorlarının çevrimiçi anlamsal alaka hesaplamalarına dahil ederek, karmaşık anlamsal modellerin milisaniye düzeyinde işlemlerini Baidu aramasında gerçekleştiriyor.

İçerik anlama modeli

Content-Matching-Matrix modelinin en büyük özelliği, indeks nesnesinin gövdesinin tanıtılmasıdır. Gövde içeriği genellikle çok uzun olduğu için, İçerik Eşleştirme Matris modeli, genel fikri indeks nesnesi gövdesinden özet olarak kapsayabilen birkaç paragrafı çıkarmak için bir Çıkarımsal otomatik soyutlama algoritması kullanır ve bu, uzun metin eşlemesinin asimetri problemini bir dereceye kadar hafifletir. .

Model yapısı açısından, İçerik Eşleştirme Matrisi modeli, birden çok boyuttan arama terimleri ve dizin nesneleri arasındaki eşleşme derecesini tanımlayabilen anlamsal eşleştirme matrisine dayalı yeni bir havuzlama yapısı benimser. Metin özetini aldıktan sonra, bağlamı kapsamlı bir şekilde değerlendirin, bir içerik anlamsal eşleştirme matrisi oluşturun ve daha büyük anlamsal eşleme bilgileri parçaları elde etmek için Havuzlamayı kullanın. Ardından, Terim boyutuna göre Topk-Ortalama-Havuzlama gerçekleştirin, arama teriminin her bir teriminin anlamsal eşleştirme bilgilerini elde edin ve serileştirme modellemesi için GRU yapısını kullanın ve Sorgu-Başlık-İçeriğin nihai füzyon temsili olarak son birimi seçin.

Akıllı Mimari Ara

Intelligent Ranking-Service arama mimarisi, içerik anlamsal anlama modelinin laboratuvar araştırma sonuçlarından ultra büyük ölçekli arama motorunun gerçek uygulamasına dönüştürülmesini sağlayan bir silahtır. Bu hizmet, arama motorlarının çevrimiçi mimarisinde ilk defa büyük ölçekte GPU'ları kullanarak, son derece yüksek hız gereksinimleri olan arama sistemlerinde karmaşık anlamsal modellerin uygulanmasını mümkün kılıyor. Şu anda Ranking-Service, her gün yüz milyonlarca İnternet kullanıcısının bilgi alma taleplerine yanıt vermektedir.

Ranking-Service'de, GPU tahmin hizmeti, heterojen kaynakları şeffaf hale getirirken, sistemin esnekliğini ve ölçeklenebilirliğini artırırken, erişim katmanı ve zamanlama katmanı aracılığıyla birden çok istek yanıtı türünün ve aynı türdeki isteğin entegrasyonunu gerçekleştirir. Aşırı optimizasyon yoluyla GPU'nun süper bilgi işlem gücünü en üst düzeye çıkarmanın yanı sıra, iş özelliklerini birleştiren bu mimari tasarım, ayrıca GPU hızlandırmanın maksimum verimliliğini de sağlar.

Ranking-Service, Baidu'nun kendi geliştirdiği Anakin GPU tahmin motorunu kullanıyor. Anakin'in üst katmanı, hesaplamalı grafik füzyonu, kaynak yeniden kullanımı, adres ön eşleme vb. Dahil olmak üzere donanımdan bağımsız optimizasyon teknolojilerini benimser; alt katman, donanımdaki her saatin davranışını yüksek verim ve yüksek verimlilikle hassas bir şekilde kontrol etmek için montaj düzeyinde kodla optimize edilir. Performans avantajı, çevrimiçi karmaşık model tahmini için Baidu arama sisteminin katı performans gereksinimlerini karşılar.

Geleceğe bakış

Anlamsal modeli ve Ranking-Service arama akıllı mimarisini anlama içeriğinin piyasaya sürülmesi, Baidu arama motoru için derin öğrenme teknolojisinin uygulanmasında önemli bir adımdır, ancak bu yalnızca yeni bir başlangıçtır. Ranking-Service'in güçlü bilgi işlem gücüyle Baidu Search, içerik anlama ve analiz teknolojilerini keşfetmeye devam edecek ve sonuçları sıralama, otomatik soru ve cevap, görüntü ve videoyu anlama gibi aramayla ilgili alanlara daha da uygulayacak ve kullanıcılara daha iyi bir arama deneyimi sunacak.

Yeniden yazdırmanız gerekirse, lütfen arka planda bir mesaj bırakın ve yeniden yazdırma şartnamelerine uyun.

İpuçları | Bu ayakkabıları yazın giymek canınızı yakar. 4 tür insan vardır ki giymemesi gerekir!
önceki
144Hz monitör satın almak gerekli midir? İnsan gözü, 60Hz'den farkı gerçekten ayırt edebilir mi?
Sonraki
Volvo XC40 resmi olarak tanıtıldı, üç tür güç sağladı / eşiği daha da düşürdü
Bugünkü Çekirdek Ses | İnsan ömrü iki katına mı çıkacak? Uzun ömür arıyorsanız, buraya bakın!
China Mobile yetkili değerlendirmesi! Mobil video çekimi sıralaması: iPhone XS Max kazandı
Apple aksesuarları çok mu pahalı? Alüminyum fabrikası hakkında bilgi edinin
Bu sefer adın ne? BAIC Senova Smart serisi yeni SUV, Şangay Otomobil Fuarı'nda tanıtıldı
"Hafta Sonu Yapay Zeka Sınıfı" doğrusal boyutluluk azaltma yöntemi (kod makalesi) karşılaşacağınız makine öğrenimi "çukurları"
Zhejiang Tüccarlar Sanat Yaratım Sergisi ilk kez açılıyor, Zhejiang Tüccarları ortaklaşa şiir yazıyor ve Zhejiang'ı resmetiyor
Bugünün Temel Sesi | Gambling Boys, robot güçlerine boyun eğme zamanı!
Bugünün stadyum botlarının takdiri: James, LeBron 15 ve AJ5 ortak versiyonunu giyiyor
Bir diğer gişe rekorları kıran "Dragon Face" SUV BYD Song Pro Şangay Otomobil Fuarı'nda tanıtıldı
SAIC GM otomobil fuarı serisini duyurdu, Chevrolet / Buick / Cadillac'ın buluşması gereken yeni arabaları
Beijing Shijingshan District, 2019'da 143,42 hektar yeşil alan eklemeyi planlıyor
To Top