g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

Kullanıcı portreleri ile ilgili olarak bu makale yeterli

Kullanıcı portrelerinin anlamı

Persona kavramı ilk olarak etkileşim tasarımının babası Alan Cooper tarafından önerilmiştir: "Personalar, hedef kullanıcıların somut bir temsilidir." Gerçek kullanıcıların sanal temsilini ifade eder ve bir dizi öznitelik verisine dayalı bir hedef kullanıcı modelidir. İnternetin gelişmesiyle birlikte, şimdi bahsettiğimiz kullanıcı portresi yeni çağrışımlar içeriyor - genellikle bir kullanıcı portresi, kullanıcı demografik özellikleri, web'de gezinme içeriği, çevrimiçi sosyal etkinlikler ve tüketici davranışı gibi bilgilere dayalı olarak soyutlanmış bir etikettir. Kullanıcı modeli. Kullanıcı portrelerini oluşturmanın temel işi, temelde sunucuda depolanan büyük günlükleri ve veritabanındaki büyük verileri analiz ve madencilik için kullanmak ve kullanıcılara "etiketler" koymaktır ve "etiketler", kullanıcıların belirli bir boyutunun özelliklerini gösterebilen tanımlayıcılardır. Spesifik etiket formu için, lütfen aşağıdaki şekilde belirli bir web sitesi tarafından kullanıcılardan birine verilen etikete bakın.

Kullanıcı portrelerinin rolü

Kullanıcı portrelerini çıkarmak, çok fazla zaman ve insan gücü gerektiren büyük miktarda günlüğün işlenmesini gerektirir. Bu kadar yüksek bir maliyete rağmen, çoğu şirket hala kullanıcıları için yeterince doğru bir kullanıcı portresi yapmayı umuyor.

Öyleyse kullanıcı portrelerinin rolü nedir ve hangi hedeflere ulaşmamıza yardımcı olabilirler?

Genel olarak şu hususlar olarak özetlenebilir:

Hassas pazarlama: hassas doğrudan posta, SMS, Uygulama mesajı gönderme, kişiselleştirilmiş reklamcılık vb.

Kullanıcı araştırması: ürün optimizasyonuna rehberlik edin ve hatta ürün işlevlerini kişiselleştirin.

Kişiselleştirilmiş hizmet: kişiselleştirilmiş öneri, kişiselleştirilmiş arama vb.

İş kararı: sıralama istatistikleri, coğrafi analiz, endüstri eğilimleri, rekabetçi ürün analizi vb.

Kullanıcı portre içeriği

Kullanıcı portrelerinin içeriği tam olarak sabitlenmemiştir ve endişenin özellikleri farklı sektörlere ve ürünlere göre farklılık göstermektedir. Çoğu İnternet şirketi için, kullanıcı portreleri demografik nitelikleri ve davranışsal özellikleri içerecektir. Demografik özellikler temel olarak kullanıcının yaşı, cinsiyeti, ili ve şehri, eğitim seviyesi, medeni durumu, doğurganlık durumu, çalıştıkları sektör ve mesleği vb. İle ilgilidir. Davranış özellikleri temel olarak aktivite ve sadakat gibi göstergeleri içerir.

Yukarıda bahsedilen daha genel özelliklere ek olarak, farklı web sitesi türleri tarafından çıkarılan kullanıcı portrelerinin kendi odakları vardır.

İçerik tabanlı medya veya okuma web sitelerinin yanı sıra arama motorları veya genel gezinme web siteleri genellikle kullanıcının spor, eğlence, yemek, finans yönetimi, turizm ve emlak gibi içeriğe göz atma konusundaki ilgisini çeker. , Arabalar vb.

Sosyal ağ sitelerinin kullanıcı portreleri ayrıca, topluluktaki fikir liderlerinin rolünü oynayan yakından bağlantılı kullanıcı gruplarını ve ünlü düğümleri bulabileceğimiz kullanıcının sosyal ağını da çıkaracaktır.

E-ticaret alışveriş sitelerinin kullanıcı portreleri, genellikle kullanıcıların çevrimiçi alışveriş ilgi alanları ve harcama gücü gibi göstergeleri çıkarır. Çevrimiçi alışveriş ilgisi, temel olarak giyim, bavul, ev, anne ve çocuk, yıkama ve emzirme ve yiyecek gibi çevrimiçi alışveriş yaparken kullanıcıların kategori tercihini ifade eder.

Tüketim gücü, kullanıcıların satın alma gücünü ifade eder, yeterince dikkatli yapılırsa, kullanıcıların gerçek tüketim düzeyi her bir kategorinin psikolojik tüketim düzeyinden ayrılarak karakteristik enlem belirlenebilir.

Ek olarak, mevcut saat, ziyaret edilen yerin LBS özellikleri, yerel hava durumu ve tatil koşulları gibi kullanıcının çevresel özellikleri eklenebilir.

Elbette, belirli bir web sitesi veya Uygulama için, kullanıcıların özel ilgi alanı enlemleri olmalıdır ve bu boyutların, kullanıcılara daha doğru kişiselleştirilmiş hizmetler ve içerikler sağlamak için daha ayrıntılı olması gerekir.

Kullanıcı portre üretimi

Kullanıcı özelliklerinin çıkarılması, kabaca aşağıdaki adımlara ayrılabilen kullanıcı portrelerinin üretim sürecidir:

Kullanıcı modelleme, çıkarılan kullanıcı özelliklerinin ve kullanılması gereken veri kaynaklarının boyutlarının belirlenmesini ifade eder.

Veri toplama için, bir Hadoop kümesinde kullanmanız gereken verileri depolamak için Flume veya kendi yazdığınız komut dosyaları gibi veri toplama araçlarını kullanın.

Veri temizleme, veri temizleme işlemi genellikle bir Hadoop kümesinde bulunur ve aynı zamanda veri toplama ile aynı anda gerçekleştirilebilir.Bu adımın ana işi, ilgilenilen hedef özellikleri elde etmek için çeşitli kaynaklardan toplanan ve düzensiz verilerin alanlarını çıkarmaktır.

Model eğitimi için, kullanıcının ilgisini çeken içerik veya kullanıcının tüketim seviyesi gibi bazı özellikler doğrudan veri temizlemesinden elde edilemeyebilir, daha sonra toplanan bilinen özellikler üzerinden öğrenme ve tahmin yapılabilir.

Özellik tahmini, kullanıcının bilinmeyen özelliklerini tahmin etmek için eğitilmiş modeli ve kullanıcının bilinen özelliklerini kullanır.

Veri birleştirme, kullanıcılar tarafından çeşitli veri kaynaklarından çıkarılan özellikleri birleştirir ve belirli bir derecede güvenilirlik sağlar.

Veri dağıtımı: Birleştirilmiş sonuç verileri, veri desteği sağlamak için hassas pazarlama, kişiselleştirilmiş öneri ve CRM gibi çeşitli platformlara dağıtılır.

Aşağıda, özellikle özellik çıkarma sürecini tanıtmak için örnek olarak kullanıcı cinsiyeti alınır:

1. Kayıt veya faaliyetler sırasında doldurulan cinsiyet bilgileri gibi kullanıcı tarafından doldurulan bilgileri çıkarın Bu verilerin doğruluğu genellikle çok yüksektir.

Metinde bahsedilen diğer tarafın adı gibi kullanıcının unvanını çıkarın, örneğin: Bay/Ms. Xxx, bu veriler de daha doğrudur.

Kullanıcının adını temel alarak kullanıcının cinsiyetini tahmin etmek ikili bir sınıflandırma problemidir.Kullanıcının ad kısmını çıkarabilir (Baijia'nın soyadı cinsiyetle ilgili değildir) ve ardından naif bir Bayes sınıflandırıcısıyla bir sınıflandırıcı eğitebilirsiniz. Süreçte, "Zhen Huan" da "" gibi yaygın olmayan sözcükler sorunuyla karşılaştık.İsimde az sayıda olduğundan, sınıflandırıcı doğru sınıflandırmayı gerçekleştiremez. Çince karakterlerin radikal radikallerden oluştuğunu ve radikal radikallerin genellikle özel anlamları olduğunu göz önünde bulundurarak (çoğu cinsiyetle ilgili, örneğin el yazısı karakterler kadın olma eğilimindedir ve altın karakterler erkek olma eğilimindedir), tek karakterleri ayrıştırmak için Wubi giriş yöntemini kullanıyoruz ve sonra Adın kendisi ve Wubi stilinin harfleri eğitim için LR sınıflandırıcısına yerleştirilir. Örneğin, "" karakteri oynanır: "Kadın V + L + G + kıyafetleri E = VLGE" Buradaki kadın karakter çok kadınsıdır.

Ek olarak, kullanılabilecek bazı özellikler vardır.Örneğin, kullanıcılar web sitelerini ziyaret etmiş ve sık sık bazı güzellik veya kadın giyim sitelerini ziyaret etmiş, bu da onların kadın olma olasılıklarının daha yüksek olduğu; spor ve askeri web sitelerini ziyaret ederken, erkek olma olasılıkları daha yüksek olduğu anlamına gelir. Kullanıcıların çevrimiçi olduğu dönemler de vardır ve genellikle gece geç saatlerde çevrimiçi olan kullanıcıların erkek olma olasılığı daha yüksektir. Bu özellikleri eğitim için LR sınıflandırıcısına eklemek, belirli bir veri kapsamını da iyileştirebilir.

Veri yönetim sistemi

Kullanıcı portreleri, genellikle birden çok veri kaynağı ve birden çok kişinin verileri işlemesi ve paralel olarak özellikler oluşturmasını gerektiren çok sayıda veri işleme ve özellik çıkarma içerir. Bu nedenle, verileri konsolide etmek, depolamak ve dağıtmak için bir veri yönetim sistemine ihtiyaç vardır. Sistemimiz verileri üzerinde mutabık kalınan bir dizin yapısında düzenler Temel dizin hiyerarşisi: / kullanıcı_tag / öznitelik / tarih / kaynak_yazarı / şeklindedir. Cinsiyet özelliklerini örnek alırsak, geliştirici dev1 tarafından kullanıcı adından çıkarılan cinsiyet verilerinin depolama yolu / user_tag / gender / 20170101 / name_dev1 ve geliştirici dev2 tarafından kullanıcının doldurma bilgilerinden çıkarılan cinsiyet verilerinin depolama yolu / user_tag / gender / 20170102 / raw_dev2 şeklindedir. .

Her kaynaktan çıkarılan verilerin güvenilirliği farklı olduğundan her kaynaktan çıkarılan verilere belirli bir ağırlık verilmelidir.Anlaşma genellikle 0-1 arasında bir olasılık değeridir, böylece sistem otomatik olarak verileri birleştirdiğinde, Sadece basit ağırlıklı bir toplama yapın, çıktıyı kümeye normalleştirin ve önceden tanımlanmış Hive tablosunda saklayın. Sonraki adım, verileri HBase, ES ve Spark kümeleri gibi daha fazla uygulama hizmeti kümesine kademeli olarak güncellemektir.

** Uygulama örneği: kişiselleştirilmiş öneri

Örnek olarak bir e-ticaret web sitesinin belirli bir sayfasının kişiselleştirilmiş önerisini alın.Özelliklerin yorumlanabilirliği, modelin kolay genişletilmesi ve hesaplama performansı göz önüne alındığında, birçok çevrimiçi öneri sistemi LR (lojistik regresyon) model eğitimini kullanır, burada ayrıca LR modeli Örneğin. Pek çok öneri senaryosu, ürün tabanlı işbirliğine dayalı filtrelemeyi kullanacaktır ve ürün tabanlı işbirliğine dayalı filtrelemenin özü, bir ürün korelasyon matrisidir W. N ürün olduğunu varsayarsak, W bir nn matrisidir ve matrisin wij öğesi Ii ve Ij ürünlerini temsil eder. Arasındaki korelasyon katsayısı. Malları ziyaret eden ve satın alan kullanıcıların davranış özelliklerine göre, kullanıcılar n boyutlu bir özellik vektörü U = olarak temsil edilebilir. Dolayısıyla UW, kullanıcının her ürüne olan ilgi derecesi olarak kabul edilebilir V = , burada v1, kullanıcının I1 ürününe olan ilgi derecesidir, v1 = i1w11 + i2w12 + in * w1n . Korelasyon katsayıları w11, w12, ..., w1n gerekli değişkenler olarak kabul edilirse, LR modeli çözülecek eğitim setinde kullanıcının davranış vektörü U'nun yerini almak için kullanılabilir. Böyle bir ön LR modeli eğitilmiştir ve etkisi emtia bazlı işbirlikçi filtrelemeye benzerdir.

Şu anda, yalnızca kullanıcının davranış özellikleri kullanılırken, demografik özellikler, çevrimiçi alışveriş tercihleri, içerik tercihleri, tüketim gücü ve çevresel özellikler gibi diğer bağlamlar kullanılmamıştır. Orijinal LR modelini daha da optimize etmek ve eğitmek için yukarıdaki özellikleri LR modeline ekleyin ve aynı zamanda metin etiketi, kategori, satışlar ve diğer veriler gibi hedef ürünün özelliklerini aşağıdaki şekilde gösterildiği gibi ekleyin. Bu şekilde, çıkarılan kullanıcı profili verileri, daha doğru kişiselleştirilmiş öneriler elde etmek için büyük ölçüde kullanılabilir.

Yorumlar

Kullanıcı portreleri, mevcut büyük veri alanındaki tipik bir uygulamadır ve birçok NetEase Internet ürününde de yaygın olarak kullanılmaktadır. Netease uygulamasına dayanan bu makale, kullanıcı portrelerinin ilkesini ve üretim sürecini basit ve derin bir şekilde analiz ediyor.

Doğru ve etkili kullanıcı portreleri, büyük miktarda veriden doğru özelliklerin çıkarılmasına bağlıdır ve bu, destek olarak güçlü bir veri yönetim sistemi gerektirir. NetEase büyük veri ürün sistemi NetEase Mammoth'un içerdiği tek noktadan büyük veri geliştirme ve yönetim platformu, NetEase'in dahili uygulamasında oluşturulmuştur ve kullanıcı portrelerinin ve sonraki iş hedeflerinin gerçekleştirilmesi için veri aktarımı, hesaplama ve iş akışı sağlayabilir. Zamanlama gibi temel yetenekler, büyük veri uygulamaları için teknik eşiği etkili bir şekilde düşürür.

Yazar: Yang Jie, "ecshujufenxi" mikro kanallı halka açık numaraya odaklanabilir

Güney + Erken Otobüs | "Laoguang" heyecan verici bir yolla Sri Lanka'dan Guangzhou'ya geri dönüyor (sesli yayın)

İlkbahar esintisinde sizinle Taobao'da buluşmak daha iyi Derin öğrenme özellikli Taobao akıllı arama