Kullanıcı portrelerinin anlamı
Persona kavramı ilk olarak etkileşim tasarımının babası Alan Cooper tarafından önerilmiştir: "Personalar, hedef kullanıcıların somut bir temsilidir." Gerçek kullanıcıların sanal temsilini ifade eder ve bir dizi öznitelik verisine dayalı bir hedef kullanıcı modelidir. İnternetin gelişmesiyle birlikte, şimdi bahsettiğimiz kullanıcı portresi yeni çağrışımlar içeriyor - genellikle bir kullanıcı portresi, kullanıcı demografik özellikleri, web'de gezinme içeriği, çevrimiçi sosyal etkinlikler ve tüketici davranışı gibi bilgilere dayalı olarak soyutlanmış bir etikettir. Kullanıcı modeli. Kullanıcı portrelerini oluşturmanın temel işi, temelde sunucuda depolanan büyük günlükleri ve veritabanındaki büyük verileri analiz ve madencilik için kullanmak ve kullanıcılara "etiketler" koymaktır ve "etiketler", kullanıcıların belirli bir boyutunun özelliklerini gösterebilen tanımlayıcılardır. Spesifik etiket formu için, lütfen aşağıdaki şekilde belirli bir web sitesi tarafından kullanıcılardan birine verilen etikete bakın.
Kullanıcı portrelerinin rolü
Kullanıcı portrelerini çıkarmak, çok fazla zaman ve insan gücü gerektiren büyük miktarda günlüğün işlenmesini gerektirir. Bu kadar yüksek bir maliyete rağmen, çoğu şirket hala kullanıcıları için yeterince doğru bir kullanıcı portresi yapmayı umuyor.
Öyleyse kullanıcı portrelerinin rolü nedir ve hangi hedeflere ulaşmamıza yardımcı olabilirler?
Genel olarak şu hususlar olarak özetlenebilir:
Kullanıcı portre içeriği
Kullanıcı portrelerinin içeriği tam olarak sabitlenmemiştir ve endişenin özellikleri farklı sektörlere ve ürünlere göre farklılık göstermektedir. Çoğu İnternet şirketi için, kullanıcı portreleri demografik nitelikleri ve davranışsal özellikleri içerecektir. Demografik özellikler temel olarak kullanıcının yaşı, cinsiyeti, ili ve şehri, eğitim seviyesi, medeni durumu, doğurganlık durumu, çalıştıkları sektör ve mesleği vb. İle ilgilidir. Davranış özellikleri temel olarak aktivite ve sadakat gibi göstergeleri içerir.
Yukarıda bahsedilen daha genel özelliklere ek olarak, farklı web sitesi türleri tarafından çıkarılan kullanıcı portrelerinin kendi odakları vardır.
İçerik tabanlı medya veya okuma web sitelerinin yanı sıra arama motorları veya genel gezinme web siteleri genellikle kullanıcının spor, eğlence, yemek, finans yönetimi, turizm ve emlak gibi içeriğe göz atma konusundaki ilgisini çeker. , Arabalar vb.
Sosyal ağ sitelerinin kullanıcı portreleri ayrıca, topluluktaki fikir liderlerinin rolünü oynayan yakından bağlantılı kullanıcı gruplarını ve ünlü düğümleri bulabileceğimiz kullanıcının sosyal ağını da çıkaracaktır.
E-ticaret alışveriş sitelerinin kullanıcı portreleri, genellikle kullanıcıların çevrimiçi alışveriş ilgi alanları ve harcama gücü gibi göstergeleri çıkarır. Çevrimiçi alışveriş ilgisi, temel olarak giyim, bavul, ev, anne ve çocuk, yıkama ve emzirme ve yiyecek gibi çevrimiçi alışveriş yaparken kullanıcıların kategori tercihini ifade eder.
Tüketim gücü, kullanıcıların satın alma gücünü ifade eder, yeterince dikkatli yapılırsa, kullanıcıların gerçek tüketim düzeyi her bir kategorinin psikolojik tüketim düzeyinden ayrılarak karakteristik enlem belirlenebilir.
Ek olarak, mevcut saat, ziyaret edilen yerin LBS özellikleri, yerel hava durumu ve tatil koşulları gibi kullanıcının çevresel özellikleri eklenebilir.
Elbette, belirli bir web sitesi veya Uygulama için, kullanıcıların özel ilgi alanı enlemleri olmalıdır ve bu boyutların, kullanıcılara daha doğru kişiselleştirilmiş hizmetler ve içerikler sağlamak için daha ayrıntılı olması gerekir.
Kullanıcı portre üretimi
Kullanıcı özelliklerinin çıkarılması, kabaca aşağıdaki adımlara ayrılabilen kullanıcı portrelerinin üretim sürecidir:
Aşağıda, özellikle özellik çıkarma sürecini tanıtmak için örnek olarak kullanıcı cinsiyeti alınır:
1. Kayıt veya faaliyetler sırasında doldurulan cinsiyet bilgileri gibi kullanıcı tarafından doldurulan bilgileri çıkarın Bu verilerin doğruluğu genellikle çok yüksektir.
Veri yönetim sistemi
Kullanıcı portreleri, genellikle birden çok veri kaynağı ve birden çok kişinin verileri işlemesi ve paralel olarak özellikler oluşturmasını gerektiren çok sayıda veri işleme ve özellik çıkarma içerir. Bu nedenle, verileri konsolide etmek, depolamak ve dağıtmak için bir veri yönetim sistemine ihtiyaç vardır. Sistemimiz verileri üzerinde mutabık kalınan bir dizin yapısında düzenler Temel dizin hiyerarşisi: / kullanıcı_tag / öznitelik / tarih / kaynak_yazarı / şeklindedir. Cinsiyet özelliklerini örnek alırsak, geliştirici dev1 tarafından kullanıcı adından çıkarılan cinsiyet verilerinin depolama yolu / user_tag / gender / 20170101 / name_dev1 ve geliştirici dev2 tarafından kullanıcının doldurma bilgilerinden çıkarılan cinsiyet verilerinin depolama yolu / user_tag / gender / 20170102 / raw_dev2 şeklindedir. .
Her kaynaktan çıkarılan verilerin güvenilirliği farklı olduğundan her kaynaktan çıkarılan verilere belirli bir ağırlık verilmelidir.Anlaşma genellikle 0-1 arasında bir olasılık değeridir, böylece sistem otomatik olarak verileri birleştirdiğinde, Sadece basit ağırlıklı bir toplama yapın, çıktıyı kümeye normalleştirin ve önceden tanımlanmış Hive tablosunda saklayın. Sonraki adım, verileri HBase, ES ve Spark kümeleri gibi daha fazla uygulama hizmeti kümesine kademeli olarak güncellemektir.
** Uygulama örneği: kişiselleştirilmiş öneri
**
Örnek olarak bir e-ticaret web sitesinin belirli bir sayfasının kişiselleştirilmiş önerisini alın.Özelliklerin yorumlanabilirliği, modelin kolay genişletilmesi ve hesaplama performansı göz önüne alındığında, birçok çevrimiçi öneri sistemi LR (lojistik regresyon) model eğitimini kullanır, burada ayrıca LR modeli Örneğin. Pek çok öneri senaryosu, ürün tabanlı işbirliğine dayalı filtrelemeyi kullanacaktır ve ürün tabanlı işbirliğine dayalı filtrelemenin özü, bir ürün korelasyon matrisidir W. N ürün olduğunu varsayarsak, W bir nn matrisidir ve matrisin wij öğesi Ii ve Ij ürünlerini temsil eder. Arasındaki korelasyon katsayısı. Malları ziyaret eden ve satın alan kullanıcıların davranış özelliklerine göre, kullanıcılar n boyutlu bir özellik vektörü U = olarak temsil edilebilir. Dolayısıyla UW, kullanıcının her ürüne olan ilgi derecesi olarak kabul edilebilir V = , burada v1, kullanıcının I1 ürününe olan ilgi derecesidir, v1 = i1w11 + i2w12 + in * w1n . Korelasyon katsayıları w11, w12, ..., w1n gerekli değişkenler olarak kabul edilirse, LR modeli çözülecek eğitim setinde kullanıcının davranış vektörü U'nun yerini almak için kullanılabilir. Böyle bir ön LR modeli eğitilmiştir ve etkisi emtia bazlı işbirlikçi filtrelemeye benzerdir.
Şu anda, yalnızca kullanıcının davranış özellikleri kullanılırken, demografik özellikler, çevrimiçi alışveriş tercihleri, içerik tercihleri, tüketim gücü ve çevresel özellikler gibi diğer bağlamlar kullanılmamıştır. Orijinal LR modelini daha da optimize etmek ve eğitmek için yukarıdaki özellikleri LR modeline ekleyin ve aynı zamanda metin etiketi, kategori, satışlar ve diğer veriler gibi hedef ürünün özelliklerini aşağıdaki şekilde gösterildiği gibi ekleyin. Bu şekilde, çıkarılan kullanıcı profili verileri, daha doğru kişiselleştirilmiş öneriler elde etmek için büyük ölçüde kullanılabilir.
Yorumlar
Kullanıcı portreleri, mevcut büyük veri alanındaki tipik bir uygulamadır ve birçok NetEase Internet ürününde de yaygın olarak kullanılmaktadır. Netease uygulamasına dayanan bu makale, kullanıcı portrelerinin ilkesini ve üretim sürecini basit ve derin bir şekilde analiz ediyor.
Doğru ve etkili kullanıcı portreleri, büyük miktarda veriden doğru özelliklerin çıkarılmasına bağlıdır ve bu, destek olarak güçlü bir veri yönetim sistemi gerektirir. NetEase büyük veri ürün sistemi NetEase Mammoth'un içerdiği tek noktadan büyük veri geliştirme ve yönetim platformu, NetEase'in dahili uygulamasında oluşturulmuştur ve kullanıcı portrelerinin ve sonraki iş hedeflerinin gerçekleştirilmesi için veri aktarımı, hesaplama ve iş akışı sağlayabilir. Zamanlama gibi temel yetenekler, büyük veri uygulamaları için teknik eşiği etkili bir şekilde düşürür.
Yazar: Yang Jie, "ecshujufenxi" mikro kanallı halka açık numaraya odaklanabilir