Mobil kullanıcı tutma sisteminde K-ortalamalı algoritmanın uygulanması

4G teknolojisinin mobil operatörler tarafından kademeli olarak uygulanmasıyla, operatörler arasındaki rekabet baskısı yoğunlaştı ve mevcut kullanıcılar için rekabet, ölçeği artırmak ve faydaları artırmak için yavaş yavaş operatörler için rekabetin çekirdeği haline geldi. Mevcut müşterileri sorunsuz bir şekilde yeni kullanıcılara dönüştürmek ve müşteri özellikleri ve davranışlarına dayalı olarak müşteriyi elde tutma derecesini tahmin etmek için, etkili müşteri elde tutma ve kazanma stratejileri formüle etmek ve karlılık elde etmek, her operatörün acilen çözmesi gereken konulardır.

Son yıllarda, veriler her endüstriye ve iş işlevsel alanına nüfuz etti ve giderek üretim ve operasyonda önemli bir faktör haline geldi.Veri analizi, büyük endüstrilerde hızla popüler bir kelime haline geldi. Veri madenciliğinin neden olduğu kullanıcı ihtiyaçlarının büyük memnuniyeti, geleneksel operatörlerin geliştirme modelini büyük zorluklar ve krizlerle karşı karşıya bıraktı.

Kullanıcı davranışının doğru analizi yoluyla, küme kullanıcıları için bir veri madenciliği pazarlama modeli oluşturmak, ağların, terminallerin ve hizmetlerin birleşik adaptasyonunu sağlamak, kullanıcı yaşam döngüsü bakım yönetim sisteminin uygulanmasını iyileştirmeye, kullanıcı tüketim izlemeyi güçlendirmeye ve kullanıcılara paketleri çözmede yardımcı olacaktır. Tüketim uyuşmazlığı sorunları, kullanıcının işe bağımlılığını artırıyor, kullanıcı sadakatini ve istikrarını artırıyor, mobil hizmetlerden kullanıcı beklentilerini artırıyor, kullanıcı algısını artırıyor ve kullanıcı bağlılığını artırıyor.

1.1 Sistem uygulaması nesne analizi

Kullanıcı bölümleme, daha sonraki veri matrisinin kurulmasına elverişli olan, kullanıcılar tarafından tutulan verileri analiz etmek için gerekli bir araçtır Kullanıcı bölümleme adımları Şekil 1'de gösterilmektedir.

Mobil kullanıcı pazarlamasında, kullanıcı değeri ve kullanıcı kararlılığı, kullanıcının bakımını değerlendirmek için temel göstergelerdir. Bu nedenle, kullanıcılar sınıflandırılırken, bu iki gösterge, kaynak koruma önceliğinin yüksekten düşüğe doğru derecesine göre kullanıcı segmentasyonu özellikleri olarak kullanılır. Kullanıcılar 6 kategoriye ayrılır: altın müşteriler, yüksek rütbeli müşteriler, değişken müşteriler, düşük kaliteli müşteriler, potansiyel müşteriler ve sıçrayan müşteriler. Kümeleme yöntemi, mobil kullanıcıları kümelemek, kullanıcıları gruplama ilkelerini ve kullanıcı kaynak tahsisini netleştirmek ve sınırlı kaynakları en değerli kullanıcılara öncelik vermek için kullanılır Kümeleme sonrası kullanıcı kategorileri Tablo 1'de gösterilmektedir.

İletişim pazarının şiddetli doygunluğuyla, kullanıcı kaybı daha ciddidir.Bunun ana nedenleri iki yöndedir: (1) Operatörler arasındaki rekabet, fiyat özelliklerinin özelliklerinden dolayı şiddetli; (2) Kullanıcılar iş modüllerinden memnun değil.

1.2 Veri hazırlama

Kullanıcılar, detaylı fatura sorgulama, telefon faturası sorgulama ve çevrimiçi iş salonunda iş yeniden yükleme gibi mobil iletişim hizmetlerini kullandıklarında, bu davranışlar, yarı yapılandırılmış bir veri biçiminde merkezi sunucunun web günlüğüne ve işlem kaydına kaydedilecektir. Veri çıkarma ve ön işlemeden sonra, sistemi sürdürmek ve korumak için kullanıcı veri analizi ve veri madenciliği için temel verileri sağlamak üzere bir veri ambarı kurulur. Temelde kullanıcı verileri analizi ile toplanan kullanıcı verileri bilgileri şunları içerir: stok kullanıcıları ve kullanıcı işlem kayıtları hakkında temel bilgiler. Veri öznitelikleri şunları içerir: (1) Mevcut kullanıcıların temel bilgileri, yani kullanıcı telefon numarası, kullanıcı adı, kullanıcı durumu, kullanıcı erişim süresi ve son 3 aydaki hesaplardan elde edilen gelir; (2) Kullanıcı işlem bilgileri, yani ürün kimliği, kullanıcı İletişim numarası, iş türü, önceden depolanmış işlem tutarı ve göz atma süreleri gibi öznitelik bilgileri.

Kullanıcı veri öznitelikleri belirlendikten sonra özniteliklere göre kullanıcı veri matrisi oluşturulur.Matris, ana eksen olarak değer alır, bir çapraz matris oluşturmak için istikrarı birleştirir ve kullanıcı ölçeği ve gelir ölçeği analizi ile birleştirilerek müşteri kodunu tanımlar ve çapraz matris kullanıcıları birleştirir , Önemli-acil matris yönetimi aracılığıyla, kaynak korumanın önceliğini belirleyin. Bunlar arasında, mevcut kullanıcı çapraz matrisi Şekil 2'de gösterilmektedir.

Matris veri formatı aşağıdaki gibidir:

(1) Stok kullanıcı öznitelik matrisi Vm × n

Mevcut kullanıcı bilgi matrisi, esas olarak, kullanıcıların genel yapısını temsil eden kullanıcıların doğal özelliklerini içerir ve bunun spesifik tezahürleri şunlardır:

Bunlar arasında vi, bakımı yapılabilir bir kullanıcıyı temsil eder, toplamda m bakımı yapılabilir kullanıcı vardır; vij, bakımı yapılabilir i kullanıcısının j-inci özniteliğidir ve toplamda n öznitelik vardır.

(2) Kullanıcı ilgi alanı bilgi matrisi Pm × k

Kullanıcı B2C modunda, kullanıcılar işlemleri Web üzerinden gerçekleştirir. İşlem sayısı ve gezinme sayısı farklıdır, bu da kullanıcının ilgisini temsil eder.Ağırlıklı değerler ilgi alanına atanır. Faiz üç kategoriye ayrılır: genel, ilgili ve çok ilgili . Kullanıcı ilgi alanı bilgi matrisi, kullanıcının ilgi düzeyi aracılığıyla oluşturulur.

Bunlar arasında dij, i-inci kullanıcının j-inci işlemdeki ilgi düzeyidir ve değer genel, ilgili ve çok ilgilidir. Yukarıdaki matrisin oluşturulmasıyla, her kullanıcının durumu benzersiz bir şekilde bir vektör olarak temsil edilebilir ve kullanıcının doğası, vektörün hesaplanmasıyla analiz edilebilir.

1.3 B2C ortamına dayalı bir modelin oluşturulması

Kullanıcı davranışı analizi, kullanıcının tüketim tercihlerini anlamak, kullanıcı kaybının nedenlerini analiz etmek, kullanıcı edinme kanallarını belirlemek, kullanıcı memnuniyetini ve tahmini yönetmek için kullanıcı stoğunun doğal özelliklerinin ve kullanıcının ilgi davranışı yörüngesinin özelliklerinin analizini ifade eder. Kullanıcıların sadakati ve kullanıcıları elde tutma planlarının geliştirilmesi.

Yukarıdaki tanıma göre, B2C modeline dayalı bir kullanıcı davranış analizi çerçevesi oluşturulabilir.Şekil 3'te gösterildiği gibi, tam kullanıcı davranış analizi süreci aşağıdaki gibidir:

(1) Kullanıcı ile e-ticaret platformu arasındaki etkileşim süreci;

(2) Veri toplama ve sıralama süreci;

(3) Bilgi edinme süreci;

(4) Veri madenciliği süreci;

(5) Karar optimizasyon süreci;

(6) Tutma sistemini koruyun.

Kullanıcı davranışlarını güvenilir bir şekilde öngörebilen bir tutma ve elde tutma modeli oluşturmak için önce veri kaynakları ve ön işleme analizi gerekir, ardından parametreler belirlenir ve daha sonra tahmin edilir ve tanımlanır.Kimleme sürecinde küme analizi ve veri madenciliği yapılır ve tahmin edilen sonuçlar bir karar ağacında oluşturulur , Ve son olarak, tutmayı sürdürmenin tahmin edilen sonucunu verin.

2 Veri madenciliği algoritmalarının sistemde uygulanması

2.1 Veri analizi

Elde tutmanın sürdürülmesinde, veri madenciliği uygulaması esas olarak aşağıdaki yönlerden ortaya çıkar:

(1) Yeni kullanıcılar edinin

Veri madenciliği yoluyla, farklı kullanıcıların ilgi alanları, tüketim alışkanlıkları, tüketim eğilimleri ve tüketim ihtiyaçları gibi kullanıcı satın alma özelliklerine göre yeni kullanıcılar yükseltilebilir.

(2) Eski kullanıcıları koruyun ve koruyun

Veri madenciliği teknolojisindeki sınıflandırma algoritması, tüm kullanıcıları farklı kategorilere ayırabilir ve kullanıcı memnuniyetini artırmak için farklı kullanıcılar için tamamen farklı ürünler ve hizmetler sağlayabilir.

(3) Eski kullanıcılara çapraz satış

Bir sonraki satın alma davranışını tahmin etmek için eski kullanıcıları çapraz satış yapın.

Veri sınıflandırmanın amacı, veritabanındaki veri öğelerini önceden belirlenmiş bir kategoriye eşlemek için kullanılabilecek bir sınıflandırma modelini öğrenmek ve eğitmektir, özellikle: bir veritabanı D = {t1, t2, ... verildiğinde , Tn} ve bir grup C = {C1, C2, ..., Cm}, sınıflandırma problemi bir f: D C eşlemesini belirlemektir, her tuple ti bir sınıfa atanır ve bir Cj sınıfı için bir eşleme içerir Bu sınıfın tüm demetleri, yani Cj = {ti | f (ti) = Cj, 1in, tiD}.

2.2 Bakım ve tutma sisteminde K-araçlarının uygulanması

K-ortalama algoritması, aynı zamanda k-ortalamalı algoritma olarak da adlandırılan, yaygın olarak kullanılan bir kümeleme algoritmasıdır. K-ortalamalı algoritma, n nesneyi k kümelerine bölmek için bir parametre olarak k'yi kullanır.Her bir küme, düşük birleştirme ve yüksek kohezyon özelliklerini karşılar, yani kümenin içindeki öznitelik öğeleri yüksek derecede benzerliğe sahiptir ve küme ve küme Elemanlar arasındaki benzerlik düşüktür.

2.3 Veri hazırlama

Bakım ve saklama sisteminde, bu makale kullanıcıların tüketim alışkanlıklarının ve davranışlarının özelliklerini analiz etmeli ve bunları kümelemelidir. Bu makale, operatörün kullanıcı verilerini belirli bir aşamada ondan öğrenmek için kullanır ve sonraki veri iyileştirme ve sınıflandırmanın tanıtımı için bir referans sağlamak üzere Tablo 2'de gösterildiği gibi kümelenmiş bir veri örneği verir.

Ardından, Tablo 3'te gösterildiği gibi veri tabanından veri örneklerini seçin.

K-ortalamalar algoritmasına göre, yukarıdaki veri tablosunda verilen kurumsal kullanıcıların küme analizi. Bu örnekte kullanıcının geliri, ARPU, sözleşme bağlama, penetrasyon ve toplam etkili sesli etkileşim daire sayısı analiz edilmiş, aralarındaki potansiyel ilişkiye göre farklı kategoriler elde edilmiş ve bunlara karşılık gelen sonuçlar elde edilmiştir. Kümeleme kuralları. Bu makale, analizin sonuçlarından aşağıdaki kullanıcı özellik kategorilerini elde etmeyi ummaktadır: diğer özellikler kabaca gelirle ilgilidir; sözleşme paketlemesi ve penetrasyonun temelde aynı olup olmadığı. Bu öznitelik kategorileri, kurumsal karar vericilerin, verilerin sınıflandırılmasına dayalı olarak ilgili pazarlama stratejilerini formüle etmesini ve uygulamasını sağlayabilir.

2.4 K-küme algoritması uygulaması anlamına gelir

Bu makale, K-ortalamalı algoritmayı uygulamak için C # dilini kullanır.Tablo 3'te seçilen 50 tüketici kullanıcı, bir kullanıcı örnek dizisi oluşturmak için veri girişi olarak kullanılır, dizi elemanlarının sayısı n = 50'dir; tüm veriler 5 kategoriye, yani küme numarası dizisine bölünür K = 5 sayısı; Öklid uzaklık formülüne göre kullanıcılar en yakın ortalama kümelere ayrılır. Ardından işlem tamamlanana kadar yinelemeli olarak. Algoritma akış şeması Şekil 4'teki gibi gösterilmektedir.

Program çalıştıktan sonra, verileri yüklemek için ilk olarak LoadPatterns (char * fname) alt rutini çağırın ve aynı zamanda verileri Pattern'e dönüştürün. Dizi; daha sonra küme merkezini başlatmak için alt rutin InitClusters'ı çağırın ve veri örneğindeki ilk k örneği ilk küme merkezi olarak seçin; daha sonra program, her nesneyi her bir küme merkezi ile karşılaştıracak olan ana kontrol programı RunKMeans'e girecektir. Veri nesnesi, küme merkezinden en kısa mesafeye sahip kümeye tahsis edilir; daha sonra küme merkezi, nesne tahsisine göre yeniden hesaplanır.Küme merkezi artık değişmiyorsa, yani ConFlag = True, kümeleme tamamlanmıştır, aksi takdirde devam edin Özyinelemeli işlem; son olarak ShowCenters ve ShowCluster alt rutinlerini çalıştırın, küme merkezini ve her bir küme üyesinin sayısını çıkarın, program sona erer.

3 Veri testi ve analizi

Algoritmanın uygulanmasıyla, veri örnekleri girilerek elde edilen sonuçların temelde analiz ile tutarlı olduğu görülmüştür.Kullanıcıları analiz edecek örnek sayısını artırarak, kullanıcılar da tüketim gücü ve tüketme istekliliği elde edebilmektedir.Sonuç dağılımı Şekil 5'te gösterilmiştir.

Şekil 5'te, kullanıcının harcama gücünün eşit olarak dağıtıldığı görülebilir Üst düzey müşteriler, 49 yuan ile 73 yuan arasında eşit olarak dağıtılmıştır ve en yüksek alt uç müşteri sayısı ile aralık 10 yuan ile 12 yuan arasındadır. Tüketim istekliliği genel olarak kullanıcıların tüketim yeteneğinden daha yüksektir ve bu da kullanıcıların büyük bir tüketim potansiyeline sahip olduğunu gösterir. Özellikle, üst düzey kullanıcıların harcama gücü önemli ölçüde artmıştır.

4. Sonuç

Bu makale ilk olarak bir kullanıcı tutma sistemi kurar ve kullanıcı özelliklerini araştırmak ve kümelemek için veri madenciliği algoritmalarını kullanır. Ek olarak, algoritma daha da uygulanır ve son olarak algoritma, operatör tarafından gerçekten üretilen verilerle doğrulanır, bu da sınıflandırma sonucunun doğru ve güvenilir olduğunu gösterir.

Referanslar

Guo Guangliang. Jiangsu Unicom'un müşteriyi elde tutma ve elde tutma stratejileri üzerine araştırma. Şangay: Doğu Çin Bilim ve Teknoloji Üniversitesi, 2011.

Shen Wei, Gao Shang, Mei Feng.Yaşam döngüsü tabanlı bir tutma sistemi kurun.İletişim Kurumsal Yönetimi, 2013 (1): 76-77.

Liu Chen, Sun Xiujie, Li Xiang.Telekom Şirketi Müşteri Elde Tutma Uygulama Veri Madenciliği Tartışması Pazar Modernizasyonu, 2008 (24): 29.

Ye Sheng, Pang Guiyong BCS veri ambarına dayalı Guangxi Unicom envanter bakım sistemi Guangxi İletişim Teknolojisi, 2014 (3): 34-40.

Liu Zhichao, Wang Lei, Gu Lei, vb Veri Madenciliği Teknolojisine Dayalı Müşteri Kaybı Erken Uyarı Modeli Mikrobilgisayar Bilgileri, 2011, 27 (2): 176-177.

Wen Dushi. Veri ambarına dayalı müşteri tutma sistemi Mikrobilgisayar ve Uygulama, 2015, 34 (18): 11-13.

Zhang Jie, Zhuo Ling, Zhu Yunyou. K-ortalamalı kümeleme algoritmasının iyileştirilmesi ve uygulanması. Elektronik Teknoloji Uygulaması, 2015, 41 (1): 125-131.

Huang Haixin, Wu Di, Wen Feng. Karar Ormanı Araştırmasının Özeti Elektronik Teknoloji Uygulaması, 2016, 42 (12): 5-9.

yazar bilgileri:

Shi Yuanbo 1, Zhang Xinming 1, Huang Yueyang 2

(1. Bilgisayar ve İletişim Mühendisliği Okulu, Liaoning Petrol ve Kimya Teknolojisi Üniversitesi, Fushun 113001, Liaoning;

2. Bilgi ve Kontrol Mühendisliği Okulu, Liaoning Petrol ve Kimya Teknolojisi Üniversitesi, Fushun 113001, Liaoning)

200.000 sınıf yedi koltuklu SUV Bu birkaç arabayla, binmek için yeterli olmadığından mı endişeleniyorsunuz?
önceki
Mobile Evening News: IDC 20184.Çeyrek raporunu yayınladı, Nubia LG ürünleri planlanandan önce tanıttı
Sonraki
Yeni bir Japon çalışması olan "Lapis li Abyss" in fragmanı ve sistem detayları yayınlandı
WeChat grubuna davet edilecek bir sonraki kişi kimdir? Tsinghua Tencent IJCAI Makalesinin Bir Yorumu
Tiguan L satın almaya değer mi? Xiaobian bir veya ikisini analiz etmenize yardımcı olur
Edebiyat tanrısı Ethan Hawke kuşatıldı. Bu aksiyon filminin benzersiz mizacını özetleyen bir poster
SMP 2017 başarıyla kapandı Çin ve İngiltere'deki en iyi kağıt kim olacak?
Ortak girişim küçük araba satışlarının kralı için verilen savaş, gösteriş yapmak mı yoksa POLO mu?
"Sektördeki insanlar" Kullandığınız sıcak hava tabancası güvenli mi?
"Kendi baş güvenlik subayınız olun!" Zhongtian Savunma, Pekin Chaoyang Normal Okuluna Bağlı İlköğretim Okuluna girdi.
Great Wall Haval H6 satın almaya değer mi?
Geri besleme devresinin tanıtımı ve işlevi
Yi Yang Qianxi, Birleşmiş Milletler Gençlik Forumu'na, otoriter başkan tarzını gösteren gri ve mavi bir takımla katıldı.
8 milyar ABD doları, Intel İrlanda'da iki çip fabrikası kurmayı planlıyor
To Top