Özel | Fintech'te Büyük Veri ve Yapay Zeka Teknolojisinin Uygulanması

Bu makale Bairong Financial Services CEO'sundan seçilmiştir. Angela Chang Ve CRO Çeyrek yuan 14 Eylül 2017 akşamı Tsinghua Big Data "Technology · Frontier" Ders Serisi-Fintech'te Büyük Veri ve Yapay Zeka Teknolojisinin Uygulaması Paylaşın. İki yaşlı, finans endüstrisi ve finans teknolojisi alanındaki yıllarca keşiflerini, sahtekarlıkla mücadele, kredi riski belirleme, sorunlu varlık toplama ve finans alanında hassas pazarlama gibi iş senaryolarıyla birleştirdi ve yüzleşme oluşturma ağını, göç öğrenimini, pekiştirmeli öğrenmeyi vb. Açıkladı. Finans sektörü modelleme uygulama yöntemleri.

Sahne arkası "0914" anahtar kelimesini yanıtlayın, dersin PPT'sinin tam sürümünü indirin .

Zhang Shaofeng, Bairong Finansal Hizmetler CEO'su

Bairong Finansal Hizmetler CRO Çeyrek Yuan

Zhang Shaofeng: Öncelikle, bu raporu tüm mezunlar ve arkadaşlarımla paylaşmak için mezun olduğum okuluma döneceğim için çok heyecanlıyım. Finansal teknoloji alanına 2012 yılında girdik. İlk olarak bankalar ile iletişime geçerek şirketimizin banka uygulamalarına model olarak makine öğrenimi algoritmalarını kullanmasını sağladık.O zamanlar bankaların kullandığı algoritmaya lojistik regresyon algoritması adı verildi. Nispeten basit algoritma. Ama verinin yararlı olduğuna kesin olarak inanıyorum.Ne olduğuna gelince, ne olduğunu gerçekten bilmiyorum, ancak finans endüstrisindeki büyük bir patlama ve değişimden sonra, finans alanındaki verilerin uygulamasının bu kadar doğrudan olduğunu keşfettim.

Finans sektörünün çok önemli bir ayağı kredi sistemidir. Çin'de hala kredi geçmişi olmayan finansal ihtiyaçları olan 7,8 milyar insan var.Bu, Çin'in sözde kapsayıcı finansmanını kısıtlıyor, küçük ve mikro işletmelerin gelişimini ve tüketim gelişimini teşvik ediyor Bu bir altyapı sorunu.

Büyük veri uygulama katmanlaması

Büyük veri endüstrisi açısından bakıldığında, bazıları yaygındır.

İlk adım veri toplamaktır.

İkinci adım, veri işlemedir. Verileri standartlaştırın, kirli verileri temizleyin, hatalı verileri temizleyin veya bazı hassasiyetleri azaltın.

Üçüncü adım, veri boyutluluğunun azaltılmasıdır. Tablonun her satırı bir kullanıcı ise ve bir tablodaki sütun sayısı 500.000 kadar ise, bu çok büyük bir boyuttur ve işlendiğinde verimlilikte düşüşe neden olur.Bazı veri boyutunda azalma ve bazı türev değişkenlerin yapılması gerekir.

Dördüncü adım veri modellemedir. Finansta en önemli iki model var: İlk kategori pazarlama modelidir , Kimin hangi tür finansal hizmetlere ihtiyacı olduğunu tahmin etmek, özellikle müşterilerin ihtiyaçlarını tahmin etmek. İkinci kategori risk kontrol modelidir.

Beşinci adım, büyük veri uygulaması. Farklı endüstriler farklı uygulamalar yapar.

Finans sektörü özel olarak hangi alanlarda kullanılabilir?

ilk adım Çözüm doğru Pazarlama . İyi ve talepkar müşteriler bulmak için bu iki standardın üst üste getirilmesi gerekir. Finans sektöründe hassas pazarlama, finans endüstrisindeki hassas pazarlamanın özelliği olan sıradan tüketici ürünlerinden çok daha zordur.

İkinci adım , Giriş . Kredinize başvurmak veya sigortanızı satın almak için gelirse, onu yatırabilir misiniz? Bir kez onaylamalısın. Örneğin, kredi başvurusu yapmak veya kredi kartı başvurusu yapmak için bir bankaya giderseniz, birçok bilgi girmeniz istenir.

üçüncü adım , Mevcut müşterilerin İşletme Veya ödünç olarak yönetin.

dördüncü adım , Gecikmiş . Bu, kredi sonrası yönetimdir.

Pazarlama, erişim, operasyon ve gecikmeden, bu dört adımın her biri, verimliliği artırmak için büyük veri ve yapay zeka algoritmalarından tam olarak faydalanabilir.

Hile yapma olasılığınızın ne kadar olduğunu değerlendirmek için bir dizi dolandırıcılıkla mücadele motor puanını iyileştirdik. Kural, bir durumla karşılaşıldığında ne yapılması gerektiğidir. Model, dolandırıcılıkla ilgili karar mantığını ve verileri çıkarmaktır.

Ürünleriniz ve müşterileriniz diğer finans kurumları ile tam olarak aynı olamayacağı için finans kurumları için özelleştirilmiş hizmetler sunuyoruz. Modelimiz farklılaştırılabilir, veri hazırlama, ön tarama, aktarma testi, nispeten yüksek korelasyon değişkenlerinin taranması, veri segmentasyonu ve son olarak modelin oluşturulması.

Finansal kurumların ve denetçilerimizin kurallara uyulup uyulmadığını ve müşteri gruplarının nasıl dağıtıldığını daha net görmelerini sağlamak için bazı görsel algoritmalar kullanıyoruz. Örneğin, hedef puan segmentinde şirketimizin puanı 300 ile 1000 arasındadır. Örneğin, 700 puana sahip bir kişi varsayılan olarak 100 kişiden yalnızca 3'üne karşılık gelir ve 500 puan alan bir kişi varsayılan olarak 100 kişiden 7'sine karşılık gelir. Farklı puan segmentleri anlamına gelir Farklı varsayılan oranlarla, şu anda 700 sentten fazla borç vermem gerektiğini biliyorsunuz. Bu puanlama finans kuruluşları için çok önemlidir. Dışarı çıkması için 10.000 yuan ödünç veren her 500 kişi için ne kadar kaybedeceğinizi hesaplayabilirsiniz Puanlama sistemi tahmin etmenize yardımcı olacaktır.

Daha sonra, Bairong Finansal Hizmetler CRO'su Bay Ji Yuan sizinle özel başvuru vakalarını paylaştı.

Durum 1: Çete dolandırıcılığını tespit etmek için uygulanan grafik derin öğrenme

Ji Yuan: Grup dolandırıcılık takibi ve dolandırıcılık önleme açısından Bairong, esas olarak denetimsiz anormal davranış izleme ve denetimli öğrenme-coğrafi konum anomalisi analizini (Geohash) benimsiyor

, Spesifik uygulama, grafik özelliği öğrenme algoritması yoluyla yapılır.

Bu, grafik özelliği öğrenme algoritmasının genel çerçevesidir. Girdiğimiz şey müşteri grafiğimizin özellikleri olduğu için, bu grafik kenarları ve noktaları içerir ve grafiğin topolojisinin ve düğümlerinin bu nitelikleri müşterinin temel özelliklerini oluşturur. Derin sinir ağları aracılığıyla, bu temel özelliklerden daha karmaşık özellikler elde edilir. Nihai çıktı nedir? Biri türetilmiş özellik, diğeri ise gözlem, matematiksel özelliği temel uçtan türetmek için gözlem iyi bir şey oluşturacak ve bu algoritmayı diğer bölümlere aktaracaktır.

Soldaki tablo, yaygın olarak kullanılan özellik operatörlerimizden bazılarıdır. Bu resim, belirli bir bölümdeki belirli bir aşamayı yansıtır.BaiRong, DI özelliğinden, Faier aracılığıyla yeni özellikler elde eder. Bu algoritmanın aslında dört avantajı vardır:

ilk Farklı öznitelik grafiklerini destekler, çünkü genellikle grafiklerimiz yalnızca topolojik yapıyı yansıtabilen düğümler ve kenarlardır;

ikinci Ağlar arası geçiş öğrenimi için karmaşık ilişkisel işlevler üretebilir;

üçüncü Seyrek özellikleri öğrenebilir.

dördüncü Paralelliği destekler ve algoritma verimlidir.

Bu, belirli bir müşterinin Ocak-Mayıs 2017 arası kullanıcı uygulama verileridir. Başvuru sayısı 340.000, kullanıcı sayısı 47.000 ve toplam 70 özellik bulunmaktadır. Algoritmamız aracılığıyla 238 gruba ait 12.000'den fazla dolandırıcı kullanıcı belirledi.

Durum 2: Pekiştirmeli öğrenme, koleksiyon modelinin inşasına uygulanır

Bir finans kuruluşundan borç para aldıktan sonra, vadesi geçen parayı geri ödemezseniz, finans kurumu sizi gecikmiş zamanınıza göre dahili olarak böler.Mi bir aylık gecikmeyi ve M2 iki ayı temsil eder. Gecikme süresi, size farklı toplama eylemleri verecektir.

Buna sıra açısından bakmalıyız, çünkü farklı insanlar farklı eylemlere farklı tepki verir. Aslında, eylemin her adımınız takip sonuçlarını etkileyecektir, tüm sürecin en büyük geri bildirimi, hangi bağlantılarda hangi eylemleri gerçekleştireceğimizi belirlemek için kullanılmalıdır. Burada toplama sürecini bir Markov karar süreci olarak tanımlıyoruz.

Markov karar sürecini pekiştirmeli öğrenme yoluyla çözün. Her şeyden önce, bir fiyat fonksiyonu belirlemelisiniz ve ikinci olarak, farklı zaman dilimlerinde geri kazandığınız para, indirim faktörü kullanılarak halihazırda gördüğünüz maksimum değere dönüştürülür. Değer fonksiyonunun en iyi avantajına ihtiyacımız var.Bu algoritma, değer yinelemesi yoluyla uygulanır.

Durum 3: Transfer öğreniminin müşteri grubu derecelendirme yapısına uygulanması

Kredi puanlama sistemimiz bir genel puan artı 6 müşteri grubu puanı içerir Genel puan Susam Puanına benzer. Finans kurumlarında bu puan nasıl kullanılır? Bu grafiği görebiliriz. Çubuk grafik, farklı puan segmentlerindeki kişilerin oranını gösterir. Çizgi grafiği, farklı puan segmentlerindeki kişilerin varsayılan oranıdır. En düşük 300 puan segmentinin varsayılan oranının% 20'nin üzerinde ve en yüksek 700 puan veya daha fazla olduğunu görebiliriz. % 1'den az. Dolayısıyla bir finans kurumu puanı 500 ve üzeri olan kişileri seçerse bu, soldaki 500 puanlı kişilerin reddedilmesi ve sadece 500 ve üzeri puan alanların kusur oranının% 8'in altında olması durumunda kusuru azaltmak istiyorsa demektir. Örneğin,% 4'lük bir azalma, erişim standardını yükseltmesi gerektiği anlamına gelir ve erişim eşiğini 600 veya üstüne çıkarabilir.

Bu bizim 6 müşteri grubu derecelendirmemizdir.Bu derecelendirme aslında finans kuruluşları için çok önemlidir, çünkü herkes tüm kötü adamları filtrelememizi ve tüm iyi olanları dahil etmemizi ister. Bunu başarmak imkansızdır. Gerçekte, puanımız genellikle ikisi arasındadır ve hedefimiz mümkün olduğunca en iyi kısma yaklaşmaktır. Bu 7 standart derecelendirmeye ek olarak, özelleştirilmiş ürünlerimiz de var.Şu anda Shao Feng, müşteriler için özelleştirilmiş modellemeyi başlattı, çünkü iyi müşteriler, benzersiz bir Puan, böylece etki standart puandan daha iyi olacaktır.

Kredi notu oluşturma sürecinde bazı pratik problemler var Bu problemlerden bahsetmeden önce, size transfer öğrenmenin ne olduğuna dair kısa bir giriş yapacağım. İki temel kavram:

İlk Evet alan , Alan aslında iki öğe içerir, X özellik aralığı, bu değişkenlerin boyutları ve P (X), aslında bizim örneğimiz olan özellik uzayındaki olasılık dağılımı ve bu özelliklerin dağılımıdır.

ikinci Evet görev , Görev, denetimli öğrenmenin bir parçası olan örnek özellik alanında iyi veya kötü olan bir etiket alanı veya daha fazla içerik içerir.

Bu koşullu olasılığı bulmak için etki alanını ve etiket alanını biliyoruz.

Transfer öğrenmede, biri kaynak alan ve kaynak görev, diğeri hedef alan ve hedef görev olmak üzere iki alan ve hedef gereklidir. Az önce yapılan tanıma göre, şimdi dört durumumuz var:

ilk , Kaynak etki alanının özellik alanı, hedef etki alanınınkinden farklıdır;

ikinci , Marjinal olasılık dağılımı farklıdır;

üçüncü , Etiket alanı farklıdır;

dördüncü Koşullu olasılık farklıdır.

Bu dördünün kombinasyonu 16'dır, ancak gerçek hayatta bu 16 kombinasyon olmayacak. Daha tipik olanlar dahil şu üç kategori:

İlk Çevrimiçi müşteri grubu ve çevrimdışı müşteri grubudur, özellikleri farklıdır, çünkü çevrimiçi müşteri grubunun özelliklerinin daha fazla boyutunu toplayabiliriz;

İkinci Esas olarak marjinal olasılık dağılımına ve koşullu olasılık dağılımına yansıyan, aynı ürünün farklı kurumlarının müşteri grubudur;

Üçüncü Temelde farklı özellik uzayları ve koşullu olasılıklar nedeniyle aynı organizasyondan farklı ürünlerden oluşan bir müşteri grubudur.

Modelleme sürecinde daha gerçekçi problemlerle karşılaştık Bazı müşteriler size etiket alanını söylemedi Bu durumda nasıl model yapılır?

ilk adım Kaynak ve hedef alanın özelliği, alan uyarlama algoritması ile azaltılır.

İkinci adım , Bir marjinal dağılım deneyi oluşturun. Kaynak etki alanı ile hedef etki alanının marjinal dağılımı arasındaki farkı tanımlamak için bir işlev oluşturun ve iki olasılık dağılımı arasındaki farkın ne kadar büyük olduğunu ölçün.

üçüncü adım Koşullu dağılım deneyinin planlanması. Kaynak görevin koşullu olasılığı ile hedef görevin koşullu olasılığı arasındaki farkı belirleyin.

dördüncü adım , Optimizasyon için amaç işlevini oluşturmak için ilk iki adıma dayanır.

beşinci adım , Yinelemeli işlemler gerçekleştirin.

Örnek 4: Kredi öncesi dolandırıcılıkla mücadele için bilgi haritasının uygulanması

Bilgi grafiği temelde anlamsal bir ağdır.Yapay zeka alanında her zaman iki okul vardır, bunlardan birine Bağlantısallık , İlk vakamızda bahsettiğimiz derin sinir ağı, bağlantısallığa aittir, insan beynini simüle eden ve esasen istatistiksel olan bir donanım yapısıdır. İkinci türe denir Sembolizm Bilgi grafiği sembolizme aittir ve aslında insan beyni yazılımı olan insan beyninin muhakeme yöntemini simüle eder. Bu iki tür aslında paraleldi, 1950'lerde ve 1960'larda yapay zeka ilk ortaya çıktığında sembolizm ön plana çıktı.Son yıllarda hesaplama gücünün gelişmesiyle birlikte bağlantısallık ortaya çıkmaya başladı.

Bilgi grafiği, insan deneyiminin bilgi temsili ve muhakemesine eşdeğerdir, bu nedenle deneyimi bir bilgi grafiğinde sağlamlaştırmanız ve bu anlamsal işlemler aracılığıyla dolandırıcılık önleme kararları vermeniz gerekir. Akıl yürütmeyi genellikle şu şekilde ikiye ayırırız: tutarsızlık doğrulaması; kurumsal anormallik analizi.

Bilinmeyen doğrulama, örneğin, iki kişi aynı ünite telefonunu kullanıyor, ancak ünite adı ve ünite adresi farklı Deneyimlerimize göre bu mantıklı değil.Bu tür sahtekarlıklar bilgi grafiği aracılığıyla tanımlanabilir.

Statik analiz, ilk durumumuzda anlatılan yapıya benzer. Dinamik analiz, normal şartlar altında, insan davranış özellikleri istikrarlı olmalıdır, kısa sürede hızlı bir şekilde değişirseniz, o zaman sizin de sahtekarlıktan şüphelenildiğinizi düşünüyoruz.

Yukarıdakiler paylaştığım ana içerik, hepinize teşekkür ederim.

Angela Chang Tsinghua Üniversitesi'nden mezun olmuştur ve Tsinghua Üniversitesi'nden elektrik mühendisliği ve otomatik kimya alanlarında lisans ve yüksek lisans derecesine sahiptir. BT ve büyük veri alanında 15 yıllık deneyime sahip, sürekli bir girişimci ve Oracle, ESS ve IBM gibi birinci sınıf teknoloji şirketlerinde çalışmıştır. Bir zamanlar veri madenciliğine odaklanan bir şirket olan dahiyane Broadcom'u kurdu ve başkan yardımcısı olarak görev yaptı; 2009'da büyük veri teknolojisi ve uygulama hizmetlerinde en iyi şirket olan Baitong Technology'yi iki ortakla kurdu ve şimdi şirket yerel tavsiye motorunun% 90'ından fazlasını işgal etti. Market. 2014 yılında Bay Zhang Shaofeng, finans alanında büyük veri finansal bilgi hizmetlerine odaklanan bir şirket olan Bairong Financial Services'i kurdu ve CEO olarak görev yaptı.

Çeyrek yuan Sn., Tsinghua Üniversitesi Matematik alanında doktora sahibidir. Yaklaşık on yıldır banka risk yönetimi ile uğraşmaktadır. Finansal risk kontrolü, kantitatif yönetim, risk stratejisi optimizasyonu ve diğer işlere aşinadır. Eskiden Çin Everbright Bank'ın Finansal Piyasa Riski Bölümünde, finans sektörü veri analizi ve platform mimarisinde direktör olarak görev yapardı Model araştırması ve risk stratejisi ve diğer yönler derin bir anlayışa ve derinlemesine araştırmaya sahiptir. 2017 yılında Bairong Financial Services'e CRO olarak katıldı ve Bairong Financial Services'in genel risk kontrol işinden tamamen sorumludur.

Tsinghua-Qingdao Veri Bilimi Enstitüsü "Teknoloji Sınır" dersleri dizisi, bilgi yayma misyonu, yeni büyük veri teknolojilerini paylaşma ve sınır zorlukları; yeni zorluklar ve büyük verilerin karşılaştığı çeşitli sınır teknolojileri sunmayı ve okulun bilimsel araştırma ekibiyle etkileşim kurmayı hedefliyor ile iletişim kurun. Daha heyecan verici kuru ürünler ve çevrimdışı etkinlikler için lütfen THU Data Pi (ID: datapi) ve kardeş numarası Data Pi THU (ID: DatapiTHU) 'a dikkat edin.

Bairong Financial Services işe alıyor ve aday öğrenciler, işe alım bilgilerini görüntülemek için sahne arkasına "Bairong" diye yanıt veriyor ~

Daha fazla heyecan için lütfen Tsinghua-Qingdao Veri Bilimi Enstitüsü'nün resmi WeChat hesabına dikkat edin "THU Data Pie" sahne arkası yanıt anahtar kelimesi "0914", dersin tam sürümünü indirin PPT .

Eski sahibini 7 maçta + 5 gol öldür! Balotelli kenarda oynuyor, eski teknik direktör utanmış görünüyor
önceki
2 oyun bombalandı ve 3 dünya dalgası! Manchester United kalecisi arka plan tahtası oldu, ünlü yıldız gerçeğe dikkat çekti
Sonraki
Guangyuan, Qingchuan'daki 36 kasabadaki yangın söndürme tesislerinin tam kapsamı
Özel iPhone X yüz tanıma, veri güvenliği düşüncesini tetikler
Google yapay zekası gökyüzüne karşı, ortağınızı size uygun hale getiriyor
GIF Ustası! 34 yaşındaki Iniesta, Japonya'da üç solo gol attı, bu uzun geçiş sarhoş
Özel Optimizasyon algoritmasını anlamak için bir makale
Hızlandırılmış değiştirme, ikinci el cep telefonu ticaret bağlantı analizi 36Kr Araştırma
La Liga'da tuhaf bir sahne! Real Madrid'in rakipleri 5 dakika içinde iki kez havaya uçtu ve VAR odası boştu
Özel | Michael I. Jordan'ın son Tsinghua ders notları!
Bundesliga'da ilginç bir sahne! Japon milli oyuncu boş bir kaleye vurdu, ancak top kale çizgisindeki karla engellendi
Özel Çevresel Büyük Veri Uygulama Örnekleri ve Beklentileri
Zayıf ve çaresiz! Bu bebek tembel hayvan doğumda annesi tarafından reddedildi
Özel Wang Haifeng, ilk olarak Baidu AI stratejik düzeni hakkında konuşuyor (PPT indirme ile)
To Top