g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

"280 sayfalık JP Morgan Raporu" Büyük Veri ve Yapay Zeka Stratejileri-Makine Öğrenimi ve Yatırım için Alternatif Veri Yöntemleri

Xinzhiyuan Derlemesi

Raporun tamamını indirmek için Xinzhiyuan WeChat resmi hesabında "JP Morgan" ı yanıtlayın.

Büyük veri, özellikle alternatif veri setlerinin oluşturulması ve kullanılması, yatırım alanının çehresini büyük ölçüde değiştirdi.

Serbest yatırım fonları ve diğer deneyimli yatırımcılar "alternatif veri" tüketimini artırıyor. Yatırım kararlarını etkileyebilecek ancak piyasa istatistikleri ve şirket finansal raporları gibi geleneksel bilgiler olmayan her türlü veriye "alternatif veri" denir.

Bununla birlikte, uzman bir veri bilimcisi olmadan, bu tür verilerin kullanımı zordur ve bazen güvenilmezdir. Hedge fonları, yakın zamanda uydu görüntüsü analizi gibi verileri elde edebildi, bu nedenle değerini doğrulamak için çok fazla tarihsel veri yok. Bazı eleştirmenler, bu tür karmaşık şirket yöntemlerinin ve ekonomik analizin faydalarının abartıldığına inanıyor.

Kısa bir süre önce, Microsoft AI baş bilimcisi ve IEEE Üyesi Deng Li, Yapay Zeka Baş Sorumlusu olarak riskten korunma fonu şirketi Citadel'e katılmak için Microsoft'tan ayrıldı. Bu haber bir kez daha insanların dikkatini yapay zeka teknolojisinin, özellikle de finansal yatırım alanında makine öğrenimi teknolojisinin uygulanmasına çekti.

JP Morgan'ın 280 sayfalık en son araştırma raporu "Büyük Veri ve Yapay Zeka Stratejileri-Yatırım Odaklı Makine Öğrenimi ve Alternatif Veri Yöntemleri", makine öğrenimi tekniklerini kullanarak hedge fonlar ve yatırımcılar tarafından alternatif verilerin kullanımını ve analizini tarar, inceler ve tahmin eder. Şirketin mevcut durumu ve geleceği, ortaya çıkan bu trendden endişe duyan tüm insanlar ve tüm yatırımcılar için önemli bir referans değerine sahiptir. Bu uzun raporun çok küçük bir bölümünü seçip okuyuculara ve arkadaşlara tanıttık ve raporun indirilmesini sağladık.

Bu veri-makine öğrenimini analiz etmek için alternatif verilerin ve yeni niceliksel teknolojinin kullanılabilirliği, yeni bir rekabet avantajı kaynağı haline geliyor

Büyük veri ve makine öğrenimi "devrimi": Şu anda çoğu kayıt ve gözlem, ağa bağlı cihazlar tarafından elektronik olarak elde edilmektedir. Bu, ilke olarak, yatırımcıların gerçek zamanlı olarak piyasa ile ilgili çok çeşitli verilere erişmesine izin verir. Örneğin, milyonlarca enflasyon kaleminin çevrimiçi fiyatını, mağaza ziyaretlerinin sayısını ve gerçek zamanlı satış hacmi tahminlerinde işlem görebilecek müşteri sayısını değerlendirmek için kullanılabilir ve petrol kulelerinin uydu görüntüleri veya tarımsal üretim çıktıları değerlendirilebilir. Tarihsel olarak, benzer veriler yalnızca düşük frekanslarda (aylık CPI, haftalık donanım numaraları, USDA ürün raporları, perakende satış raporları, üç aylık gelir vb.) Sağlanabilir. Mevcut veri miktarı göz önüne alındığında, deneyimli bir kantitatif yatırımcı, geleneksel veri kaynaklarından elde edilemeyen gerçek zamanlı şirkete özgü verilere teorik olarak yaklaşabilir. Pratikte, yararlı verilerin elde edilmesi kolay değildir, satın alınması gerekir ve alınıp satılabilir sinyalleri çıkarmak için alternatif veri setlerinin organize edilmesi ve analiz edilmesi gerekir. Büyük veya yapılandırılmamış veri kümelerinin analizi genellikle makine öğrenimi kullanılarak yapılır. Kantitatif stratejilerin tasarlanmasında, makine öğrenimi tekniklerinin başarılı bir şekilde uygulanması, belirli teorik bilgi ve çok sayıda pratik deneyim gerektirir.

Alpha'yı takip etme mücadelesi sürecinde (finansal olmayan alandaki okuyucular için Alpha, basit bir şekilde aşırı getiri olarak anlaşılabilir), fon yöneticileri giderek artan bir şekilde nicel stratejileri benimsiyor. Bu veri-makine öğrenimini analiz etmek için alternatif verilerin ve yeni niceliksel teknolojinin kullanılabilirliği, yeni bir rekabet avantajı kaynağı haline geliyor . Bu "endüstriyel veri devrimi", Alpha'ya bilgi üstünlüğü ve yeni, ilgisiz sinyalleri keşfetme yeteneği sağlamayı amaçlamaktadır. Büyük veri bilgisinin avantajı, cep telefonları, uydular ve sosyal medya gibi yeni teknolojiler tarafından oluşturulan verilerden gelir. Büyük verilerin bilgi avantajı doğrudan uzmanlar, endüstri ağları ve hatta kurumsal yönetim yetenekleriyle ilgili değildir, ancak daha çok büyük miktarda veri toplama ve gerçek zamanlı olarak analiz etme becerisini içerir. Bu bağlamda, büyük veri, yatırım ortamını derinlemesine değiştirme ve yatırım endüstrisi eğilimini özgür ve kararlı olmaktan nicel yatırım tarzına daha da dönüştürme yeteneğine sahiptir.

Büyük veri devrimini mümkün kılan üç eğilim vardır:

1) Mevcut veri miktarındaki üssel artış;

2) Bilgi işlem gücü ve veri depolama kapasitesinin maliyetini artırın;

3) Karmaşık veri kümelerini analiz etmek için makine öğrenimi yöntemlerinde ilerleme sağlanmıştır.

Büyük veriyi tanımlamak için kullanılabilecek sık kullanılan birçok kavram vardır. Burada, büyük veriyi tanımlamak için en kısa boyutları veriyoruz:

Büyük verinin üç önemli karakteristik boyutu vardır:

kitle : Kayıtlar, bültenler, çizelgeler, dosyalar, vb. Aracılığıyla toplanan ve saklanan verilerin ölçeği, büyük verinin büyük ünün alt sınırı sürekli artmaktadır;

hız : Veri gönderme ve alma hızı genellikle büyük verinin önemli bir özelliği olarak kabul edilir. Büyük veriler gruplar halinde iletilebilir; büyük verilerin elde edilmesi gerçek zamanlı veya neredeyse gerçek zamanlı olarak gerçekleştirilir.

Çeşitlilik : Büyük verilerin genellikle çeşitli biçimlerde yapılandırılmış (SQL tabloları veya CSV dosyaları gibi), yarı yapılandırılmış (JSON veya HTML gibi), yapılandırılmamış (blog veya video bilgileri gibi) vardır.

Alternatif veri setlerinin sınıflandırılması

Yatırım yönetiminde, büyük veri devriminin özü, veri kaynakları ile bilgi avantajları sağlamaktır. Alternatif verilerin avantajı, geleneksel bilgi kaynaklarında bulunmayan yeni bilgileri keşfetmede veya aynı bilgileri daha hızlı ve daha erken keşfetmede yatıyor olabilir. Örneğin, madenlerin veya arazinin uydu görüntüleri, medya veya resmi raporlardan önce arz kıtlığını ortaya çıkarabilir.

Büyük veriler için bir çerçeve veya sınıflandırma sağlamayı hedefliyoruz. Öncelikle verileri, verilerin nasıl oluşturulduğuna göre sınıflandırıyoruz. Ardından, veri setinin varlık sınıflarına veya yatırım tarzlarına eşlenmesi, alfa içeriği, veri kalitesi, teknik özellikler vb. Gibi doğrudan yatırım uzmanlığı ile ilgili olan veri setinin özelliklerini dikkate alıyoruz.

Öncelikle veri kaynaklarını yüksek düzeyde sınıflandırıyor ve bunların bireyler (sosyal medya gönderileri gibi) tarafından mı, iş süreçleri (e-ticaret veya kredi kartı işlem verileri gibi) tarafından mı yoksa sensörler (uydu görüntüleri, radar gibi) tarafından mı üretildiğine dikkat çekiyoruz. Vb) oluşturuldu.

Yukarıdaki şekil bu sınıflandırmayı göstermektedir. Bu yaklaşım, finansal olmayan metinlerdeki Kitchin (2015) ve Birleşmiş Milletler raporunun (2015) ilk girişimlerini genişletiyor. Bu sınıflandırma sadece bir dereceye kadar teorik olsa da, bu üç tür veriyi analiz ederken gerçekten ortak özellikler, analiz yöntemleri ve ortak zorluklar vardır. Örneğin, kişisel olarak oluşturulan veriler genellikle yapılandırılmamış metin biçimindedir ve doğal dil işlemeyi gerektirir. Algılayıcılar tarafından üretilen veriler genellikle yapılandırılmamıştır ve nesneleri saymak veya hava / bulutların etkisini uydu görüntülerinden kaldırmak gibi analiz teknikleri gerektirebilir. Kredi kartı işlemleri ve şirketin "terk edilmiş" verileri gibi ticari olarak oluşturulmuş birçok veri kümesi, ortak yasal ve gizlilik sorunları ile karşı karşıyadır.

Verileri veri kaynağına göre sınıflandırdıktan sonra, yatırımcıların daha fazla ilgilenebileceği başka bir sınıflandırma yöntemi sunmamız gerekiyor. Bir perakende sektöründeki bir portföy yöneticisi, ister uydular tarafından üretilsin ister tüketiciler tarafından gönüllü olarak doldurulsun, belirli satış verileriyle daha fazla ilgilenebilir. Yüksek frekanslı tüccarlar, Twitter, en son sürümler vb. Gibi her gün üretilen verileri önemsemekte, ancak kredi kartı verileri gibi önemli gecikmeler içeren bilgiler hakkında daha az endişe duymaktadır. Aşağıdaki şekildeki "yatırım sınıflandırması" nda, çeşitli alternatif veriler için, CIO'lar ve portföy yöneticileri gibi yatırım profesyonelleri için oldukça alakalı olan farklı nitelikleri işaretledik.

Makine öğrenimi teknolojisinin sınıflandırılması: yapay zeka nedir

Büyük ve daha az yapılandırılmış veri kümeleri genellikle basit elektronik tablo çalışması ve dağılım grafikleri ile analiz edilemez. Yeni veri setlerinin karmaşıklığını ve ölçeğini çözmek için yeni yollara ihtiyacımız var. Örneğin, finansal analistlerin standart araçlarını kullanarak yapılandırılmamış verileri (görüntüler, sosyal medya ve basın bültenleri gibi) otomatik olarak analiz etmek imkansızdır. Büyük geleneksel veri kümelerinde bile, basit doğrusal regresyon kullanımı çoğu zaman aşırı uyum veya tutarsız sonuçlara yol açar. Makine öğrenimi yöntemleri, büyük verileri analiz etmek ve geleneksel veri setlerini daha etkili bir şekilde analiz etmek için kullanılabilir.

Hiç şüphe yok ki, makine öğrenimi teknolojisi görüntü tanıma, örüntü tanıma, doğal dil işleme ve otonom araçlar gibi karmaşık görevlere uygulandığında bazı şaşırtıcı sonuçlar verdi. Peki, makine öğreniminin finanstaki uygulamaları nelerdir ve bu yöntemler birbirinden nasıl farklıdır?

İlk olarak, görev otomasyonunun makine öğrenimi olmadığı vurgulanmalıdır. . Bilgisayara belirli eylemleri sabit kurallara göre gerçekleştirmesi talimatını verebiliriz. Örneğin, bir varlığın fiyatı belirli bir miktarda düşerse (zararı durdur), bilgisayara varlığı satma talimatı verebiliriz. Bir makineye ("sembolik yapay zeka" olarak da bilinir) çok sayıda karmaşık kural verilse bile, bunun makine öğrenimi olduğu anlamına gelmez, yalnızca görev otomasyonu olduğu söylenebilir. Bu "sembolik yapay zekayı" kullanan makine, yalnızca önceden programlanmış kurallara uymayan bir durumla karşılaştığında kendisini "dondurmayı" seçecektir.

Makine öğreniminde, bilgisayara bir girdi (bir dizi değişken ve bir veri kümesi) verilir ve çıktı, girdi değişkenlerinin sonucudur. Makine daha sonra girdi ve çıktı arasında bağlantı görevi gören kuralları keşfeder veya "öğrenir".

Sonunda, bu öğrenme görevinin başarısı bir "örneklem dışı test" e, yani bilinmeyen bir durumda elde ettiği bağlantı değişkenleri ile olası tahmin sonuçları arasındaki ilişkiyi test etme becerisine tabi tutulacaktır.

Makine öğrenimi denetlenebilir veya denetimsiz olabilir. Denetimli öğrenmede, değişkenleri tahmin etmek için kullanılabilecek bir "denklem" olan bir kural bulmaya çalışırız. Örneğin, gelecekteki piyasa performansını tahmin edebilen bir sinyal bulmak isteyebiliriz (trend izleme). Bu, hangisinin daha yüksek tahmin gücüne sahip olduğunu ve rejim değişikliklerine karşı en kararlı olduğunu değerlendirmek için gelişmiş bir regresyon modeli çalıştırılarak yapılabilir.

Denetimsiz öğrenmede, verilerin yapısını keşfederiz. Örneğin, piyasa getirileri elde etmiş olabiliriz ve şimdi getirilerin ana itici güçlerini belirlemeye çalışabiliriz. Örneğin, başarılı bir model, belirli bir zamanda piyasanın momentum faktörleri, enerji fiyatları, dolar seviyeleri ve likidite ile ilgili yeni faktörlerle yönlendirildiğini ortaya çıkarabilir. Derin öğrenme, öğrenilen verileri birden çok düzeyde (dolayısıyla "derinlemesine") analiz edebilen bir makine öğrenimi yöntemidir. Otomasyonun amacının tanımlaması kolay ancak gerçekleştirmesi yorucu görevleri gerçekleştirmek olduğunu, derin öğrenme yapay zeka sistemlerinin amacının ise tanımlanması zor ancak gerçekleştirmesi kolay görevleri gerçekleştirmek olduğunu sık sık söylüyoruz. Özünde, derin öğrenme insanların öğrenme biçimine daha çok benziyor, bu yüzden insan bilgeliğini yapay olarak yeniden inşa etmek için gerçek bir girişim.

Derin öğrenme, büyük yapılandırılmamış veri setlerinin ön işlenmesi için kullanılır (örneğin, uydu görüntülerinde arabaları hesaplamak, basın bültenlerindeki duyguları tanımak vb. İçin kullanılır). Varsayımsal finansal zaman serisi örneğinde, derin öğrenme, piyasa düzeltmesi olasılığını tahmin eder (veya tahmin eder). Derin öğrenme modeline çok sayıda veri seti girebiliriz. Model öncelikle, momentum çökmesi, artan volatilite ve azalan likidite gibi piyasa üzerinde olumsuz etkisi olan bazı basit özellikleri belirleyebilir. Bu faktörler tek başına piyasa düzeltmesine yol açmayabilir. Ek olarak, algoritma bu basit özellikler arasındaki kalıpları ve bunlar arasındaki doğrusal olmayan ilişkiyi belirleyebilir. Bu modellerden, gelişmekte olan krizler, finansal baskılar gibi daha karmaşık özellikler oluşturabilir ve bu da sonunda daha önemli piyasa düzeltmelerine ve hatta resesyonlara yol açabilir.

Yukarıdaki şekil, çeşitli makine öğrenimi / yapay zeka ve bunların ticaret stratejilerindeki potansiyel uygulamalarını göstermektedir. Başlangıçta, gri kutudaki adımlar algoritmaya (eğitim setinin bir parçası olarak) verilir ve ardından yeşil kutudaki adımlar makine öğrenimi algoritması tarafından oluşturulur.

Alternatif verilerde makine öğrenimini uygulamanın ana adımları

Riskler ve belirsiz getiriler göz önüne alındığında, birçok yatırımcı daha nicel ve veriye dayalı yatırım yöntemlerini ne zaman benimseyeceklerini düşünüyor. İlk olarak, uygulama sürecindeki ana adımları kısaca özetliyoruz (kaç kişinin dış kaynak sağlanması gerektiği, dahili olarak büyük veri / makine öğrenimi oluşturmak için gereken yetenekler, tipik teknik ayarlar vb.). Aşağıda gösterildiği gibi:

Öncelikle verileri tanımlama ve alma ihtiyacı . Veri toplama ekibi, veri sahibi / tedarikçisi veya üçüncü taraf verilerini bir araya getiren (ve tedarikçi ve son kullanıcı ile eşleşen) profesyonel bir şirket aracılığıyla yeni veri kaynağını kullanma hakkını doğrudan elde edebilir. Lisans sözleşmesi yürürlüğe girdikten sonra, Verilerin depolanması ve önceden işlenmesi gerekiyor . Büyük veri, nadiren temiz bir biçim sunar ve genellikle makine öğrenimi algoritmalarında doğrudan bulunmaz. Verileri önceden işlemek için özel bir ekip gereklidir (örneğin, aykırı değerleri, eksik değerleri tespit etmek vb.). Veri bilimi ekibi, makine öğrenimi, ters test stratejileri ve görselleştirme tekniklerinin yardımıyla nicel araştırmacılardan oluşur. veri analizi Verilere dayalı olarak ticareti yapılabilir sinyaller veya içgörüler elde edin. Son olarak sinyal portföy yöneticisi tarafından sağlanır Uygulama , Veya bazı durumlarda otomatik bir şekilde (bu, sistemin başka bir katmanını ve sinyali yürütme sistemine bağlayan yazılım uzmanını içerecektir).

Büyük veri ve makine öğrenimi devriminin yatırım ortamını derinden değiştireceğine inanıyoruz. Daha fazla yatırımcı büyük veriyi benimsedikçe, piyasa daha hızlı tepki verecek ve geleneksel veya "eski" veri kaynaklarını giderek daha fazla bekleyecektir. Bu, nicel yöneticiler ve yeni veri setlerini ve analitik yöntemleri benimsemeye ve anlamaya istekli olanlar için avantajlar sağlayacaktır. Öğrenmeyen ve gelişmeyi reddedenler, eskime riskiyle karşı karşıya kalacaklar. Bu değişikliklerin zaman çizelgesi ne olursa olsun, analistlerin, portföy yöneticilerinin, tüccarların ve CIO'ların eninde sonunda büyük veri, makine öğrenimi ve ilgili ticaret stratejilerinin geliştirilmesine aşina olmaları gerektiğine inanıyoruz.

Raporun tamamını indirmek için Xinzhiyuan'ın WeChat herkese açık hesabında "JP Morgan" yanıtlayın

Xinzhiyuan'ın işe alım bilgilerini görüntülemek için [Orijinali Oku] 'ya tıklayın.

Wei Wei: Bu iki ticaret modundan kaçamazsınız

SWAT Kış Eğitimi | Ji'an SWAT Yeniden Yüklendi ...