Ethereum kullanıcıları anonim olabilir, ancak adresleri benzersiz bir şekilde tanımlanır ve blok zincirinde halka açık olarak gösterilir.
Bu makale, Ethereum'daki alım satım faaliyetlerine dayalı bir sınıflandırma algoritması oluşturur ve Ethereum kullanıcılarını farklı davranış alt gruplarına ayırır. Bir adresin bir borsaya mı, madenciye mi yoksa ICO cüzdanına mı ait olduğunu tahmin edebilir.
Veritabanı SQL kullanılarak oluşturulur ve model Python ile yazılır. Kaynak kodu GitHub'da mevcuttur.
Ethereum adres özelliğinin 3B simgesi
Ethereum blockchain, akıllı sözleşmeler adı verilen merkezi olmayan bir uygulama platformudur. Bu sözleşmeler genellikle diğer varlıkları temsil etmek için kullanılır. Bu varlıklar, gerçek dünyadaki fiziksel nesneleri (gayrimenkul gibi) veya tamamen dijital nesneleri (fayda jetonları gibi) temsil edebilir.
Akıllı sözleşmeyi yürütmek için gereken hesaplamalar ETH'de (Ethereum ekosisteminin yerel belirteci) ödenir.
ETH, adres adı verilen şifrelenmiş güvenli bir hesapta saklanır.
Pek çok insan, kripto para biriminin kullanıcılara dijital anonimlik sağladığını düşünüyor ve bu fikrin bazı gerçekleri var. Aslında, anonimlik Monero ve ZCash'in temel misyonudur.
Bununla birlikte, Ethereum'un kullanımı açıkça daha kapsamlıdır ve esnekliği, Ethereum'un zengin bir halka açık işlem davranışı seti üretmesini de sağlamıştır. Ethereum adresi, sahipliği değişmemiş benzersiz bir tanımlayıcı olduğundan, kullanıcı işlem etkinliklerini izlemek, toplamak ve analiz etmek mümkündür.
Burada yazar, Ethereum adreslerini etkili bir şekilde sınıflandırarak bir kullanıcı prototipi oluşturmaya çalıştı. Bu prototipler, bilinmeyen bir adresin sahibini tahmin etmek için kullanılabilir.
Bu, çok sayıda uygulama için yeni kapılar açar:
· Ağ etkinliklerini anlayın
· Ticaret stratejisini güçlendirin
· Kara para aklamayı önleme faaliyetlerini iyileştirin
Ethereum ekosistemindeki katılımcılar, işlem aktivitelerindeki kurallara göre sınıflandırılabilir. Borsalara, madencilere ve ICO projelerine ait bilinen adres bilgilerine dayanarak, kümeleme sonuçlarının kabaca doğru olduğunu gördük.
Ethereum işlem veri kümesi Google BigQuery'de barındırılır. En fazla ETH bakiyesine sahip 40.000 adres için bu sınıflandırma, kullanıcı davranışındaki farklılıkları karakterize etmek için 25 özellik yarattı.
Kontur analizini kullanarak, bu sınıflandırma, optimum küme sayısının kabaca 8 olduğunu belirler ve bu, negatif kontur puanlarına sahip örneklerin sayısını en aza indirir (negatif puanlar, yanlış kümeye atanabilecek örnekleri temsil eder).
Etherscan.io blok tarayıcısından veri alarak, veri setinde 125 adresten kitle kaynaklı etiket topladım.
Çoğu etiket üç kategoriye ayrılır:
Borsalar, madenciler ve ICO cüzdanları.
Kümeleme, denetimsiz bir makine öğrenimi tekniğidir, bu nedenle modeli eğitmek için etiketleri kullanamıyorum. Bunun yerine yazar, her kümenin en yüksek etiket yoğunluğuna göre kullanıcı prototiplerini kümelere atamak için etiketleri kullanır. Sonuçlar burada bulunabilir.
İlk kümelemeden sonra 2B görünüm. Sol, bilinen bir adres.
Yazar, farklılık ölçüsünü Öklid mesafesinden kosinüs mesafesine değiştirerek, borsalar ve madenciler arasındaki ayrımı büyük ölçüde geliştirir.
İkinci ayrılık. Solda, bilinen borsaların ve madencilerin adresleri var
Yeniden kümeleme sonuçlarını orijinal analizle değiştirerek, sonunda 9 küme elde ettik.
İkincil kümelemeden sonra 2B görünüm. Solda bilinen adres
İlgili kümeye dayalı olarak kullanıcı davranışı hakkında sonuçlar çıkarabiliriz.
· İçeri ve dışarı aktarılan işlemlerin hacmi yüksek
· Alım satım saatleri çok düzensiz
Borsalar, kripto endüstrisindeki bankalardır. Bu sonuçlar oldukça sezgiseldir.
· Ortalama işlem boyutu küçüktür
· Alım satım saatleri daha düzenli
Madenciler, işlemleri doğrulamak ve ETH ödülleri almak için bilgi işlem gücünü kullanır. Madenciler, daha istikrarlı bir gelir elde etmek ve katkıda bulundukları kaynaklara göre karşılık gelen geliri elde etmek için genellikle bilgi işlem kaynaklarını (madencilik havuzları) bir araya getirir.
· Birkaç büyük işlem var
· İşlem süresi en düzenli olanıdır
ICO, kripto girişimleri için yaygın bir kaynak yaratma yöntemidir. Bu nedenle, bu girişimler genellikle büyük miktarlarda ETH tutarlar ve düzenli işletme masraflarını ödemek için düzenli olarak büyük miktarlarda ETH satarlar.
· 7. kümedeki adresler çok sayıda akıllı sözleşme etkinliğine sahiptir.
· 2. ve 5. kümeler arasında keskin bir fark var.
Bu kullanıcı gruplarından herhangi birini tanımlayabilir misiniz?
Bu çalışmanın genişletilmesi, Ethereum blockchain verilerinin daha ayrıntılı olarak sunulmasına izin verebilir. İşte bazı ilginç yönler:
· Grafik teorisine ve ağ analizine dayalı işlevler ekleyin
Sırayı kaydıran robotları insanlardan ayırın
· Akıllı sözleşme analizinin genişletilmesi
· ERC-20 token ticaret faaliyetlerinin tekrarlanan analizi