g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

2018 Elektronik Teknoloji Uygulaması Sayı 10

0 Önsöz

Steganografi, bilgi güvenliği alanında çok önemli bir araştırma noktasıdır ve gizli bilgileri dijital taşıyıcılara algılanamaz bir şekilde gizler. Gizli bir kanal oluşturmak ve bağlantıları İnternet üzerinden kısıtlanan veya izlenen iki taraf arasında gizli bilgilerin iletilmesi için kullanılabilir. Kriptografi, temel olarak gizli bilgileri okunamaz hale getirmek için şifreleme teknolojisi tasarlar, ancak aynı zamanda verilerin önemini de ortaya çıkararak onu yakalama ve kırma gibi saldırılara karşı daha savunmasız hale getirir. Steganografi, yetkisiz kişilerin dikkatini çekmeyecek ve gizli bilgilerin varlığını bilmenin hiçbir yolu olmayacak şekilde sofistike yöntemler tasarlamayı taahhüt eder. Buradan da anlaşılacağı gibi steganografinin en büyük özelliği, güçlü bir şekilde gizlenmesi. Buna dayanarak, otomatik bir steganografi tespit yönteminin tasarlanması ve uygulanması çok zor bir görev haline geldi.

Birçok bilgi taşıyıcı biçimi vardır, bu nedenle görüntüler, ses, metin vb. Gibi farklı taşıyıcılara dayalı bilgi gizleme yöntemleri vardır. Bu steganografik teknolojiler, bilgi güvenliği sisteminin birçok yönünde önemli bir rol oynar. Ancak steganografi yasadışı amaçlarla da kullanılabilir. Bu nedenle, yasadışı bilgi tespiti sorununun çözülmesi ve yasa dışı bilgilerin aktarımının engellenmesi acildir. Metinle karşılaştırıldığında, görüntüler ve sesler daha fazla bilgi fazlalığına sahiptir, bu da onları çok yaygın kullanılan bilgi gizleme taşıyıcıları yapar ve ilgili bilgi gizleme teknolojileri de nispeten olgunlaşmıştır.

Metindeki verileri gizlemek için kullanılabilecek fazlalık alan çok sınırlıdır, bu da metne bilgi yerleştirmeyi çok zorlaştırır, ancak aynı zamanda üzerinde çalışmak için çok sayıda araştırmacıyı da çeker. Mevcut metin tabanlı bilgi gizleme yöntemleri, kabaca iki kategoriye ayrılabilir; biri metin biçimine, diğeri metin içeriğine dayalı. Metin formatına dayalı bilgi steganografisi yöntemleri genellikle metni özel kodlanmış bir görüntü olarak ele alır.Metnin karakter aralığını, kelimelerin ofsetini ve karakter kodlama yöntemini ayarlayarak bilgi gizlemeyi gerçekleştirirler. Bu tür bir yöntem genellikle kapasite olarak büyüktür ve uygulaması basittir, ancak sağlam değildir. Metin içeriğine dayalı yöntem, genellikle metni kelime dağarcığı, sözdizimi ve anlambilim açısından değiştirerek bilgilerin gömülmesini uygular ve metnin yerel ve küresel anlamını değiştirmeden ve dilbilgisi açısından doğru tutmaya çalışır. Örneğin literatür, doğal metin oluşturmak için Markov modelini kullanır ve üretim sürecinde geçiş olasılığını kodlayarak bilgi gizlemeyi gerçekleştirir, ancak dezavantaj, üretilen metnin çok doğal olmamasıdır. Ancak son yıllarda doğal dil işleme teknolojisinin gelişmesiyle birlikte, otomatik metin oluşturmaya dayalı bilgi gizleme yöntemleri giderek daha fazla ortaya çıkmıştır.Örneğin bazı steganografi teknolojileri otomatik olarak çok sayıda şiir üretebilir ve üretim sürecinde büyük kapasiteli gizli bilgileri gerçekleştirebilir. Gömülüdür ve ortaya çıkan şiir, gerçek şairler tarafından yazılan şiirden ayırt etmek zordur. Bu tür bir yöntem, format tabanlı yöntemlere göre daha güçlü bir sağlamlığa ve daha iyi gizliliğe sahiptir. Şu anda, metin anlamsal içeriğine dayalı bilgi gizleme teknolojisi, metin bilgi gizleme teknolojisinin gelişiminin araştırma odağı ve etkin noktasıdır. Bu tür bir yöntemi hedefleyen bu makale, bilginin metinde gizli olup olmadığının otomatik olarak tanınmasını sağlamak için evrişimli sinir ağına dayalı otomatik bir metin steganografisi algılama yöntemi önermektedir.

1 İlgili araştırma çalışması

Steganaliz teknolojisi, steganografiye zıt bir teknolojidir. Genel olarak, belirli bir veri taşıyıcısında gizli bilgilerin varlığının steganografik sistemin ihlali olarak kabul edildiği düşünülmektedir. Bu nedenle, bu makale metnin gizli bilgi içerip içermediğinin otomatik olarak algılanmasına odaklanmaktadır.

Şu anda, gizli metin bilgisinin tespiti ile ilgili mevcut araştırmalar ya esas olarak bazı özel gizli algoritmalar içindir ya da yapay olarak tanımlanmış istatistiksel kurallara dayanmaktadır. Önceki yöntemle ilgili araştırmalar şunları içerir: Wu Mingqiao, Stego aracı için yalnızca etiket özellikleri ve istatistiksel özelliklerin kombinasyonuna dayalı bir algılama yöntemi önerdi; KWON H ve diğerleri, belge yapısı verilerine dayalı gizli bilgiler için Microsoft bileşik belge biçimi özelliklerini kullandı Kullanılmayan alan ve eklenen akış verileri tarafından gizlenen bilgilerin varlığını analiz edin ve tespit edin. İkinci yönteme ilişkin araştırmalar şunları içerir: Zhou Jijun, kavram haritaları fikrinden yararlanır ve cümle arası korelasyon ölçüm yöntemine dayanan doğal bir dilde gizli bilgi algılama algoritması önerir; HUANG LS araştırma ekibi ayrıca kelime konumu dağılımına ve istatistiklere dayalı istatistiksel özellikler önerdi. Kelimelerin sıklığı, entropiyi tespit etme yöntemi. Bu metin steganografi tespit yöntemlerinin en büyük dezavantajı çok spesifik olmaları ve tespit edilebilir bilgi gizleme yöntemlerinin kapsamının sınırlı olmasıdır.

Teknolojinin gelişmesiyle birlikte birçok çalışma bilgi gizleme ve özel metin oluşturmayı birleştirmiş ve iyi sonuçlar elde etmiştir. Örneğin DESOKY A, bilgileri gizlemek için notlar, şakalar, vb. Gibi birçok özel metin formu kullanır. Literatürde önerilen model, bilgi gizlemeyi gerçekleştirmek için otomatik olarak şiir üretmek için bilgisayarları kullanır. Literatür ve Çin de kurallara uygun şiirler üretmek için Markov modelini ve tekrarlayan sinir ağı algoritmalarını kullanıyor. Bu tür bir yöntemle üretilen şiirler, eğitimsiz insanlardan ayırt etmek zordur, bu nedenle oldukça gizlidirler. Bu tür bir steganografi algoritması için steganografi tespit algoritması bulunmamaktadır.Bu makalenin amacı bu problemi çözmektir.

2 Evrişimli sinir ağına dayalı şiir steganografisi algılama yöntemi

Son iki yılda, evrişimli sinir ağları tarafından temsil edilen derin sinir ağı modelleri, bilgisayar görüşü ve doğal dil işleme alanlarında büyük başarı elde etti. Çok sayıda çalışma, evrişimli sinir ağlarının güçlü özellik çıkarma ve ifade yeteneklerine sahip olduğunu ve büyük miktarda veriden özellikleri otomatik olarak öğrenebildiğini göstermiştir. Bu makalede, konvolüsyonel sinir ağına dayalı bir dizi otomatik metin steganografi algılama algoritması tasarlanmış ve uygulanmıştır, bu algoritma, bilginin gizlenip gizlenmeyeceğini belirlemek için algılanacak metin üzerinde otomatik olarak özellik çıkarımı gerçekleştirebilir.

Bu makalede kullanılan son evrişimli sinir ağı modeli yapısı şu şekildedir: bir giriş katmanı, farklı boyutlarda çok sayıda evrişim çekirdeği içeren bir evrişimli katman, ortalama bir havuzlama katmanı, tamamen bağlı bir katman ve bir Softmax sınıflandırıcı. Giriş katmanı, giriş metnini sonraki evrişimli katman işlemleri için uygun iki boyutlu bir matrise dönüştürür. Evrişim katmanı, girdi matrisinden öznitelikleri çıkarmak için kullanılır ve farklı boyutlardaki evrişim çekirdekleri, bağlamla ilgili farklı özellikleri öğrenebilir. Ortalama havuzlama katmanı, modelin sağlamlığını artırabilen ve modelin performansını önemli ölçüde artırabilen öğrenilen özelliklerin alt örneklemini yapmak için kullanılır. Tamamen bağlı katman, öğrenilen özellikleri birleştirmek ve bunları Softmax sınıflandırıcısına göndermek için kullanılır. Softmax sınıflandırıcısının parametreleri kendi kendine öğrenme yoluyla tamamlandıktan sonra, bilgi steganografisinin gerçekleşip gerçekleşmediğini belirlemek için girdi özelliği vektörü sınıflandırılır. Evrişimli sinir ağı model yapısı Şekil 1'de gösterilmektedir.

Modelin girdisi, tespit edilecek metindir ve çıktı, steganografinin olup olmadığına karar verme olasılığıdır. Algılanacak her S giriş metni için, onu formül (1) 'de gösterilen bir matris olarak ifade edin; burada matrisin i-inci satırı, S metnindeki i-inci kelimeyi temsil eder ve her kelime, rastgele başlatılan bir D boyutu olarak temsil edilir. Yani vektörü:

Bunlar arasında, P ve T vektörlerinin boyutları 2'dir ve bunlar sırasıyla gizli bilgilerin varlığını veya yokluğunu gösterir. T, giriş metninin etiketidir, örneğin: steganografi olduğunu belirtmek için bir vektör kullanılabilir, bu da steganografi olmadığı anlamına gelir.

Modelin eğitim süreci, eğitim veri setinde LOSS fonksiyonunun minimize edilmesi ve momentumlu stokastik gradyan iniş algoritmasının (SGD) kullanılmasıdır. Modeldeki w parametresi için güncelleme formülü aşağıdaki gibidir:

3 Deneysel sonuçlar ve değerlendirme

3.1 Deneysel veriler

Bu deneyde, modelin bu yazıda yer alan performansını test etmek için, Tang Hanedanlığı'nın tamamında toplam 13.342 beş karakterlik şiir pozitif örnek, yani gizli bilgi içermeyen örnekler olarak toplanmıştır. Daha sonra, negatif örnekler olarak gizli bilgiler içeren 10.000 beş karakterlik şiir oluşturmak için literatürdeki algoritmayı kullanın. Bu nedenle, tüm deneyde kullanılan veri seti toplam 23.342 beş karakterli şiir içermektedir.Bunlardan 17.000'i bu makalenin modelini eğitmek için eğitim seti olarak, geri kalan 6,342 ise bu makalenin modelini test etmek için test seti olarak kullanılmıştır.Özel bölümler Tablo 1'de gösterilmiştir.

3.2 Deneysel kurulum

Modele her örnek girdisi için, önce onu yok edin. Spesifik olarak, her şiirin başlığı kaldırılır ve kalan 4 cümle uçtan uca birleştirilir, böylece her şiir 20 karakterlik bir metne dönüştürülür. İkinci olarak, her kelime 300 boyutlu rastgele başlatılmış bir vektöre eşlenir, bu nedenle aslında modelin girdisi 20 × 300 matristir. Evrişim katmanındaki evrişim çekirdeğinin genişliği, giriş matrisinin genişliği ile aynıdır, yani 300 boyuttur. Evrişim çekirdeğinin yüksekliği değişkendir Deneyde kullanılan evrişim çekirdeğinin yüksekliği 1, 2, 3'tür ve her boyut 56 evrişim çekirdeği içerir. Son çıktı katmanının boyutu, bilgilerin gizlenip gizlenmeyeceğine karşılık gelen 2'dir. Eğitim sürecinde, model parametreleri stokastik gradyan iniş yöntemi kullanılarak eğitilir ve ilk öğrenme oranı 0,01'dir.

3.3 Deneysel sonuçlar ve analiz

Bu modelin nihai performansını değerlendirmek için sınıflandırma görevlerinde yaygın olarak kullanılan birkaç gösterge kullanılır: Hassasiyet, Geri Çağırma, F1-skoru ve Doğruluk. Aşağıdaki şekilde hesaplanmıştır:

Bunlar arasında, TP, pozitif örnekler olarak tahmin edilen pozitif örneklerin sayısını, FP, pozitif örnekler olarak tahmin edilen negatif örneklerin sayısını, FN, negatif örnekler olarak tahmin edilen pozitif örneklerin sayısını ve TN, negatif örnekler olarak tahmin edilen negatif örneklerin sayısını temsil eder.

Tablo 2, bu modelin ve CNN'nin bu modelin sonuçlarını temsil ettiği diğer üç makine öğrenimi algoritmasının test sonuçlarını göstermektedir. Bu makaledeki modelin, çeşitli göstergeler üzerinde en iyi deneysel sonuçları elde ettiği, bu makaledeki modelin güçlü öznitelik çıkarma yeteneklerini tam olarak kanıtladığı ve metin steganografi algılama görevlerine çok etkili bir şekilde uygulanabileceği sonuçlardan görülebilir.

4. Sonuç

Bu yazıda, evrişimli sinir ağına dayalı bir metin steganaliz algoritması önerilmiştir. Büyük miktarda veriden otomatik olarak üst düzey anlamsal bilgileri çıkarabilir ve bilgilerin giriş metninde gizli olup olmadığına karar verebilir. Aynı zamanda, bu makaledeki modeli eğitmek ve test etmek için büyük miktarda veri kullanılmıştır.Sonuçlar, modelin metnin çok yüksek doğrulukla gizli bilgi içerip içermediğini tespit edebildiğini ve bu da modelin etkinliğini kanıtladığını göstermektedir.

Referanslar

PETITCOLAS F A P, ANDERSON R J, KUHN M G. Bilgi gizleme-bir anket IEEE Bildirileri, 1999, 87 (7): 1062-1078.

ZHOU Z, SUN H, HARIT R, ve diğerleri. Gömme olmadan kapaksız görüntü steganografisi. Uluslararası Bulut Bilişim ve Güvenlik Konferansı Nanjing Havacılık ve Uzay Üniversitesi, 2015.

PENG X, HUANG Y, LI F. 3d-sudoku matrisine dayalı düşük bit hızlı konuşma kodekinde steganografi şeması. IEEE Uluslararası İletişim Yazılımları ve Ağları Konferansı, 2016: 13-18.

LUO Y, HUANG Y. Yüksek gömme oranlı metin steganografisi: Çin klasik şiirini oluşturmak için tekrarlayan sinir ağlarını kullanmak Bilgi Gizleme ve Multimedya Güvenliği üzerine ACM Çalıştayı, 2017: 99-104.

SHIRALI-SHAHREZA MH, SHIRALI-SHAHREZA MA farsça / arapça metin steganografisine yeni bir yaklaşım.IEEE / ACIS Uluslararası Bilgisayar ve Bilgi Bilimi Konferansı ve IEEE / ACIS Uluslararası Bileşen Tabanlı Yazılım Mühendisliği, Yazılım Mimarisi ve Yeniden Kullanım Çalıştayı, 2006: 310- 315.

KER AD, BOHME R. Ağırlıklı stego-görüntü steganalizinin gözden geçirilmesi SPIE-The International Society for Optical Engineering, 2008, 6819: 681905.

ALTUN O, SHAMA G, CELIK M, et al.Ses sinyallerinin morfolojik steganalizi ve marjinal distorsiyonların azaltılması ilkesi IEEE Uluslararası Akustik, Konuşma ve Sinyal İşleme Konferansı Bildirileri, 2005, 2: 21-24.

CHOTIKAKAMTHORN N. Karakterler arası boşluk kullanarak elektronik belge veri gizleme tekniği. 1998 IEEE Asya-Pasifik Devreler ve Sistemler Konferansı, 1998. IEEE APCCAS 1998, 1998: 419-422.

LOW SH, MAXEMCHUK NF, LAPONE A M. Centroid algılama kullanarak telif hakkı koruması için belge tanımlama IEEE İşlemleri on Commun. 1998, 46 (3): 372-383.

MAHATO S, KHAN DA, YADAV D KA, değişiklik izleme tekniği ile microsoft word belgelerinde veri gizlemeye yönelik yaklaşımı değiştirdi.Journal of King Saud University. (2017-08-30) .https: //www.sciencedirect.com/science/ makale / pii / S1319157817300939?% 3Dihub aracılığıyla.

MURPHY B, VOGE C. Gizleme sözdizimi: düz metin bilgi gizleme için güvenilir yöntemler SPIE'nin Bildirileri, 2007: 6505.

GE X, JIAO R, TIAN H, et al.Bilgi gizleme üzerine araştırma. US-China Education Review, 2006, 3 (5): 77-81.

LUO Y, HUANG Y, LI F, et al.Markov zincir modelini kullanarak ci-poetry oluşturmaya dayalı metin steganografisi.İnternet ve Bilgi Sistemlerinde Ksii İşlemleri, 2016, 10 (9): 4568-4584.

YU Z S, HUANG L S.Şarkı hanedanının ci-şiiriyle yüksek gömme oranlı metin steganografisi.Çin Bilgi İşleme Dergisi, 2009, 23 (4): 55-62.

DESOKY A. Notesstega: nota dayalı steganografi metodolojisi Bilgi Sistemleri Güvenlik Dergisi, Küresel Bakış Açısı, 2009, 18 (4): 178-193.

Wu Mingqiao, Jin Shiyao Metin steganografi aracı Stego için Steganaliz yöntemi Bilgisayar Mühendisliği, 2006, 32 (23): 10-12.

KWON H, KIM Y, LEE S, vd.Microsoft bileşik belge dosyası biçiminde gizli verilerin saptanması için bir araç. Uluslararası Bilgi Bilimi ve Güvenliği Konferansı, IEEE, 2008: 141-146.

Zhou Jijun, Yang Zhu, Niu Xinxin, et al.Metin bilgisi gizleme algılama algoritması üzerine araştırma. Journal of Communications, 2004, 25 (12): 97-101.

CHEN Z L, HUANG L S, YU Z S, et al. Kelimelerin dağılımına dayalı dilsel steganografi saptaması için istatistiksel bir algoritma. Üçüncü Uluslararası Kullanılabilirlik, Güvenilirlik ve Güvenlik Konferansı. IEEE Bilgisayar Topluluğu, 2008: 558-563.

CHEN Z L, HUANG L S, YU Z S, et al. Etkili dilsel steganografi algılama. IEEE, Uluslararası Bilgisayar ve Bilgi Teknolojisi Çalıştayları Konferansı, 2008, Cit Workshops. IEEE, 2008: 224-229.

DESOKY A. Jokestega: otomatik şaka oluşturmaya dayalı steganografi metodolojisi International Journal of Security and Networks, 2012, 7 (3): 148-160.

KRIZHEVSKY A, SUTSKEVER I, HINTON G E. ImageNet sınıflandırması ile derin evrişimli sinir ağları.Uluslararası Sinirsel Bilgi İşlem Sistemleri Konferansı.Curran Associates Inc. 2012: 1097-1105.

KIM Y. Cümle sınıflandırması için evrişimli sinir ağları. ArXiv: 1408.5882, 2014.

yazar bilgileri:

Jin Peng 1, 2, Yang Zhongliang 1, 2, Huang Yongfeng 1, 2

(1. Elektronik Mühendisliği Bölümü, Tsinghua Üniversitesi, Pekin 100084; 2. Tsinghua Ulusal Bilgi Bilimi ve Teknolojisi Laboratuvarı, Pekin 100084)

Lei Feng Morning Post | Liu Qiangdong "komünist" açıklamalarına yanıt verdi, China Unicom yeniden karışık bir reform duyurusu yayınladı ve Microsoft'un kurucu ortağı savaş gemilerini keşfetti

Akıllı + Elektrikli Mercedes-Benz EQ, Biao Tesla mı?