g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

Yapay Zeka: Vatikan'ın Gizemini Çözmek

Vatikan Gizli Arşivleri dünyanın en büyük tarihi koleksiyonlarından biri olarak tanımlanabilir, ancak aynı zamanda en değersiz koleksiyonların "defne" sidir.

Bu muhteşem bina, Sistine Bazilikası'nın kuzey tarafında, Apostolik Kütüphanesi'nin bitişiğinde, Vatikan Şehri'nin surları içinde yer almaktadır ve 1200'lü yıllardan kalma 53 millik kitap raflarına sahiptir. Martin Luther'i kiliseden aforoz eden Papa Fermanı'na ek olarak, İskoç Kraliçesi Mary'nin idam edilmesinden önce Papa Six V'e gönderilen bir mektubu da içeriyordu. Ölçek ve kapsam açısından koleksiyon neredeyse benzersizdir.

Bununla birlikte, Vatikan Gizli Arşivlerinin modern bilim adamları için çok az pratik önemi vardır. Çünkü 53 mil uzunluğundaki bu kitap rafında, çevrimiçi bir sürüm sağlamak için yalnızca bir avuç sayfa tarandı ve bunların küçük bir kısmı içerik araması için bilgisayar metnine dönüştürüldü. Başka bir içeriği okumak istiyorsak, özel erişim hakları için başvurmalı, Roma'ya kadar seyahat etmeli ve bu eski kitapları kendimiz açmalıyız.

Ancak yeni projeler tüm bunları değiştirebilir. Codice Ratio adlı bu proje, ihmal edilen bu metinleri yapay zeka ve optik karakter tanıma (OCR) yazılımı bir arada kullanarak yeniden üretmeyi ve dünyaya yeniden sunmayı hedefliyor. Başarılı olursa, bu teknoloji aynı zamanda dünyadaki diğer tarihi arşivlerdeki sayısız başka kaydı işlemek için de kullanılacak.

Uzun yıllardır insanlar kitapları ve diğer basılı belgeleri taramak için OCR teknolojisini kullanıyor, ancak gizli arşivlerdeki materyaller için uygun değil. Geleneksel OCR teknolojisi, harfler arasındaki boşlukları arayarak kelimeleri bir dizi harf görüntüsüne ayırır ve ardından her bir harf görüntüsünü bellekteki harf kitaplığıyla karşılaştırır. Görüntünün içeriğiyle en iyi eşleşen harfi belirledikten sonra, yazılım, aranabilir metin oluşturmak için harfi bilgisayar koduna (ASCII kodu) çevirir.

Ancak, bu işlem yalnızca kesin olarak dizilmiş metinler için geçerlidir. El yazısıyla yazılan tüm içeriği işlemede çok kötü bir performans gösterdi ve Vatikan Gizli Arşivlerindeki belgelerin çoğu el yazısı dosyalar biçiminde mevcut. Aşağıdaki resim bunun bir örneğidir - on ikinci yüzyılın başlarında Caroline'ın küçük harfli metni kaligrafi ve sanatın bir karışımına benziyor:

Yukarıdaki örnekten de görebileceğiniz gibi, en büyük problem harfler arasında boşluk olmamasıdır (yani kirli bölme). OCR, bir kelimenin hangi harfle başlayıp bittiğini bilemez, bu nedenle belirli harf sayısını ayırt edemez. Bu, Searle Paradoksu olarak da bilinen hesaplama düzeyinde bir çıkmaza neden oldu: OCR Logitech'in tanınmadan önce kelimeleri ayrı harflere ayırması gerekir, ancak harflerin bağlandığı el yazısı metinde, yazılımın segmentasyonu tamamlamak için harfleri tanıması gerekir. -Sonsuz döngü.

Bazı bilgisayar bilimcileri, bu sorunu çözmek için harfleri değil tam kelimeleri tanıyan OCR yazılımı geliştirmeye çalışmaktadır. Aslında teknik olarak uygulanabilir, çünkü bilgisayar kelimeleri mi yoksa harfleri mi analiz ettiğini "umursamıyor". Ancak bu tür bir sistemin normal çalışmasını sağlamak çok zordur çünkü çok büyük bir bellek bankası gerektirir. Bu sistemlerin tanıması gereken şey artık düzinelerce harf değil, yaygın olarak kullanılan binlerce kelimenin görselleridir. Bu, ortaçağ Latincesinde uzmanlığa sahip çok sayıda bilim adamının her bir kelimenin görüntülerini eski belgeler aracılığıyla ayırması gerektiği ve her kelimenin el yazısındaki bozulmayı veya ışık koşullarındaki değişikliklerin neden olduğu diğer değişiklikleri açıklamak için en az birkaç resim gerektirdiği anlamına gelir. Açıkçası, bu zor bir görev.

Codice Ratio projesinde, yeni bir el yazısı OCR yöntemi yukarıdaki sorunları başarıyla çözdü. Roma III Üniversitesi Vatikan Gizli Arşivleri'nden Paolo Merialdo, Donatella Firmani, Elena Nieddu ve Marco Maiorino projesinin arkasındaki dört ana bilim adamı, bulmaca bölümleme yöntemini kullanarak Searle'ın paradoksunu çözmeyi umuyor. Ekibin yakın tarihli bir makalede açıkladığı gibi, işlem akışı kelimeleri harflere ayırmaz, ancak onları tek bir vuruş olarak anlar. Bu OCR, her kelimeyi bir dizi dikey ve yatay şeride böler ve ardından bölümlemeyi tamamlamak için yerel minimum (yani, daha küçük mürekkepli veya daha az pikselli kısım) bulur. Bundan sonra, yazılım daha fazla harf çizecek ve sonunda aşağıdaki bulmaca parçalarını oluşturacaktır:

Bu yapboz parçaları kendi başlarına pek kullanışlı değildir, ancak yazılım bunları olası harfleri oluşturmak için çeşitli şekillerde birleştirebilir. Spesifik olarak, yazılımın yalnızca hangi blokların gerçek harfleri temsil ettiğini ve hangilerinin yalnızca sürekli vuruşların neden olduğu yanılsamalar olduğunu bilmesi gerekir.

Yazılıma bu yeteneği öğretmek için, araştırmacılar alışılmadık bir öğretmen-lise öğrencisi seçti. Ekip, proje için bir hafıza bankası oluşturmak üzere İtalya'daki 24 okuldan bir grup lise öğrencisini işe aldı. Öğrenciler ilgili web sitesine giriş yaptıktan sonra aşağıdaki şekilde gösterildiği gibi üç ekranlı arayüzü göreceklerdir:

Üstteki yeşil çubuk, güzel, temiz ortaçağ Latin harflerini içerir - resimdeki g harfi. Ortadaki kırmızı sütun, g'ye benzeyen ancak g olmayan kafa karıştırıcı bir örneği temsil eder ve aşağıdaki ızgara programın ana gövdesidir. Her resim, OCR yazılımı tarafından birkaç bulmaca parçasından oluşur ve içeriği değerlendirilir. Öğrencilerin işi, OCR'nin sonuçlarını yargılamak ve onlara hangi tahminlerin doğru ve hangilerinin yanlış olduğunu söylemektir. Öğrencilerin her bir resmi platonik mükemmel yeşil harflerle karşılaştırmaları ve kendi sonuçlarını girmek için onay kutusunu tıklamaları gerekir.

Öğrenciler tek bir tıklama ile yazılıma 22 ortaçağ Latin harfini (a-i, l-u ve bazı alternatif s ve d türleri) nasıl tanıyacaklarını öğretmeye çalıştılar.

Bu programın ilk aşaması, mükemmel yeşil harf örneğini ve kırmızı kafa karıştırıcı örneği seçmeye yardımcı olmak için uzmanların katılımını gerektirir. Ancak tamamlandıktan sonra, artık takip etmeleri gerekmiyor. Aslında, öğrencilerin Latince'yi anlamalarına bile gerek yoktur - görevleri sadece görsel kalıplara uymaktır. Codice Ratio projesinden Merialdo, ilk başta insanların lise öğrencilerini dahil etmenin aptalca bir fikir olduğunu düşündüklerini söyledi. Ancak artık makineler öğrenmeye başladı ve çabaları sayesinde E, birçok kişinin yaptığı küçük ve basit katkıların karmaşık sorunları da çözebileceğini kanıtladı.

Tabii ki, sonunda öğrencilerin artık katılmaları gerekmiyor. Eğitim belirli bir aşamaya ulaştığında, yazılım bağımsız olarak parçaları çözebilir ve harflerin belirli konumlarını kendi başına değerlendirebilir. Yapay zekanın değeri burada yatıyor.

Öte yandan bu, yapboz parçalarının tek başına doğru harfleri oluşturmaya yetmediğini de kanıtlıyor. El yazısı metnin sırrını çözmek için bilgisayarın hala daha fazla yardıma ihtiyacı var. Herkesin bir mektup okuduğunu hayal edin ve içinde aşağıdaki cümleyi görün:

Ortadaki kelime "anlaşılır" mı yoksa "canım" mı? "D" ve "cl" nin vuruş bileşimi aslında tamamen aynı olduğu için yargılamak zordur. OCR yazılımı, özellikle oldukça stilize edilmiş metinlerle uğraşırken aynı sorunla karşı karşıyadır. Aşağıdaki resmi örnek olarak alın:

Farklı bulmaca kombinasyonlarından geçtikten sonra OCR, olası seçeneklerin aimo, amio, aniio, aiino ve hatta aiiiio'yu içerdiğine inanıyor. Ama kelime aslında Latince'de yıl olan anno. Yazılım a ve o'yu tanıdı, ancak ortadaki dört dikey çubuğu nasıl böleceğini çözemedi.

Bu sorunu çözmek için, Codice Ratio ekibinin yazılımları için bazı sağduyu bilgileri sağlaması gerekiyordu. 1,5 milyon sayısallaştırılmış Latince kelime dağarcığı oluşturdular ve iki harfli ve üç harfli kombinasyonlarını kontrol ettiler. Bu şekilde hangi harf kombinasyonlarının daha yaygın olduğunu ve hangilerinin asla görünmeyeceğini belirlerler. Bu istatistiksel bilgileri OCR yazılımına sağlayarak, farklı dizelerin spesifik oluşma olasılığını öğrenebilir ve nn'nin iii'ten çok daha olası olduğunu fark edebilir.

Bu iyileştirme ile OCR nihayet metnin bir bölümünü kendi başına okuyabilir. Ekip, onlara Vatikan'ın gizli dönüş bürosundan bazı bilgiler vermeye karar verdi. Bu, Avrupa krallarına mektuplar, hukuki konularla ilgili kararlar ve diğer mektuplar dahil olmak üzere 18.000 sayfadan fazla arşivden oluşan bir koleksiyondur.

İlk sonuçlar karışıktı. Bugüne kadar yazılan tüm metinlerin üçte biri bir veya daha fazla yazım hatası içeriyordu, bu da OCR'nin yanlış bir karar verdiği anlamına geliyordu. Bununla birlikte, yazılım hala el yazısıyla yazılmış mektup değerlendirme doğruluğunun% 96'sına varan oranlarda getiriyor. Merialdo, "kusurlu transkripsiyon sonuçlarının bile el yazmasının içeriği ve arka planı hakkında pek çok değerli bilgi sağlayabileceğini" söyledi.

Pikchi Papağan kardeşin sadece bir ifade olarak kullanılabileceğini düşünüyor musunuz? Duvar kağıdı olmak daha mı iyi?

Dangbei, yazılımdan donanıma ilk olarak projektör F1'i güçlü bir donanımla piyasaya sürdü