Bilgisayar görüşü, giriş + iyileştirme üzerine okunması gereken 10 klasik kitap

Xin Zhiyuan Rehberi Microsoft Research Asia'nın Bilgisayar Görme Grubu'nda kıdemli bir araştırmacı olan Dr. Wang Jingdong, bilgisayarla görme alanında dört kategoriye ayrılmış klasik kitaplar önermektedir: kapsamlı makaleler, geometri makaleleri, makine öğrenimi makaleleri ve yeni başlayanların ve ileri düzey bilim adamlarının çeşitli ihtiyaçlarını karşılamak için klasik okumalar. .

Kısa bir süre önce yayınladığımız doğal dil öğrenme kitabı tavsiyeleri listesi herkes tarafından sıcak bir şekilde karşılandı, ilginiz ve desteğiniz için şimdiden teşekkür ederiz.

Aynı zamanda birçok okuyucu, bilgisayarla görme alanında kitap önerileri almak isteyen mesajlar bıraktı. Bugün, herkesin isteklerini karşılayacağız ve Microsoft Research Asia'nın Bilgisayar Görme Grubunda kıdemli bir araştırmacı olan Dr. Wang Jingdong'u bilgisayarla görü alanında klasik kitaplar önermeye davet edeceğiz. Ayrıca kapsamlı makaleleri, geometri makalelerini, makine öğrenimi makalelerini ve klasik okumaları sizin için dikkatlice ayırdı. Dört kategori.

Bilgisayar görüşü, görüntülerden ve videolardan sayısal veya sembolik bilgiler öneren bir bilgi işlem sistemidir.Daha canlı bir şekilde, bilgisayar görüşü, bilgisayarların insanlar gibi gözlere sahip olmasına, görüntüleri görmesine ve görüntüleri anlamasına olanak tanır. Los Angeles Kaliforniya Üniversitesi'nde istatistik ve bilgisayar bilimi profesörü olan Zhu Songchun, bir keresinde "insan serebral korteksindeki aktivitenin yaklaşık% 70'i görselle ilgili bilgiyi işlemektedir. Görme, insan beyninin kapısı ile eşdeğerdir. Görsel bilgi işlenemezse, tüm yapay Akıllı bir sistem boş bir raftır ve yalnızca sembolik muhakeme yapabilir ve gerçek dünyadaki yapay zekayı inceleyemez. "

Bilgisayarla görme alanındaki bu uygulama sırlarına bir göz atalım! Bir sonraki bilgisayar görme uzmanı olabilirsiniz!

1. Kapsamlı makaleler

1. Bilgisayarla Görü: Modern Bir Yaklaşım

Yazar: David A. Forsyth, Jean Ponce

Yayın zamanı: 2003 (ilk baskı), 2011 (ikinci baskı)

Kalabalık için uygun: başlangıç seviyesinden orta seviyedeki akademisyenlere

Öneri endeksi:

Ana içerik: Bu kitap, bilgisayarla görme alanında birçok sorunu içerir: görüntüleme, tek bir görüntü için erken görme, birden çok görüntü için erken görme, orta düzey görme sorunları, üst düzey görme sorunları ve görüntü tabanlı gibi ilgili görme uygulamaları Modelleme ve oluşturma, insan merkezli görme problemleri, görüntü arama ve son olarak yazar, vizyon algoritmalarıyla ilgili optimizasyon tekniklerini de kısaca açıklamaktadır.

Önerilen neden: Bu kitapta hem bilgisayarla görme sorunlarının sistematik bir açıklaması hem de ilgili sorunların ayrıntılı bir açıklaması vardır. Bu kitap sayesinde okuyucular bilgisayarla görme uygulamalarını gerçekleştirebilirler. Bu ders kitabı daha önce yazılmıştır (ilk basım: 2003, ikinci baskı: 2011), ancak içeriği kapsamlı ve kapsamlıdır.Lisans son sınıf öğrencileri veya lisansüstü öğrenciler için bir ders kitabı veya referans kitabı olarak veya bilgisayarla görme mühendisleri için bir referans kitabı olarak kullanılabilir. Bu kitap aynı zamanda multimedya araması, bilgisayar grafikleri, robotik, görüntü işleme ve görüntüleme dahil olmak üzere bilgisayarla görme ile ilgili alanlardaki araştırmacılar için bir referans kitap olarak da uygundur.

Kitap ana sayfası:

2. Bilgisayarla Görme: Algoritmalar ve Uygulamalar

Yazar: Richard Szeliski

Yayın zamanı: 2010

Kalabalık için uygun: başlangıç seviyesinden orta seviyedeki akademisyenlere

Öneri endeksi:

Bu kitabın içeriği: Bu ders kitabı, görüntüleri analiz etmek ve anlamak için çeşitli teknikler içerir.Ayrıca, tıbbi görüntüler ve kişisel fotoğraf albümlerine uygun görüntü düzenleme teknikleri gibi zorlu gerçek dünya görsel problemlerini açıklar. Özel konular şunları içerir: görüntüleme, görüntü işleme, özellik algılama, eşleştirme ve bölümleme, özellik tabanlı hizalama, hareket tabanlı yapısal yeniden yapılandırma, görüntü yapıştırma, hesaplamalı fotoğrafçılık, stereo hizalama, üç boyutlu yeniden yapılandırma, görüntü tabanlı oluşturma ve tanıma vb. Yazar ayrıca doğrusal cebir, sayısal optimizasyon teknikleri, Bayes modelleme ve bilgisayarla görme algoritmalarında yer alan akıl yürütme sağlar.

Önerilen neden: Bu kitap, yazarın ders projeleri şeklinde düzenlenen bilgisayarla görme öğretimi ve araştırmasının sonucudur. Lisans son sınıf ve lisansüstü bilgisayarla görme dersleri için ders kitabı olarak kullanılabilir.

Kitap ana sayfası:

2. Geometri

1. Bilgisayarla Görüde Çoklu Görünüm Geometrisi

Yazar: Richard Hartley, Andrew Zisserman

Yayın zamanı: 2000 (ilk baskı), 2004 (ikinci baskı)

Kalabalık için uygun: başlangıç seviyesinden orta seviyedeki akademisyenlere

Öneri endeksi:

Bu kitabın içeriği: Gerçek dünyanın üç boyutlu yapısını anlamak, bilgisayar görüşü alanında temel bir sorundur. Bu kitabın içeriği, üç boyutlu geometrinin hesaplanması ve yeniden yapılanma ve nesnelerin cebirsel ifadesine ilişkin geometrik ilkeleri içermektedir. Bu kitap, birleşik bir çerçeve biçiminde sahne yeniden yapılandırmasının teori ve uygulama ayrıntılarını veriyor. Yazar aynı zamanda ayrıntılı arka plan bilgisi, uygulama ve uygulama algoritması açıklaması da sağlar.

Öneri nedeni: Bu öğretim materyali sistemi, hem klasik hem de modern yöntemleri içeren klasik bir çok-bakışlı geometri öğretim materyalidir. Bu kitabın yazımı açık ve özdür. Bu kitap, bilgisayarla görme ve bilgisayar grafikleri derslerinde son sınıf öğrencileri ve lisansüstü öğrencileri için bir ders kitabı olarak kullanılabilir.Otonom sürüş, robotik, AR / VR, dronlar ve coğrafi ölçme ve haritalama alanlarında araştırmacılar ve teknisyenler için önemli bir referans kitabıdır.

Kitap ana sayfası:

2. 3 Boyutlu Görüntüye Davet: Görüntülerden Geometrik Modellere

Yazar: Yi Ma, Stefano Soatto, Jana Kosecká, S. Shankar Sastry

Yayın zamanı: 2005

Kalabalık için uygun: başlangıç seviyesinden orta seviyedeki akademisyenlere

Öneri endeksi:

Ana içerik: Bu kitap, bilgisayarla görmedeki önemli konulara odaklanmaktadır: bir dizi iki boyutlu görüntüden üç boyutlu yapıyı ve hareketi yeniden yapılandırmak için doğrusal cebir ve matris teorisini kullanmak. Bu kitabın özelliği, geometriyi araştırmak ve çoklu görüntülere dayalı geometrik modelleri yeniden yapılandırmak için birleşik bir çerçevedir.Ayrıca görüntü oluşturma, temel görüntü işleme yöntemleri ve özellik çıkarımı içerir.Ayrıca görsel algoritmaların ve sistem işlemlerinin uygulanmasını sağlar. kılavuz.

Önerilen neden: Bu kitap, son sınıf öğrencileri, yüksek lisans öğrencileri ve bilgisayarla görme, uygulamalı matematik, bilgisayar grafikleri ve robotik alanındaki araştırmacılar için uygundur. Yazar aynı zamanda, otonom sürüş, robotik, AR / VR, drone, coğrafi ölçüm ve haritalama gibi alanlarda araştırmacılar ve teknisyenler için önemli bir referans kitabı olan algoritma uygulaması için bir program da sunuyor.

Kitap ana sayfası:

3. Bilgisayarla Görme: Hesaplamalı Teori ve Algoritma Vakfı

Yazar: MA Song, Zhang Zhengyou

Yayın zamanı: 1998 (ilk baskı), 2003 (ikinci baskı)

Kalabalık için uygun: temelden orta seviyeye

Öneri endeksi:

Ana içerik: Bilgisayar görüşü, bilgi işleme seviyesinden gelen görsel bilginin bilişsel sürecini ve ayrıca görsel bilgi işlemenin hesaplama teorisi, ifade ve hesaplama yöntemlerini inceler. Bu kitap, görüntü özelliği çıkarma, kamera kalibrasyonu, stereo görüş, hareket görüşü (veya sıralı görüntü analizi), görüntü gri seviyelerinden üç boyutlu nesnelerin şeklini geri kazanma yöntemleri ve nesne modelleme dahil olmak üzere önemli bilgisayar görüşü teorilerini ve algoritmalarını sistematik olarak tanıtır. Ve tanıma yöntemleri ve uzak görüntü analiz yöntemleri.

Önerilen neden: Bu kitap temelde bilgisayarla görme alanındaki erken görme problemlerini kapsar ve ilgili problemlerin araştırma arka planı ve uygulama yöntemlerini detaylandırır. Son sınıf öğrencileri veya lisansüstü öğrencileri için bir ders kitabı veya referans kitabı olarak kullanılabilir ve ayrıca otonom sürüş, AR / VR, drone ve coğrafi ölçüm ve haritalama alanlarında araştırmacılar ve teknisyenler için bir referans olarak kullanılabilir.

Üç, makine öğrenimi

1. Bilgisayarla Görme: Modeller, Öğrenme ve Çıkarım

Yazar: Simon J.D. Prince

Yayın zamanı: 2012

Kalabalık için uygun: başlangıç seviyesinden orta seviyedeki akademisyenlere

Öneri endeksi:

Ana içerik: Bu kitap, bilgisayarla görme problemlerini çözmek için olasılıksal model öğrenme ve akıl yürütme yöntemlerini tanıtır ve üç boyutlu yapıyı tahmin etmek gibi, gözlemlenen görüntü ile tahmin edilecek içerik arasındaki bağlantıyı kurmak için eğitim verilerinin nasıl kullanılacağını açıklar. Bu kitap, olasılık, olasılık grafik modelleri, grafik bölümleme yöntemleri, çoklu görüş geometrisi, kamera kalibrasyonu, yüz tanıma, hedef izleme vb. Hakkında temel bilgileri içerir. Kitapta 70'den fazla algoritma tanıtıldı.

Önerilen neden: Bu kitap, bilgisayarla görme ve makine öğrenimi kombinasyonunun bir meyvesi olarak kabul edilebilir. Bilgisayarla görü araştırmalarına uygulanan temel makine öğrenimi (derin öğrenme hariç) bilgilerini sağlar ve açıklama özlü ve sezgiseldir. Bu ders kitabı, son sınıf öğrencileri ve lisansüstü öğrencileri için bir bilgisayarla görme ders kitabı olarak kullanılabilir ve ayrıca bilgisayarla görme pratisyenleri için de uygundur.

Kitap ana sayfası:

2. Örüntü Tanıma ve Makine Öğrenimi

Yazar: Christopher Bishop

Yayın zamanı: 2006

Kalabalık için uygun: başlangıç seviyesinden orta seviyedeki akademisyenlere

Öneri endeksi:

Ana içerik: Bu kitap, örüntü tanımayı Bayesçi bir perspektiften tanımlayan ilk kitaptır ve ayrık olasılık dağılımlarını açıklamak için bir grafik model kullanır. İçerik şunları içerir: doğrusal regresyon modeli, doğrusal sınıflandırma modeli, sinir ağı, çekirdek yöntemi, seyrek çekirdek yöntemi, grafik modeli, karma model ve beklenti maksimizasyonu algoritması, yaklaşık akıl yürütme, örnekleme yöntemi, sürekli gizli değişken modeli vb.

Önerilen neden: Bu kitap temelde görsel tanıma problemleri de dahil olmak üzere örüntü tanıma problemlerine uygulanan makine öğrenimi yöntemlerini açıklamaktadır.Lisans son sınıf öğrencileri ve lisansüstü öğrenciler için bir ders kitabı olarak uygundur ve ayrıca bilgisayarla görme alanındaki araştırmacılar ve uygulayıcılar için makine öğrenimini öğrenmek için bir referans kitabıdır.

Kitap ana sayfası: https://www.microsoft.com/en-us/research/people/cmbishop/#!prml-book?from=https%3A%2F%2Fresearch.microsoft.com%2F%7Ecmbishop%2FPRML%2Findex .htm

3. Derin Öğrenme

Yazar: Ian Goodfellow ve Yoshua Bengio ve Aaron Courville

Yayın zamanı: 2016

Kalabalık için uygun: yeni başlayanlar, orta ila ileri düzey akademisyenler

Öneri endeksi:

Ana içerik: Kitap üç bölümden oluşuyor: İlk bölüm temel matematik araçları ve makine öğrenimi kavramlarını tanıtıyor, ikinci bölüm en ünlü derin öğrenme algoritmalarını anlatıyor ve üçüncü bölüm derin öğrenme araştırmalarının en yeni fikirlerini ve sorunlarını listeliyor.

Önerilen neden: Bu kitap, özellikle bilgisayarla görme için yazılmış bir derin öğrenme ders kitabı değildir, ancak yazılmadan önce bilgisayarla görme alanında icat edilen derin öğrenme teknolojisini içerir. Bilgisayarla görme alanında son sınıf öğrencileri ve lisansüstü öğrenciler için ders kitabı olarak veya bilgisayar olarak kullanılabilir Görsel araştırmacılar ve uygulayıcılar için referans kitap.

Kitap ana sayfası:

4. Genelleştirilmiş Temel Bileşen Analizi

Yazar: RenéVidal, Yi Ma, Shankar Sastry

Yayın zamanı: 2016

Kalabalık için uygun: Orta ve ileri düzey bilim adamları

Öneri endeksi:

Ana içerik: Bu kitap, gürültü, büyük hatalar veya anormallikler içerebilen bir veya daha fazla alt uzay veya manifolddan üretilen yüksek boyutlu verileri modellemek için matematiksel teorilerdeki ve hesaplamalardaki en son gelişmeleri tanıtır. Alan tahmini ve bölütleme için en son cebirsel, geometrik ve istatistiksel hesaplama yöntemleri ve görüntü işleme, görüntü ve video bölütleme, yüz tanıma ve kümeleme gibi birçok ilginç uygulama verilmiştir.

Önerilen neden: Bu ders kitabı, bilgisayarla görme, görüntü ve sinyal işleme, veri bilimi, makine öğrenimi ve sistem teorisi alanlarında lisansüstü öğrenci ve ilk araştırmacı olarak kullanılabilir. Bu kitap çok sayıda illüstrasyon, örnek ve alıştırma içerir, ayrıca bu ders kitabında yer alan istatistik, optimizasyon ve cebirsel geometrinin temel kavramlarını ve ilkelerini de kapsar.

Kitap ana sayfası:

Dört, klasik okuma makaleleri

Vizyon: İnsan Temsili ve Görsel Bilginin İşlenmesine Yönelik Hesaplamalı Bir Araştırma

Yazar: David Marr

Yayın zamanı: 1982

Kalabalık için uygun: orta ve ileri düzey bilim adamları

Öneri endeksi:

Ana içerik: Bu kitap, görsel algıyı anlamak için bir çerçeve sağlar ve ayrıca beyin ve işlevlerine ilişkin çok sayıda araştırma ve anlayış içerir. Marr'ın çerçevesinde, görsel süreç bir dizi ifade yöntemi kurar: görüntü tanımıyla başlar ve çevredeki üç boyutlu nesnelerin tanımıyla biter. Sinirbilim ve bilişsel bilim alanlarında büyük etkisi olan çok seviyeli bir analiz metodolojisi önerdi: hesaplama seviyesi, algoritma seviyesi ve donanım algoritma seviyesi.

Önerilen neden: Bu kitap, Marr'ın görsel algı anlayışının çerçevesini sistematik olarak tanımlamaktadır. Bu kitap, yayınlanmasından bu yana, bir nesil beyin ve bilişsel bilim adamlarını etkiledi. Bu kitap bugüne kadar, beyin ve bilişsel bilimler, bilgisayar görmesi ve özellikle görsel algıya adanmış araştırmacılar için bir referans kitabıdır.

Peki ya size uygun bir kitap buldunuz mu? 2018'de kendiniz için küçük bir plan yapabilirsiniz: Bilgisayarla görü ile ilgili 3 klasik kitabı okumayı bitirin!

Wen Xiaoting ve Ai Ru'dan sonra, Çin futbolunda takımı beş yılda geride bırakmak isteyen güzel bir patron daha var.
önceki
Ulusal bir market zinciri nasıl kurulur? Bilmeniz Gereken "22 Yakalama Yönetmeliği"
Sonraki
Yabancı netizenler ateşli bir şekilde tartışıyor: Çin halkı 30 saat boyunca yemek yapacak ne tür ölümsüz insanlar?
Hanchuan Kamu Güvenliği, Bahar Şenliği seyahatiyle ilgili önemli bir duyuru yayınladı! Geçici otopark açılış yeri ve serbest bırakma süresi
Çinli teyzelerin seyahat etmesi için standart hareketlerin bir derlemesi! Hyun gökyüzünü sallıyor!
Taze ürünler 40 dakikada teslim edilir Sam'in hareketi hangi sinyalleri ortaya çıkarır?
İK ne yapar? Para kazanmak için kullanılır!
Zihni yeniden özgürleştir ve yeniden reform yap! 15. Belediye Halk Kongresi'nin Dördüncü Oturumu görkemli bir şekilde açıldı! Dünya ile diyalog kuran uluslararası bir porselen şehri inşa etmek için ç
"MIT Ücretsiz Yapay Zeka Kursu" Derin öğrenme gibi 11 ana dersi kapsayan 10 yıldızlı öğretim görevlisi
Yeni yılda nerede yemek yiyeceksin, güçle konuşan bir yemek şehri?
25 yaşındaki yardımcı polis, Land Rover tarafından ezildi ve yoğun bakım ünitesine koştu! Alkollü araç kullanma nedeniyle ehliyet iptal edildi
Poz tahmini, Mask-RCNN'den% 8,2 daha yüksek. Şangay Jiaotong Üniversitesi açık kaynak AlphaPose'un Lu Cewu ekibi
Nasıl mağaza seçebilirim?
Başarılı yöneticiler sorular soracak
To Top