Görüntü çerçevelerinde yüz algılama ve veritabanı ile eşleme yapılması


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Ankara Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye

Tezin Onay Tarihi: 2010

Tezin Dili: Türkçe

Öğrenci: GÜLDEN ELEYAN

Danışman: ASIM EGEMEN YILMAZ

Özet:

Son yıllarda, görüntülerde insan yüzünün algılanması araştırmacılar için ilgi çekici hale gelmiştir. Artan bu ilginin arkasındaki sebeplerden biri daha hızlı, gelişmiş ve havaalanlarındaki güvenliğin sağlanması için daha emniyetli bir düzen ihtiyacıdır. Hızlı ve etkin bir araç olan bilgisayarlar ile, yüz algılama ve yüzün yerinin belirlenmesini kullanan birçok uygulama, hayatın zaruri bir parçası olmuştur. İnsan mimiklerine ve jestlerine dayalı insan bilgisayar arayüzleri, fare ve klavye gibi geleneksel arayüzler ile yer değiştirmek üzere geliştirilmektedir. Bütün bunlar ve ilgili diğer uygulamalar, yüzün algılanmasını ve yerinin belirlenmesini öncelikli bir önişleme basamağı olarak görmektedir. Bu çalışmada yüz algılama için iki farklı dalgacık dönüşümü (Gabor ve Çift-Ağaç dalgacık dönüşümleri) kullanılarak özellik çıkarımı yapılmıştır. Sınıflandırma basamağında ileri beslemeli yapay sinir ağları kullanılmıştır. Tezde dört yaklaşım önerilmektedir. İlk yaklaşım sinir ağlarını eğitmek için Çift-Ağaç öznitelik vektörlerini kullanırken ikinci yaklaşım ise sinir ağlarının eğitiminde Gabor öznitelik vektörlerini kullanmaktadır. Algı başarısını arttırmak için iki farklı yaklaşım daha önerilmektedir. Bunlardan biri önceki iki yaklaşımın algı sonuçlarını OR mantık işlemi ile birleştirirken diğeri her iki dalgacık dönüşümünün ardarda eklenmiş öznitelik vektörleri kullanılarak eğitilmiş bir sinir ağı kullanmaktadır. Sistemin performans hesabında yanlış algı oranının da hesaba katıldığı altı alternatif metrik önerilmektedir. MIT+CMU ve BioID gibi çeşitli veritabanları üzerinde standart ölçüt ve önerilen ölçütler kullanılarak önerilen dört yaklaşımı test etmek için birçok deneysel simulasyon gerçekleştirilmiştir. Gabor dalgacık vektörlerinin boyutları farklı oranlara indirgenerek işlem zamanı ve performans üzerindeki etkileri incelenmiştir. Abstract Human face detection in images has gained much interest in recent years, for the researchers. One of the reasons behind this increased interest is the need for faster, advance and more reliable tool to provide security at airports. With computers as a powerful and fast tool, many applications that use face detection and localization are becoming an essential part of our life. Human-computer interfaces based on facial expressions and body gestures are being developed as ways to replace the traditional interfaces such as the mouse and the keyboard. All these and other related applications require the face detection and localization as a primary preprocessing step before. In this thesis we propose an approach for face detection using two different wavelets transforms, namely, Gabor Wavelets Transform and Dual-Tree Wavelets Transform for feature extraction. The Feedforward neural networks have been utilized for classification stage. Four approaches are introduced in this work. The First approach uses the Dual-Tree feature vectors to train neural network while second approach uses Gabor features vectors, instead, for training of the neural network. To improve the detection results other two approaches are introduced and investigated. One of these approaches applies OR logic operation to the detection outputs of the previous two approaches to increase the true face detections; while the other approach uses a neural network which is trained by using the concatenated feature vectors of both wavelet transforms. Another contribution is the introduction of five metrices, which take false detections rate into account when calculating the system performance. Many experimental simulations to test the proposed four approaches were carried out on variety of databases such as MIT+CMU and BioID using both the standard and the six alternative metrics. The effect of different downsampling rates of the Gabor wavelet vectors is examined from the execution time and performance of the system point of view.