Kaba kümeler teorisi üzerine algoritmalar


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Ankara Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye

Tezin Onay Tarihi: 2011

Tezin Dili: Türkçe

Öğrenci: FATİH AYBAR

Danışman: ŞAHİN EMRAH

Özet:

Kaba kümeler teorisi Pawlak (1982) tarafından geliştirildi ve kendisine birçok dalda uygulama alanı buldu. Bu alanlara bir kaç örnek verilecek olursa; tıp, yapay zeka, finans, çelişki çözümlemesi, resim analizi, örüntü algılama, kontrol teorisi, özellik çıkarımı, sınıflandırma, kural indirgeme, makine öğrenmesi ve uzman sistemler sayılabilir. Kaba kümeler teorisinin uygulandığı konulardan biri de sınıflandırma ve kural indirgemedir. Kural indirgeme gerçekleştirmesi (Kİ) üzerine ilk algoritma Pawlak (1991) tarafından tasarlandı ve Kusiak ile Tseng tarafından düzenlendi. Kİ algoritması önemli bir eksiklik içermektedir. Bu algoritma tüm durumları inceler ve bulduğu kuralların tamamını kural indirgeme olarak kabul eder. Jia-Yuarn Guo ve Vira Chankong tarafından 2002’de uygulanan Geliştirilmiş Kural İndirgeme Algoritması (GKİ) ise Kİ algoritmasının bu eksikliğini tamamlamıştır, ancak bunun için bilgi sisteminin her incelemeden önce yeniden düzenlenmesine ihtiyaç vardır. Bu tez kapsamında, en az sayıda kural indirgeme durumlarını bulmak için Budanmış Kural İndirgeme Algoritması (BKİ) geliştirilmiştir. GKİ yönteminden farklı olarak bu algoritma ağaç tipi veri yapısını kullanmaktadır. BKİ algoritması, Wisconsin göğüs kanseri verisinde hastalıkları teşhis etmede uygulanmıştır. 699 hastanın bulunduğu bilgi sisteminde 490 hastaya ait veri, eğitim amacıyla sisteme verilmiştir. Kalan 209 kaydın hastalık değerleri %99.52 doğruluk oranında başarıyla tahmin edilmiştir. GKİ algoritması üzerine yapılan çalışmalar esnasında, algoritmanın yüksek miktarda bellek kaynağına ihtiyaç duyduğu görülmüştür. Bu sebeple algoritmada bazı iyileştirmeler yapılabileceği anlaşılmıştır. Çalışmalar neticesinde daha az bellek kullanan ve daha basit işleyişe sahip bir algoritma elde edilmiştir. Kİ, GKİ, BKİ ve iyileştirilmiş GKİ algoritmalarının, aynı bilgisayar üzerinde Wisconsin göğüs kanseri verisindeki kural indirgemeleri bulmaları sağlanmıştır. Algoritmalar arasında yapılan karşılaştırma sonucunda BKİ algoritmasının 10 saniye ile en iyi performansa sahip olduğu, bunu 12 saniye ile GKİ’nin takip ettiği; iyileştirilmiş GKİ’nin ise 13 saniyede tamamlandığı görülmüştür. Kİ algoritması ise 142 saniye ile en kötü performansa sahiptir.