Veri madenciliğinin tıp ve sağlık hizmetlerinde uygulamaları

DİDEM ATİKTÜRK TAŞDELEN

Veri madenciliğinin tıp ve sağlık hizmetlerinde uygulamaları

Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Ankara Üniversitesi, Fen Bilimleri Enstitüsü, BİLGİSAYAR MÜHENDİSLİĞİ ANABİLİM DALI, Türkiye

Tezin Onay Tarihi: 2019

Tezin Dili: Türkçe

Öğrenci: DİDEM ATİKTÜRK TAŞDELEN

Danışman: ŞAHİN EMRAH

Açık Arşiv Koleksiyonu: AVESİS Açık Erişim Koleksiyonu

Özet:

Teknolojinin artmasıyla veri miktarının büyüklüğü ve işlenme sıklığı da günbegün artmaya devam etmektedir. Artan verilerden doğru veriye ulaşmak ve doğru bir şekilde analiz etmek yeni bir teknoloji gerektirmektedir. Bu büyük miktarlardaki veriler içerisindeki cevher veri, yönetilebilir olduğu ve yorumlandığı sürece değerlidir. Bu noktada veri madenciliği konseptiyle karşılaşılmaktadır. Konu sağlık olduğunda ise doğru ve erken teşhis kritik öneme sahip olduğundan karar verme de çok önemli hale gelmektedir. Hasta olan kişiye erkenden tedaviye başlanabilmesi için hasta teşhisi konulması, hasta olmayan kişiye de gereksiz olduğu halde ilaç tedavisi uygulanmaması için doğru teşhisin en erken zamanda konulması toplum sağlığı açısından gereklidir. Burada makine öğrenmesi yoluyla karar verme konusunda makineler doktorlara yardımcı olmakta, böylece doğru tahminlerde bulunarak doktorların iş yükünü hafifletmektedir. Bu çalışmada makine öğrenmesi metotları kullanılarak sınıflandırma işlemi yapılmıştır. Sağlık alanındaki verilerde perceptron öğrenme algoritması, K en yakın komşuluk, derin öğrenme metotları uygulanarak karşılaştırmalar yapılmış ve bir metot önerilmiştir. Uygulamalarda kullanılan veri kümesi ise UCI Makine Öğrenme Deposunda bulunan göğüs kanseri, Pima Yerlileri diyabet veritabanı, Bupa karaciğer hastalıkları, mamografik kitle verisi verileridir. The magnitude of the data and the frequency of processing data is continuing increase day by day with the advance of the technology. Analyzing and extracting meaningful information from the big data requires a new approach. In this large amount of data, the ore data is valuable as long as it is manageable and interpreted. At this point it is encountered with the concept of data mining. When the subject is health, decision making is critical since accurate and early diagnosis is critical. It is necessary in terms of publichealththatthepatientshould be diagnosed as soon as possible in order to start correct treatment early, and should prevent drug treatment if the patient is not unnecessary. Here, machines help doctors to decide on with machine decisio nmaking, reduce the workload of doctors with making accurate predictions. In this study, the classification process is done by using machine learning methods. In the data in the health field, comparisons are made by applying the perceptron learnin galgorithm, K nearest neighborhood, deep learning methodsand a method is proposed. The data is used in applications are breast cancer, Puma Indians Diabetes, Bupa liver diseases, mammographic mass data in UCI Machine Learning Repository.