Tezin Türü: Yüksek Lisans
Tezin Yürütüldüğü Kurum: Ankara Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye
Tezin Onay Tarihi: 2018
Tezin Dili: Türkçe
Öğrenci: KAZIM SOYLU
Danışman: ŞAHİN EMRAH
Özet:Günümüzde kredi kartları ve banka kartlarının kullanımı oldukça yaygınlaşmıştır ve bu kartların internet üzerinden yapılan alışverişlerde kullanımı da artmıştır. Artan bu kart kullanımı ile beraber kredi kartı dolandırıcılığı sorunu da ortaya çıkmıştır. İnsanlar güvensiz ağlarda veya internet sayfalarında alışveriş yaparken kart bilgileri dolandırıcıların eline geçebilmektedir. Hatta mağazalarda yapılan alışverişlerde pos cihazlarına yerleştirilen düzenekler ile kart bilgileri kopyalanabilmektedir. Bunların sonucunda dolandırıcıların kart bilgilerini kullanarak maddi zararlara yol açması sonucu ortaya çıkmaktadır. Bankalar müşterilerin bu dolandırıcılıklardan en az şekilde etkilenmesi için bu sahte işlemlerin tespitine önem vermektedirler. Bankalardan günde çok sayıda işlem yapıldığı için sahte işlemlerin insan gözüyle tespit edilebilmesi çok zordur. Bu yüzden sahte işlemlerin tespit edilmesi için otomasyon sistemleri kullanılmalı ve bu sistemlerin sahte işlemleri tespit etme oranı mümkün olduğunca yüksek; gerçek işlemleri sahte olarak belirlemesi oranı da mümkün olduğunca düşük olmalıdır. Bu amaçla makine öğrenmesi yöntemleri kullanılarak kredi kartı işlemleri sınıflandırılmıştır. Veri kümesi olarak, Eylül 2013'te Avrupalı kart sahiplerinin kredi kartı işlemlerinin bulunduğu veriler kullanılmıştır. Bu veri kümesi üzerinde derin öğrenme, Rastgele Orman ve sınıflandırıcı yığını yöntemleri kullanılmış ve bu yöntemler karşılaştırılmıştır. Bu veri kümesinin dengesiz olması sebebiyle örnekleme yöntemlerinden de faydalanılmıştır. Çalışma sonucunda derin öğrenme ile 0.963, rastgele orman yöntemi ile 0.956, sınıflandırıcı yığını ile 0.979 AUC değeri elde edilmiştir. Nowadays, the usage of credit and debit cards increased considerably. Usage of these cards on online shopping also has been increased. With increasing card usage, credit card fraud problem emerged. While people do shopping on unsecured networks and websites, their card information can be stolen by fraudsters. Also when they are in a shop and paying with a physical card, their cards can be copied. After the fraudsters get the card information, they try to use card and cause a financial loss if they are successful. Financial compaines have an effort to prevent these frauds in order to have customer satisfaction and reduce their financial loss. It seems impossible for frauds to be detected with humans since many transactions done from the banks per day. Therefore, automation systems should be used in order to detect fake transactions. Accuracy of detecting frauds should be as high as possible and the rate at which legitimate transactions are classified as frauds should be as low as possible. For the sake of this purpose, credit card transactions are classified into legitimate or fraud using machine learning methods. Deep learning, random forest and stacking ensemble methods were used on the dataset which includes credit card transactions made by European cardholders in September, 2013 and results of these methods were compared. As it is a highly unbalanced dataset, sampling methods were utilized. As a result of this work, we have AUC values of 0.963, 0.956 and 0.979 for the deep learning model, random forest model and the stacking ensemble model, respectively.