Tam ve sansürlü örneklem durumlarında bazı normal olmayan dağılımların parametrelerinin genetik algoritma yardımıyla tahmini


Tezin Türü: Doktora

Tezin Yürütüldüğü Kurum: Ankara Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye

Tezin Onay Tarihi: 2018

Tezin Dili: Türkçe

Öğrenci: ABDULLAH YALÇINKAYA

Danışman: BİRDAL ŞENOĞLU

Özet:

Normale yakın ve/veya çarpık verilerin modellenmesinde; Azzalini tipi Çarpık Normal (SN) ve Çarpık t (ST) dağılımları literatürde yaygın olarak kullanılır. Dağılım parametrelerini tahmin etmek için sıklıkla kullanılan yöntem En Çok Olabilirlik (ML) yöntemidir. Bir diğer popüler yöntem ise Maksimum Spacing Çarpımı (MPS) yöntemidir. ML ve MPS yöntemleri sırasıyla olabilirlik fonksiyonu ve spacing çarpımı olarak bilinen amaç fonksiyonlarını en büyük yapma esasına dayanır. SN ve ST gibi bazı normal olmayan dağılımların parametrelerinin ML ve MPS tahminleri, ilgili tahmin denklemleri analitik olarak çözülemediğinden, Newton-Raphson, Nelder-Mead ve İteratif Ağırlıklandırılmış Algoritma gibi nümerik yöntemler kullanılarak elde edilir. Bu yöntemler başlangıç değer global optimum noktaya yeterince yakın olmadığında ve/veya parametre sayısı çok olduğunda başarısız olurlar. Bu çalışmada, nümerik yöntemlere göre avantajlarından dolayı, popüler bir arama tekniği olan Genetik Algoritma (GA) kullanılması önerilmiştir. Özel olarak GA için arama uzayı Uyarlanmış En Çok Olabilirlik (MML) yöntemine dayalı olarak belirlenmiş ve tam, çift taraflı tip II sansürlü ve ilerleyen tip II sansürlü örneklem durumlarında SN ve ST dağılımlarının parametrelerinin ML ve MPS tahmin edicileri, GA ve nümerik yöntemler yardımıyla elde edilmiştir. Monte-Carlo simülasyon çalışmasıyla tahmin edicilerin etkinlikleri Hata Kareler Ortalaması (MSE) ve Deficiency (DEF) kriterlerine göre karşılaştırılmıştır. Sonuç olarak, GA yardımıyla elde edilen ML ve MPS tahmin edicilerinin nümerik yöntemler yardımıyla elde edilenlerden genellikle daha etkin ve dayanıklı oldukları görülmüştür. For modeling data-sets having near-normal and/or skewed empirical distribution; Azzalini-type Skew Normal (SN) and Skew t (ST) distributions, are widely used. One of the most popular methods used to estimate the distribution parameters is Maximum Likelihood (ML) method. Another popular method is Maximum Product of Spacing (MPS) method. ML and MPS methods are based on the maximization of the objective functions which are known as the likelihood function and the product of spacing, respectively. Since the related estimating equations cannot be solved explicitly, ML and MPS estimates of the parameters of some non-normal distributions such as SN and ST, are obtained using numerical methods such as Newton-Raphson, Nelder-Mead and Iteratively Re-weighting Algorithm. These methods fail when the initial value is not close enough to the global optimum point and/or the number of parameters is too much. In this study, Genetic Algorithm (GA) which is a popular search technique, is proposed to use due to its advantages over numerical methods. Specifically the search space for GA is identified based on Modified Maximum Likelihood (MML) method, and ML and MPS estimators of parameters of SN and ST distributions using GA and numerical methods are obtained for complete, doubly type II censored, progressively type II censored samples. The efficiencies of the estimators are compared with respect to Mean Squares Error (MSE) and Deficiency (DEF) criteria via Monte-Carlo simulation study. As a result, ML and MPS estimators obtained using GA are generally more efficient and robust than the others.