Dağıtık veri depolama sistemlerinde ağ kodlama algoritmalarının uygulamalı karşılaştırılması


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Ankara Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye

Tezin Onay Tarihi: 2018

Tezin Dili: Türkçe

Öğrenci: BURAK BEZİRCİ

Danışman: ASIM EGEMEN YILMAZ

Özet:

Bu tez çalışmasında, bir dağıtık veri depolama sistemi modeli oluşturulmuştur. Oluşturulan bu sistem modelinde verinin oluşturulması, kodlanması, ağ üzerinden düğümlerine ayrılması, hatalı verinin düzeltilmesi ve kod çözme ile orijinal verinin yeniden elde edilmesi sağlanmıştır. Sistem modelinde kullanılmak üzere, optimal kodlama yöntemini belirleyebilmek için farklı veri boyutlarında, Reed-Solomon, Hamming ve Parite dizi kodlama yöntemlerinin, belirlenen kriterlere (kodlama/kod çözme süresi, verimlilik, hata düzeltme oranı, genişletilebilirlik, verinin taşınabilme kapasitesi) göre uygulamalı kıyaslamaları yapılmıştır. Elde edilen bulguların sonucunda, incelenen kodlama yöntemlerinin kullanım alanları belirlenmiş olup, optimal bir kodlama yönteminin oluşturulması için gerekli olabilecek kriterler belirtilmiştir. Buna göre yazılım tabanlı oluşturulan bir dağıtık veri depolama sisteminde, farklı kullanım alanlarına göre aynı anda farklı silinti kodlama yöntemlerinin kullanılabileceği sonucu elde edilerek, dağıtık veri depolama çözümleri için hibrid sistem tasarımı önerilmiştir. In this thesis, a distrubited storage system model has been established. The generated system model is provided that creating data, encoding, sperating into nodes via network, correcting the erroneous data and recovering the original data with decoding. ReedSolomon, Hamming and Parity-Array coding methods are compared practically according to specified criteria (coding/decoding time, efficiency, error correction rate, expandability, data migration capacity) with different data sizes to determine the optimal coding methods to use in the system model. As a result of the findings obtained, the use case of the examined coding methods are determined and criterias that may be required are specified for the optimum coding method. Accordingly, the result is obtained that different erasure coding methods can be used for different use cases in software defined distrubeted storage systems. Consequently, hybrid system design is proposed for distributed data storage solutions.