Arama motorlarında görsellere erişimde dil sorunu


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Ankara Üniversitesi, Sosyal Bilimler Enstitüsü, Türkiye

Tezin Onay Tarihi: 2012

Tezin Dili: Türkçe

Öğrenci: NESLİHAN ER

Danışman: TÜLAY OĞUZ

Özet:

Web‟deki bilgi kaynakları hızlı bir biçimde katlanarak artmaktadır. Bütün dünyadaki birçok bilgi kaynağına arama motorları aracılığıyla kolaylıkla erişilebilmektedir. Ancak Web, bilgiye erişimde coğrafi engelleri aşmış olmasına rağmen, dil hala bir sorun teşkil etmektedir. Başka bir deyişle temel sorun çeşitli dillerde üretilmiş bilgiye erişmek değil, onlardan etkin bir biçimde yararlanamama sorunudur. Birçok arama motoru kullanıcılarının yabancı dildeki bir kaynağı bulup ondan yararlanabilmesi için metin tabanlı bilgi kaynaklarında çeviri desteği sunmaktadır. Fakat görselleri aramada böyle bir çeviri desteği sağlamamakta ve anahtar sözcük diline bağlı sonuçlar sunmaktadırlar. Web‟in sayısal uçurumu aşmada çözüm olduğuna dair yaygın kanı, gerçekçi değildir. Bu kanının geçerliliği görseller için doğru varsayılabilir; çünkü görseller metin tabanlı kaynaklara göre içeriklerinden daha bağımsızdırlar. Bu çalışmanın amacı, görsellere erişimde ve görselleri kullanmada dilin bir engel olduğunu göstermektir. Çalışmamızda farklı arama motorlarında farklı dillerde sorgular yapılarak dil engeli ölçülmeye çalışılmıştır. Buna bağlı olarak Google, Yahoo! ve Bing‟de dile göre bilgi erişim performansı ilk 10 ve 20‟lik kesme noktalarına göre kesin isabet, göreli erişim isabeti, dilden bağımsızlık ve kapsam ölçütlerine göre değerlendirilmiştir. Çalışmamızdaki bulgulara göre, arama motorlarında görsellere erişimde dil engeli bulunmaktadır. Bu engel, arama motorlarında görüntüsel özellikler ve çapraz dilde bilgi erişim tekniği kullanılarak çok dilde bilgi erişimin mümkün kılınması ile aşılabilecektir.AbstractInformation sources are increasing rapidly and exponentially on the Web.Many kinds of information sources from all over the world can be accessed easilythrough search engines. Although Web is successful to overcome the geographicalbarriers in access to information, language is still a problem to overcome. In otherwords the main issue is not retrieving the documents in various languages, but to beable to utilize from them. Many search engines provide “translation support” so thattheir users are able to find and use text based sources in foreign languages. But incase of searching for images, they don‟t provide “translation support” and give theresults depending on search keywords.Therefore the general judgment which depends on the current belief that Webwill be a solution for digital divide, is not completely realistic yet. The validity ofthis idea may be considered as true for image sources also, because images are moreeffective than text based documents in conveying their content. The aim of this studyis to show that language is still a barrier in retrieving and using images.In this study the language barrier/problem for queries in different languageson different search engines is tested. According to this, information retrievalperformance of Google, Yahoo! and Bing are evaluated in terms of precision ratio,relative recall ratio and language independence ratio with first 10 and 20 cut-offpoints of total results.According to our findings, search engines have language barrier/problem inretrieving images. Solution which is presented, to overcome this problem may beproviding multilanguage information retrieval by using cross language informationretrieval method and visual features.