Kaya, ErsinTaşkıran, Salimkan Fatma2021-12-132021-12-132021https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=v7BkNnnepTnbhn8rNR77LfUEMoyVTFUdh4ZOL2fnhgkZmWLutHoUdEtZEpknLly-https://hdl.handle.net/20.500.13091/1346Günümüzde ulaşımı kolay hale gelen verilerin verimli bir şekilde kullanılabilmesi için verileri ihtiyaç duyulan özelliklerine göre kategorize etmek gerekmektedir. Akademik alanda araştırma yaparken ise genellikle makale, bildiri veya tez çalışmaları gibi metin tabanlı veriler kullanılır. Kısa sürede ihtiyaç duyulan bilgiye ulaşılması için bu verilerin kategorize edilmesi büyük kolaylık sağlar. Metin tabanlı verilerin kategorizasyonu için doğal dil işleme ve makine öğrenmesi yöntemleri bir arada kullanılır. Doğal dil işleme, insanların kullandığı diller (doğal dil) ve bilgisayarlar arasındaki etkileşimi ele alan bir dilbilim, yapay zekâ ve bilgisayar bilimleri alanıdır, doğal dil metinlerinin ve konuşmaların anlanması, analiz ve manipüle edilmesinde bilgisayarların kullanımını inceler. Bu tez çalışmasında doğal dil işleme teknikleri ile akademik metinler üzerinde kümeleme yapılmıştır. Frekans tabanlı ve yapay sinir ağı tabanlı metin temsil yöntemleri kullanılarak farklı kümeleme algoritmalarından alınan sonuçlar karşılaştırılımış ve analiz edilmiştir.Today, access to data has become extremely easy. In order to use these data efficiently, it is necessary to categorize the data according to the required properties. While doing research in the academic field, text-based data such as articles, papers or thesis studies are generally used. Categorizing these data in order to reach the needed information in a short time provides great convenience. Natural language processing and machine learning methods are used for the categorization of text-based data. Natural language processing is a field of linguistics, artificial intelligence and computer science that deals with the interaction between human languages (natural language) and computers. It studies the usage of computers in understanding, analysing and manipulating the natural language texts and natural speech. In this thesis, clustering was done on academic texts using natural language processing techniques. With frequency-based and neural network-based text representation methods, the results from different clustering algorithms were compared and analyzed.trinfo:eu-repo/semantics/openAccessBilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolComputer Engineering and Computer Science and ControlDoğal Dil İşleme ile Akademik Metinlerin KümelenmesiClustering Academic Texts Using Natural Language ProcessingMaster Thesis