Please use this identifier to cite or link to this item: https://hdl.handle.net/20.500.13091/5080
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorKorkmaz, Sedat-
dc.contributor.authorYönet, Emre-
dc.date.accessioned2024-02-11T17:46:49Z-
dc.date.available2024-02-11T17:46:49Z-
dc.date.issued2023-
dc.identifier.urihttps://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=S2eMu1TIwY_v4mYv58xAr6npysMSSoBplKhebFD3VNRAxdbzO32Ard9zt4wHfi3u-
dc.identifier.urihttps://hdl.handle.net/20.500.13091/5080-
dc.description.abstractDoğal dil işleme; insanlar tarafından kullanılan dillerin (doğal dil) bilgisayarlar tarafından anlaşılmasını, yorum ve cevap üretilmesini sağlayan bilgisayar bilimleri ve dilbilim yöntemlerinin birlikte kullanıldığı bir bilim alanıdır. Doğal dil işleme, insanlarla bilgisayarların etkileşimini artırmak ve özellikle büyük veri setleri üzerinde çalışan kurumlar ve araştırmacılar için doğal dil verilerini analiz etmeyi ve anlamayı kolaylaştırmak amacıyla kendine birçok uygulama alanı bulmuştur. Bu uygulama alanlarından bir tanesi de metinlerin sınıflandırılmasıdır. Bu tezde, metin formatında olan ve farklı kategoride yazılmış olan şiirlerin önceden etiketlenmiş olan kategorilere göre sınıflandırılması üzerine çalışma yapılmıştır. Çalışmada web kazıma yöntemi ile elde edilen ve 4198 adet şiirden oluşan veri seti kullanılmıştır. Veri seti üzerinde 13 farklı doğal dil işleme adımları uygulanmıştır. Söz konusu işlemlerin yapılabilmesi için Zemberek Kütüphanesi kullanılmıştır. Sınıflandırma işlemi için altı farklı makine öğrenmesi algoritması kullanılmış, elde edilen sonuçlar değerlendirilmiş ve model performansını artırmaya yönelik hiperparametre analizi yapılmıştır. Hiperparametre analizi için GridSearchCV ve RandomizedSearchCV yöntemleri kullanılmıştır. Sınıflandırma algoritmalarının sonuçları kıyaslandığında en yüksek doğruluk oranını Random Forest ve SVM algoritmalarının verdiği görülmüştür.en_US
dc.description.abstractNatural language processing is a field of science that combines methods from computer science and linguistics to enable computers to understand, interpret and respond to human language (natural language). Natural language processing has found many applications to improve human-computer interaction and to make it easier to analyse and understand natural language data, especially for organisations and researchers working with large data sets. One such application is text classification. In this thesis, a study was conducted on the classification of poems in text format and written in different categories according to pre-labelled categories. The study used a dataset of 4198 poems obtained by web scraping. Thirteen different natural language processing steps were applied to the dataset. The Zemberek library was used to perform these operations. Six different machine learning algorithms were used for classification, the results obtained were evaluated and hyperparameter analysis was performed to improve model performance. The methods GridSearchCV and RandomizedSearchCV were used for the hyperparameter analysis. When the results of the classification algorithms were compared, it was found that the Random Forest and SVM algorithms gave the highest accuracy rate.en_US
dc.language.isotren_US
dc.publisherKonya Teknik Üniversitesien_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectBilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolen_US
dc.subjectComputer Engineering and Computer Science and Controlen_US
dc.titleŞiir kategorisinin doğal dil işleme yöntemleri kullanılarak tahmin edilmesien_US
dc.title.alternativePredicting poetry category using natural language processing methodsen_US
dc.typeMaster Thesisen_US
dc.departmentEntitüler, Lisansüstü Eğitim Enstitüsü, Bilgisayar Mühendisliği Ana Bilim Dalıen_US
dc.identifier.startpage1en_US
dc.identifier.endpage87en_US
dc.institutionauthorYönet, Emre-
dc.relation.publicationcategoryTezen_US
dc.identifier.yoktezid832530en_US
item.fulltextNo Fulltext-
item.openairetypeMaster Thesis-
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
item.languageiso639-1tr-
item.cerifentitytypePublications-
item.grantfulltextnone-
Appears in Collections:Tez Koleksiyonu
Show simple item record



CORE Recommender

Page view(s)

64
checked on Aug 26, 2024

Google ScholarTM

Check





Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.