Please use this identifier to cite or link to this item: https://hdl.handle.net/20.500.13091/2088
Full metadata record
DC FieldValueLanguage
dc.contributor.authorÇimen, Barış-
dc.contributor.authorDurahim, Ahmet Onur-
dc.date.accessioned2022-02-26T20:57:10Z-
dc.date.available2022-02-26T20:57:10Z-
dc.date.issued2020-
dc.identifier.issn2667-8055-
dc.identifier.urihttps://doi.org/10.36306/konjes.788046-
dc.identifier.urihttps://dergipark.org.tr/tr/pub/konjes/issue/56595/788046-
dc.identifier.urihttps://dergipark.org.tr/tr/download/article-file/1273102-
dc.identifier.urihttps://hdl.handle.net/20.500.13091/2088-
dc.descriptionDergiPark: 788046en_US
dc.descriptionkonjesen_US
dc.description.abstractÇevrimiçi müzik platformlarının kullanımının artmasıyla birlikte, katalog tabanlı aramalar, duygu bazlı aramalara dönüşmüştür. Bu çalışmada, Türkçe şarkıların duygu durum tespiti için kelime vektörlerini kullanan yarı denetimli bir öğrenme çerçevesi olan MooDetecTR önerilmiştir. Bu çerçevede, önce kelime vektörleri Word2Vec ve GloVe algoritmaları ile 2,5 milyondan fazla Türkçe belge içeren geniş bir metinsel veri koleksiyonu kullanılarak oluşturulmuştur. Daha sonra, duygu durum tespiti için seçilen şarkı sözlerindeki kelimelerin, daha önceden eğitilmiş kelime vektörlerinin birleştirilmesiyle şarkı sözleri vektörleri üretilmiştir. Son olarak, oluşturulan bu şarkı sözleri vektörleri, müzik duygu durum tespitinde kullanılmak üzere çeşitli makine öğrenmesi algoritmaları kullanılarak oluşturulan modelleri eğitmek için kullanılmıştır. Türkçe müziklerde duygu durumu tespiti karşılaştırma yapılmak üzere ayrıca, hem TF-IDF ağırlıkları kullanılarak geleneksel kelime çantası modeli ile hem de Doc2Vec algoritması kullanılarak oluşturulan modeller ile gerçekleştirilmiştir. Kelimelerin köklerine ayrıştırılması ve gereksiz kelimelerin kaldırılmasının sonuçlara etkileri de incelenmiştir. Önerilen çerçeve ile elde edilen en iyi mikro-f1 skoru (%54,36), Doc2Vec ve kelime çantası yöntemlerinden elde edilen en iyi skorlardan sırasıyla %3,81 ve %2,92 (%7,54 ve %5,68 nispi iyileştirmeler) daha başarılıdır. Sonuç olarak, elde edilen skorlar, Türkçe metin sınıflandırma uygulamasında büyük metinsel verilerin kullanılması ile oluşturulan kelime vektörlerinin olumlu etkisini artan sınıflandırma başarı performansı ile açıkça göstermektedir.en_US
dc.description.abstractAlong with the increasing use of online music platforms, catalogue-based searches have turned into mood-based seeking. In this study, we propose MooDetecTR, a semi-supervised learning framework that employs word vectors for Turkish song mood detection. In this framework, first word vectors are created through a large collection of textual data, which include more than 2.5 million Turkish documents, by using Word2Vec and GloVe algorithms. Subsequently, lyrics vectors are generated through combining already trained word vectors of the words in the lyrics selected for mood detection. Lastly, lyrics vectors are fed into various machine-learning algorithms as features to create models for music mood detection. For comparison, Turkish music mood detection is performed both via traditional bag-of-words model, with TF-IDF weights, and Doc2Vec algorithm. The effects of stemming of the words and stop-words removal on the results are investigated, as well. The best micro-f1 score (54.36%) obtained by the proposed framework is 3.81%, and 2.92% higher (7.54%, and 5.68% relative improvements) than the best score obtained from Doc2Vec and bag-of-words methods, respectively. Consequently, the results obtained show the effectiveness of incorporating word vectors generated using big textual data into Turkish text classification process, which is clearly illustrated by the improved classification performance.en_US
dc.language.isotren_US
dc.publisherKonya Technical Universityen_US
dc.relation.ispartofKonya Mühendislik Bilimleri Dergisien_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectMetin sınıflandırmasıen_US
dc.subjectÖzellik üretimien_US
dc.subjectMüzik ruh hali sınıflandırmaen_US
dc.subjectDoğal dil işlemeen_US
dc.subjectKelime vektörlerien_US
dc.subjectText classificationen_US
dc.subjectFeature Generationen_US
dc.subjectMusic mood classificationen_US
dc.subjectNatural language processingen_US
dc.subjectWord embeddingsen_US
dc.titleMooDetecTR: Kelime Vektörleri Vasıtasıyla Türkçe Şarkı Sözleri için Ruh Hali Tespitien_US
dc.title.alternativeMOODETECTR: MOOD DETECTION FOR TURKISH LYRICS THROUGH WORD VECTORSen_US
dc.typeArticleen_US
dc.identifier.doi10.36306/konjes.788046-
dc.departmentKTÜNen_US
dc.identifier.volume8en_US
dc.identifier.issue3en_US
dc.identifier.startpage499en_US
dc.identifier.endpage509en_US
dc.relation.publicationcategoryMakale - Ulusal Hakemli Dergi - Başka Kurum Yazarıen_US
item.languageiso639-1tr-
item.fulltextWith Fulltext-
item.cerifentitytypePublications-
item.openairetypeArticle-
item.grantfulltextopen-
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
Appears in Collections:Konya Mühendislik Bilimleri Dergisi
Files in This Item:
File SizeFormat 
10.36306-konjes.788046-1273102.pdf975.88 kBAdobe PDFView/Open
Show simple item record



CORE Recommender

Page view(s)

852
checked on Apr 22, 2024

Download(s)

114
checked on Apr 22, 2024

Google ScholarTM

Check




Altmetric


Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.