Please use this identifier to cite or link to this item:
Title: Makine öğrenmesi yöntemleri kullanılarak uzaktan eğitim konulu Türkçe tweetlerin duygu analizi
Other Titles: Turkish tweets on distance education using machine learning methods sentiment analysis
Authors: Akdeniz, Ali Can
Advisors: Babaoğlu, İsmail
Keywords: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol
Computer Engineering and Computer Science and Control
Publisher: Konya Teknik Üniversitesi
Abstract: Teknolojinin gelişmesi beraberinde sosyal medya platformlarının da gelişerek büyük kullanıcı kitlelerine ulaşmasına yol açmıştır. Kişiler sosyal medya platformları kullanarak diğer kişilerle iletişim kurabildiği gibi, meydana gelen toplumsal olaylar karşısında, bir ürün ya da bir konu hakkında ortak bir başlıkta bu platformlarda bir araya gelerek duygu ve düşüncelerini paylaşabilmektedir. Bu paylaşımlar duygu analizi çalışmaları için birçok alanda kullanılabilir büyük bir veri kaynağı oluşturmaktadır. Duygu analizi çalışmaları ile bu veriler işlenip analiz edilerek, ilgili konu hakkında olumlu, olumsuz veya tarafsız duygu ifadeleri belirlenebilmektedir. 2020 yılının ocak ayında başlayan ve tüm dünyayı etkisi altına alan korona virüs salgını ile ülke genelinde birtakım tedbirler alınmaya başlanmış, bu tedbirler kapsamında da Mart 2020'den itibaren uzaktan eğitim sürecine geçilmiştir. Bu çalışmada sosyal medya platformu Twitter'da paylaşılan uzaktan eğitim konulu Türkçe tweetler elde edilerek veri ön işleme tabi tutulmuş ve ayrıca zemberek kütüphanesi ile normalleştirilerek işlenebilir bir hale getirilmiştir. Sınıflandırma aşamasında girdi olarak kullanılacak veri seti için manuel etiketleme işleminin yanı sıra farklı bir yaklaşımla dil çeviri işlemi yapılarak İngilizce dilinde doğrudan duygu çıktıları üreten TextBlob, Vader ve Bert ile modeller oluşturulmuştur. Bu modeller farklı sayısallaştırma yöntemleri (BoW, TF-IDF, Word2Vec,) ve farklı makine öğrenmesi algoritmaları (LR, SGD, SVM, RF, NB) ile kullanılarak en iyi performansı gösteren sınıflandırma modeli üzerinden yapılan paylaşımların duygu analizi gerçekleştirilmiştir. Türkçe metinlerin manuel etikete sahip olduğu yapıda en iyi TF-IDF – LR ikilisi ile 0.79'luk bir sınıflandırma başarısı elde edilmiştir. Manuel yöntemle etiketlendirilen tarafsız olarak işaretlenmiş metinler veri setinden çıkarıldığında başarı oranının arttığı ve BoW – LR ikilisinin 0.84'lük oranla en iyi sonucu verdiği görülmüştür. Dil çeviri işlemi ile hazır modeller tarafından etiketlenerek oluşturulan modellerde Türkçe metinler için istenilen seviyede bir başarı elde edilememiştir.
The development of technology has led to the development of social media platforms and reaching large user masses. People can communicate with other people by using social media platforms, and they can come together on these platforms to share their feelings and thoughts on a common topic about a product or a topic, in the face of social events that occur. These shares constitute a large data source that can be used in many fields for sentiment analysis studies. With sentiment analysis studies, these data can be processed and analyzed, and positive, negative or neutral emotional expressions about the relevant subject can be determined. With the corona virus epidemic, which started in January 2020 and affected the whole world, some measures were taken across the country, and within the scope of these measures, the distance education process started in March 2020. In this study, Turkish tweets on distance education shared on the social media platform Twitter were obtained and the data were pre-processed and also normalized with the zemberek library and made processable. For the data set to be used as input in the classification phase, besides manual labeling, models were created with TextBlob, Vader and Bert, which directly produce English emotion outputs by making language translation with a different approach. For the data set to be used as input in the classification phase, besides the manual labeling process, a different approach was brought with language translation and models were created with TextBlob, Vader and Bert, which directly produce English emotion outputs. These models were used with different digitization methods (BoW, TF-IDF, Word2Vec,) and different machine learning algorithms (LR, SGD, SVM, RF, NB) and sentiment analysis of the shares made on the best performing classification model was performed. In the structure where Turkish texts have manual tags, 0.79 classification success was achieved with the best TF-IDF – LR pair. When the texts labeled with the manual method and marked as neutral were removed from the data set, it was seen that the success rate increased and the BoW – LR pair gave the best result with a ratio of 0.84. In the models created by labeling ready-made models with the language translation process, the desired level of success for Turkish texts was not achieved.
Appears in Collections:Tez Koleksiyonu

Files in This Item:
File SizeFormat 
747080.pdf3.66 MBAdobe PDFView/Open
Show full item record

CORE Recommender

Page view(s)

checked on Sep 30, 2024


checked on Sep 30, 2024

Google ScholarTM


Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.