Please use this identifier to cite or link to this item: https://hdl.handle.net/20.500.13091/2073
Title: Disease Detection From Twitter Data Using Natural Language Processing and Machine Learning
Other Titles: TWİTTER VERİLERİNDEN DOĞAL DİL İŞLEME VE MAKİNE ÖĞRENMESİ İLE HASTALIK TESPİTİ
Authors: Öztürk, Ali
Durak, Üsame
Badilli, Fatma
Keywords: Twitter
Disease Recognition
Natural Language Processing
Machine Learning
Twitter
Hastalık Tanıma
Doğal Dil İşleme
Makine Öğrenmesi
Publisher: Konya Technical University
Abstract: In this study, we determined whether the subject of the messages of the twitter users were about a disease and what kind of diseases they were. For this purpose, supervised and unsupervised machine learning algorithms were tested and compared using the features extracted via TF-IDF and BOW methods. Data were collected with Python scripts from Twitter. The Scikit-Learn library which was developed for Python was used to implement the algorithms. The clustering algorithms which are unsupervised methods achieved an accuracy level of %68.60, while the performance of the supervised classification algorithms reached to the accuracy level of %97.48.
Bu çalışmada twitterdaki kullanıcıların yazmış oldukları mesajların hastalık konulu olup olmadığı ve hastalık türleri tespit edilmiştir. Bu amaçla gözetimli ve gözetimsiz makine öğrenmesi algoritmaları, TF-IDF ve BOW yöntemleri ile çıkarılan özellikler ile denenmiş ve karşılaştırmalar yapılmıştır. Veriler Python betikleri ile twitter üzerinden toplanmıştır. Algoritmaları uygulamak için Python için geliştirilmiş Scikit-Learn kütüphanesi kullanılmıştır. Gözetimsiz olarak verilerin kümelenmesinde %68.60’lık bir başarı elde edilirken, gözetimli algoritmalar ile yapılan sınıflandırmalarda %97.48’lik başarı oranına ulaşılmıştır.
Description: DergiPark: 650150
konjes
URI: https://doi.org/10.36306/konjes.650150
https://dergipark.org.tr/tr/pub/konjes/issue/57976/650150
https://dergipark.org.tr/tr/download/article-file/860622
https://hdl.handle.net/20.500.13091/2073
ISSN: 2667-8055
Appears in Collections:Konya Mühendislik Bilimleri Dergisi

Files in This Item:
File SizeFormat 
10.36306-konjes.650150-860622.pdf862.45 kBAdobe PDFView/Open
Show full item record



CORE Recommender

Page view(s)

180
checked on May 6, 2024

Download(s)

46
checked on May 6, 2024

Google ScholarTM

Check




Altmetric


Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.