Please use this identifier to cite or link to this item: https://hdl.handle.net/20.500.13091/2248
Title: Makine öğrenmesi yöntemleri ile zararlı yazılım tespiti
Other Titles: Malware detection with machine learning methods
Authors: Güleş, Şeyma
Advisors: Koçer, Barış
Keywords: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol
Computer Engineering and Computer Science and Control
Bilgi güvenliği
Information security
Makine öğrenmesi yöntemleri
Machine learning methods
Siber güvenlik
Cyber security
Publisher: Konya Teknik Üniversitesi
Abstract: Teknolojinin gelişmesi ile birlikte hayatımızla ayrılmaz bir parça haline gelen bilgisayar sistemlerinin kullanımı giderek artmaktadır. Bu artış birçok siber güvenlik probleminin ortaya çıkmasına sebep olmuştur. Siber güvenlik açıklarının sonucunda kullanıcıların bilgisayar sistemlerine giren kötü amaçlı yazılımlar birçok zarara sebep olmaktadır. Bu zararları engelleyebilmek amacıyla kötü amaçlı yazılım tespit sistemleri geliştirilmiştir. Kötü amaçlı yazılımların herhangi bir zarara sebep olmadan önce tespit edilebilmesi bilgi sistemleri için hayati önem taşımaktadır. Bu çalışmada makine öğrenmesi yöntemleri ile bilgisayar sistemlerinin telemetri bilgileri kullanılarak kötü amaçlı bir yazılımın sistem üzerinde var olup olmadığının tahmini yapılmıştır. Çalışmada kullanılan veri seti Microsoft tarafından bilgisayarların telemetri bilgileri toplanarak oluşturulmuştur. Veri setinin ilk bir milyon veri satırı Bilgi Kazancı, Ki-Kare özellik seçme yöntemleri ile birlikte Naive Bayes, Karar Ağacı, Random Forest, Adaboost, LightGBM sınıflandırma algoritmaları ile 10 çapraz doğrulama tekniği kullanılarak test edilmiştir. Ayrıca Microsoft Kötü Amaçlı Yazılım Tahmini veri setini çalışmasında kullanan Lin'in (2019) veri ön işleme adımlarından sonra elde ettiği veri seti Naive Bayes, Karar Ağacı, Random Forest, Adaboost, LightGBM sınıflandırma algoritmaları ile test edilmiştir.
With the development of technology, the use of computer systems, which have become an integral part of our lives, is gradually increased. This increase has been caused many cyber security problems. Malicious software entering users' computer systems as a result of cyber security vulnerabilities are caused many damages. In order to prevent these damages, malware detection systems have been developed. It is vital for information systems that malware can to detected before it causes any damage. In this study, it has been estimated whether a malware exists on the system by using machine learning methods and telemetry information of the computer system. The data set used in the study was created by Microsoft by collecting telemetry information of computers. The first one million data rows of the data set were tested using 10 cross validation techniques with Naive Bayes, Decision Tree, Random Forest, Adaboost, LightGBM classification algorithms along with Knowledge Gain, Chi-Square feature selection methods. In addition, the data set obtained after data preprocessing steps by Lin (2019), who used the Microsoft Malware Prediction dataset in his study, was tested with Naive Bayes, Decision Tree, Random Forest, Adaboost, LightGBM classification algorithms after data preprocessing steps.
URI: https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=5XiSE4yCP_gmnukpMEp65dD9L1UBGpVciXHRkw1MyRcDoLuFGSwrn2Jr9lNDIb3B
https://hdl.handle.net/20.500.13091/2248
Appears in Collections:Tez Koleksiyonu

Files in This Item:
File SizeFormat 
717079.pdf1.33 MBAdobe PDFView/Open
Show full item record



CORE Recommender

Page view(s)

814
checked on Apr 22, 2024

Download(s)

560
checked on Apr 22, 2024

Google ScholarTM

Check





Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.