Makine Öğrenmesi Yöntemleri ile Zararlı Yazılım Tespiti

Loading...
Thumbnail Image

Date

2020

Authors

Güleş, Şeyma

Journal Title

Journal ISSN

Volume Title

Publisher

Konya Teknik Üniversitesi

Open Access Color

OpenAIRE Downloads

OpenAIRE Views

Research Projects

Journal Issue

Abstract

Teknolojinin gelişmesi ile birlikte hayatımızla ayrılmaz bir parça haline gelen bilgisayar sistemlerinin kullanımı giderek artmaktadır. Bu artış birçok siber güvenlik probleminin ortaya çıkmasına sebep olmuştur. Siber güvenlik açıklarının sonucunda kullanıcıların bilgisayar sistemlerine giren kötü amaçlı yazılımlar birçok zarara sebep olmaktadır. Bu zararları engelleyebilmek amacıyla kötü amaçlı yazılım tespit sistemleri geliştirilmiştir. Kötü amaçlı yazılımların herhangi bir zarara sebep olmadan önce tespit edilebilmesi bilgi sistemleri için hayati önem taşımaktadır. Bu çalışmada makine öğrenmesi yöntemleri ile bilgisayar sistemlerinin telemetri bilgileri kullanılarak kötü amaçlı bir yazılımın sistem üzerinde var olup olmadığının tahmini yapılmıştır. Çalışmada kullanılan veri seti Microsoft tarafından bilgisayarların telemetri bilgileri toplanarak oluşturulmuştur. Veri setinin ilk bir milyon veri satırı Bilgi Kazancı, Ki-Kare özellik seçme yöntemleri ile birlikte Naive Bayes, Karar Ağacı, Random Forest, Adaboost, LightGBM sınıflandırma algoritmaları ile 10 çapraz doğrulama tekniği kullanılarak test edilmiştir. Ayrıca Microsoft Kötü Amaçlı Yazılım Tahmini veri setini çalışmasında kullanan Lin'in (2019) veri ön işleme adımlarından sonra elde ettiği veri seti Naive Bayes, Karar Ağacı, Random Forest, Adaboost, LightGBM sınıflandırma algoritmaları ile test edilmiştir.
With the development of technology, the use of computer systems, which have become an integral part of our lives, is gradually increased. This increase has been caused many cyber security problems. Malicious software entering users' computer systems as a result of cyber security vulnerabilities are caused many damages. In order to prevent these damages, malware detection systems have been developed. It is vital for information systems that malware can to detected before it causes any damage. In this study, it has been estimated whether a malware exists on the system by using machine learning methods and telemetry information of the computer system. The data set used in the study was created by Microsoft by collecting telemetry information of computers. The first one million data rows of the data set were tested using 10 cross validation techniques with Naive Bayes, Decision Tree, Random Forest, Adaboost, LightGBM classification algorithms along with Knowledge Gain, Chi-Square feature selection methods. In addition, the data set obtained after data preprocessing steps by Lin (2019), who used the Microsoft Malware Prediction dataset in his study, was tested with Naive Bayes, Decision Tree, Random Forest, Adaboost, LightGBM classification algorithms after data preprocessing steps.

Description

Keywords

Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control, Bilgi güvenliği, Information security, Makine öğrenmesi yöntemleri, Machine learning methods, Siber güvenlik, Cyber security

Turkish CoHE Thesis Center URL

Fields of Science

Citation

WoS Q

N/A

Scopus Q

N/A

Source

Volume

Issue

Start Page

1

End Page

62

Collections

Downloads

2

checked on Feb 04, 2026

Google Scholar Logo
Google Scholar™

Sustainable Development Goals

SDG data is not available