Please use this identifier to cite or link to this item: https://hdl.handle.net/20.500.13091/5092
Title: Doğal dil işleme ve makine öğrenmesi yöntemleri kullanılarak stilometri analizi ile Türkçe metinlerde eser – yazar eşleştirme
Other Titles: Artifact – author matching in Turkish texts with stylometry analysis using natural language processing and machine learning methods
Authors: Korkmaz, Sedat
Doğan, İbrahi̇m
Keywords: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol
Computer Engineering and Computer Science and Control
Issue Date: 2023
Publisher: Konya Teknik Üniversitesi
Abstract: Teknolojinin ve internetin yaygınlaşmasıyla birlikte birçok alanda olduğu gibi gazetecilik alanında da değişimler ve gelişmeler meydana gelmiştir. Çevrim içi gazeteler, birçok unsuru içerisinde barındırabilmesi ve daha büyük kitlelere hitap etmesi nedeniyle çok sayıda gazete sahibinin ve bu alanda hizmet veren yazarın yoğun ilgisini üzerine çekmiştir. Bu kapsamda; geleneksel yöntemlerle yayın yapmakta olan gazeteler dijital ortamda hizmet verebilmek için hızla bu değişim sürecine dahil olmuş ve böylelikle internet üzerinden hizmet veren medya kuruluşlarının sayısında kısa süre içerisinde önemli ölçüde artış meydana gelmiştir. Gazetecilik alanında meydana gelen bu gelişmeler, farklı alanlarda eser veren yazarların aynı platform üzerinde okuyucular ile buluşmasına olanak sağlayarak birçok alanda sayısız eser verilmesinde etkili olmuştur. Ancak söz konusu bu olumlu gelişmelerin yanı sıra veri sayısında meydana gelen artış istenilen ve doğru veriye erişimi zorlaştırmıştır. Bunun sonucunda özellikle anlamsız verilerden anlamlı verilerin çıkarılması ve verilerin belirli niteliklere göre sınıflandırılması konuları önem kazanmıştır. Bu çalışmada elektronik ortamda gazete yazarlığı yapan kişilerin yazmış olduğu yazılar sayısal üslup analizi, yapay zekânın bir alt dalı olan doğal dil işleme ile makine öğrenmesi yöntemleri kullanılarak analiz edilmiş ve söz konusu yazıların hangi yazarlar tarafından yazıldığının doğru eşleştirilebilmesi amaçlanmıştır. Veri seti üzerinde veri ön işleme çalışmaları tamamlanarak veri seti optimizasyonu sağlanmış ve daha sonra Zemberek kütüphanesi fonksiyonları kullanılarak doğal dil işleme süreçleri ile öznitelik çıkarma işlemleri gerçekleştirilmiştir. Son olarak çalışmada kullanılan makine öğrenmesi sınıflandırma algoritmalarından hangisinin yazar-eser eşleştirmelerinde daha başarılı olduğuna karar verebilmek için karşılaştırma yapılmış ve model seçiminin buna bağlı olarak belirlenmesi hedeflenmiştir.
With the widespread use of technology and the Internet, changes and developments have occurred in many areas, including the field of journalism. Online newspapers have attracted the attention of many newspaper owners and writers who serve in this field due to their ability to incorporate various elements and appeal to larger audiences. In this context, traditional newspapers that were operating with conventional methods quickly became part of this process of change in order to provide services in the digital environment, resulting in a significant increase in the number of media organizations operating on the Internet. These developments in journalism have enabled writers working in different fields to reach readers on the same platform, leading to numerous works being produced in various areas. However, alongside these positive developments, the increase in data volume has made it difficult to access the desired and accurate data. As a result, extracting meaningful data from meaningless data and classifying data according to specific attributes have become important topics. In this study, articles written by individuals who engage in newspaper writing in the electronic environment were analyzed using methods of numerical style analysis, natural language processing (a subfield of artificial intelligence), and machine learning to accurately match the authors of these articles. Data preprocessing was performed on the dataset to optimize it, followed by feature extraction using the functions of the Zemberek library for natural language processing. Finally, a comparison was made among the machine learning classification algorithms used in the study to determine which one was more successful in author-work matching, and the model selection was intended to be determined accordingly.
URI: https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=S2eMu1TIwY_v4mYv58xArxSfnHZEtG1xVzM_zio3RmkKqeQz-5tIAGwJnUipKRXk
https://hdl.handle.net/20.500.13091/5092
Appears in Collections:Tez Koleksiyonu

Show full item record



CORE Recommender

Google ScholarTM

Check





Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.