Please use this identifier to cite or link to this item: https://hdl.handle.net/20.500.13091/2532
Title: DNA dizi analizinde hizalamasız karşılaştırma için yeni yaklaşımlar
Other Titles: Novel approaches to alignment-free comparison in DNA
Authors: Delibaş, Emre
Advisors: Arslan, Ahmet
Keywords: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol
Computer Engineering and Computer Science and Control
Dizi analizi-DNA
Sequence analysis-DNA
Publisher: Konya Teknik Üniversitesi
Abstract: Teknolojinin hızlı gelişiminin bir sonucu olarak ortaya çıkan büyük boyutlardaki biyolojik verinin işlenmesinde geleneksel biyolojik ve istatistik metotlarının yetersiz kalması, konuyu bilgisayar biliminin çalışma alanları arasında odak noktalarından biri haline getirmiştir. Benzerlik, hesaplamalı biyoloji ve biyoinformatikte DNA dizi analizinin anahtar süreçlerinden biridir. Evrimsel ilişkileri, gen fonksiyon analizini, protein yapı tahminini ve dizi eşleşmelerini araştıran neredeyse tüm araştırmalarda, benzerlik hesaplamaları yapmak gerekmektedir. Yüksek hesaplama maliyetiyle sonuçlanan hizalamaya dayalı dizi karşılaştırma yöntemlerine bir alternatif olarak, diziyi farklı bir uzayda sayısallaştırarak, tanımlanan yeni matematiksel tanımlayıcılarla benzerliği hesaplayan hizalamasız yöntemler ortaya çıkmıştır. Bu tez çalışmasında hizalamasız DNA dizi benzerlik analizinde yeni yaklaşımlar önerilmiştir. Önerilen metotlarla DNA dizileri arasındaki benzerliklerin tespitinde kullanılmak üzere özellik çıkarım süreçleri tasarlanmıştır. Uzunluktan bağımsız olarak çalışan metotların farklı uzunluktaki DNA dizileri üzerindeki etkisini test etmek üzere, literatürde kullanılmış üç farklı veri seti ele alınmıştır. Elde edilen özellik vektörlerinin benzerlik metrikleri ile ilişkileri tanımlanmış ve referans olarak kullanılan filogenetik ağaçlarla karşılaştırılmıştır. Testler neticesinde önerilen metotların elde ettiği sonuçların başarılı ve kabul edilebilir oldukları görülmüştür.
The fact that traditional biological and statistical methods are insufficient in the processing of large-scale biological data, which has emerged as a result of the rapid development of technology, has made the subject one of the focal points of the field of computer science. Similarity is one of the key processes of DNA sequence analysis in computational biology and bioinformatics. In nearly all research that explores evolutionary relationships, gene function analysis, protein structure prediction, and sequence retrieving, it is necessary to perform similarity calculations. As an alternative to alignment-based sequence comparison methods that have high computational costs, alignment-free methods have emerged that by digitizing the sequence in a different space, calculate the similarity with the new mathematical identifiers utilized. In this thesis, novel approaches are proposed in alignment-free DNA sequence similarity analysis. With the proposed methods, feature extraction processes are designed to be used to determine similarities between DNA sequences. Three different datasets used in the literature are discussed to test the effect of methods analysing independently of length on different sequences of DNA. The relations of the feature vectors obtained with similarity metrics are defined and compared with phylogenetic trees used as reference. As a result of the tests, it is seen that the results obtained by the proposed methods are successful and acceptable.
URI: https://hdl.handle.net/20.500.13091/2532
Appears in Collections:Tez Koleksiyonu

Files in This Item:
File Description SizeFormat 
724891.pdfTam Metin / Full Text7 MBAdobe PDFView/Open
Show full item record



CORE Recommender

Page view(s)

306
checked on Apr 22, 2024

Download(s)

60
checked on Apr 22, 2024

Google ScholarTM

Check





Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.