Continuous Time Threshold Selection for Binary Classification on Polarized Data
Loading...
Date
2019
Authors
Sağlam, Ali
Baykan, Nurdan Akhan
Journal Title
Journal ISSN
Volume Title
Publisher
Open Access Color
GOLD
Green Open Access
No
OpenAIRE Downloads
OpenAIRE Views
Publicly Funded
No
Abstract
Binary classification is used to distinguish some of the data elements from others in a meaningful way according to certain characteristics. Supervised classification techniques often use the ground-truth data, which assists to determine the distinctive characteristics of the elements to be extracted from the data. These techniques also generate new features for all of the data using the current features in accordance with the ground-truth data. One of the purposes of generating new features is to polarize the data elements (to be extracted and others) toward the separate pools on a coordinate axis for binary classification. In this way, the binary classification process is easy using only a threshold value on the axis. In this work, the Linear Discriminant Analysis (LDA) is used to polarize the data and a threshold selection algorithm is proposed, which use the harmonic mean F-score values of the binary classification outputs resulting from some specific threshold values. The key condition in the proposed method is that the most suitable threshold must give the best classification score (F-score value) and other threshold values must give lower classification scores as they become distant from the best threshold value (move away toward the ends of the axis). The proposed method is experimented for binary classifications of some meaningful elements on a remote sensing image taken from a 2D semantic labelling dataset that has the ground-truth images. The proposed method convergences the best threshold value continuously in logarithmic time.
İkili sınıflandırma, veri elemanlarından bir kısmını belirli karakteristiklerine göre diğerlerinden anlamlı bir şekilde ayırmak için kullanılmaktadır. Denetimli sınıflandırma teknikleri ise genellikle veriden çıkarılacak elemanların ayırt edici karakteristiklerini belirlemeye yardımcı olan referans veriyi kullanmaktadır. Bu teknikler aynı zamanda mevcut özellikleri kullanarak bütün veri için referans veriye uygun olarak yeni özellikler oluşturmaktadır. Yeni özellikler oluşturmanın amaçlarından birisi de çıkarılacak veri elemanlarını ve diğerlerini ikili sınıflandırma için bir koordinat ekseni üzerinde ayrı kutuplara doğru kutuplaştırmaktır. Bu şekilde, sadece bir eksen üzerinde eşik değeri kullanarak, ikili sınıflandırma işlemi kolaylaşmaktadır. Bu çalışmada, veriyi kutuplaştırmak için doğrusal ayrıştırma analizi (DAA) kullanılmış ve bazı belirli eşik değerleriyle elde edilen ikili sınıflandırma çıktılarının harmonik ortalama F-score değerlerini kullanan bir eşik değeri belirleme algoritması önerilmiştir. Önerilen metottaki anahtar durum, en uygun eşik değeri en iyi sınıflandırma başarısını (F-score değerini) vermeli ve diğer eşik değerleri en iyi eşik değerinden uzaklaştıkça (eksenin iki ucuna doğru ilerledikçe) daha düşük sınıflandırma başarısını vermelidir. Önerilen metot, referans görüntüleri de içeren bir 2D anlamsal etiketleme veri kümesinden alınan bir uzaktan algılama görüntüsü üzerinde bazı anlamlı verilerin ikili sınıflandırması için uygulanmıştır. Önerilen metot en iyi eşik değerine sürekli zamanlı olarak belirlenen örnekleme sayısına ve sonlanma ölçütüne göre logaritmik zamanda yakınsamaktadır.
İkili sınıflandırma, veri elemanlarından bir kısmını belirli karakteristiklerine göre diğerlerinden anlamlı bir şekilde ayırmak için kullanılmaktadır. Denetimli sınıflandırma teknikleri ise genellikle veriden çıkarılacak elemanların ayırt edici karakteristiklerini belirlemeye yardımcı olan referans veriyi kullanmaktadır. Bu teknikler aynı zamanda mevcut özellikleri kullanarak bütün veri için referans veriye uygun olarak yeni özellikler oluşturmaktadır. Yeni özellikler oluşturmanın amaçlarından birisi de çıkarılacak veri elemanlarını ve diğerlerini ikili sınıflandırma için bir koordinat ekseni üzerinde ayrı kutuplara doğru kutuplaştırmaktır. Bu şekilde, sadece bir eksen üzerinde eşik değeri kullanarak, ikili sınıflandırma işlemi kolaylaşmaktadır. Bu çalışmada, veriyi kutuplaştırmak için doğrusal ayrıştırma analizi (DAA) kullanılmış ve bazı belirli eşik değerleriyle elde edilen ikili sınıflandırma çıktılarının harmonik ortalama F-score değerlerini kullanan bir eşik değeri belirleme algoritması önerilmiştir. Önerilen metottaki anahtar durum, en uygun eşik değeri en iyi sınıflandırma başarısını (F-score değerini) vermeli ve diğer eşik değerleri en iyi eşik değerinden uzaklaştıkça (eksenin iki ucuna doğru ilerledikçe) daha düşük sınıflandırma başarısını vermelidir. Önerilen metot, referans görüntüleri de içeren bir 2D anlamsal etiketleme veri kümesinden alınan bir uzaktan algılama görüntüsü üzerinde bazı anlamlı verilerin ikili sınıflandırması için uygulanmıştır. Önerilen metot en iyi eşik değerine sürekli zamanlı olarak belirlenen örnekleme sayısına ve sonlanma ölçütüne göre logaritmik zamanda yakınsamaktadır.
Description
Keywords
Turkish CoHE Thesis Center URL
Fields of Science
0202 electrical engineering, electronic engineering, information engineering, 02 engineering and technology, 01 natural sciences, 0105 earth and related environmental sciences
Citation
WoS Q
Q3
Scopus Q
N/A

OpenCitations Citation Count
N/A
Source
Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi
Volume
25
Issue
5
Start Page
596
End Page
602
PlumX Metrics
Citations
CrossRef : 1
Captures
Mendeley Readers : 1
Downloads
1
checked on Feb 03, 2026
Google Scholar™


