Please use this identifier to cite or link to this item: https://hdl.handle.net/20.500.13091/142
Title: Evrişimsel sinir ağları ve metin benzerliği kullanılarak fatura görüntülerinde sınıflandırma [Master Thesis]
Other Titles: Classification of invoice images by using convolutional neural networks and text similarity [Master Thesis]
Authors: Arslan, Ömer
Advisors: Uymaz, Sait Ali
Keywords: Bilgi ve Belge Yönetimi
Information and Records Management
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol
Computer Engineering and Computer Science and Control
Derin öğrenme
Deep learning
Doğal dil işleme
Natural language processing
Görüntü sınıflandırma
Image classification
Publisher: Konya Teknik Üniversitesi
Abstract: Günümüzde tüm firmalar, çeşitli sebeplerle firma adına yapılan harcamalar için ödeme yapmakta ve ödemeye ait faturalar muhasebe işlemleri sebebiyle saklanmaktadır. Firma büyüdükçe personel sayısı artmakta olup firmanın çalışmakta olduğu tedarikçi firmaların sayısı da buna paralel olarak artmaktadır. Personel ve beraber çalışılan tedarikçi firma sayısının artmasıyla firma adına yapılan harcama miktarı da artmaktadır. Artan harcama miktarına bağlı olarak harcamalara ait fatura sayısı da büyük sayılara ulaşmaktadır. Fatura görüntüleri üzerindeki bilgilere daha sonra tekrar ulaşılabilmesi için üzerindeki bilgilerin saklanması gerekmektedir. Bu bilgilerin saklanması, yasal sebeplerden dolayı da gereklidir. Fiziksel olarak muhasebe birimlerine gönderilen faturalar, muhasebe destek personelleri tarafından dijital ortama aktarılmaktadır. Çok büyük firmalar çok daha fazla faturaya sahip olduklarından dolayı, faturaların dijital ortama aktarımı sırasında çok daha fazla personel gücü sarf edilmektedir. Personellerin devasa miktarda faturaları aktaramadıkları durumlarda ise daha fazla muhasebe personeli işe alınmaktadır. Ayrıca çok fazla faturanın kısıtlı bir zaman içerisinde girildiği zamanlarda giriş sırasında yapılan hata miktarı da artmakta olup düzeltmeler için ayrıca zaman ve iş gücü harcanmaktadır. Bu tez çalışmasının amacı, firma bünyesinde çalışan personeller tarafından gerçekleştirilen fatura giriş işlemlerini otomatik bir hale getirmektir. Bu doğrultuda, derin öğrenme yöntemlerinden biri olan evrişimsel sinir ağları tabanlı bir mimari kurularak faturalar şablonlarına göre sınıflandırılmıştır. Sınıflandırma işlemi, fatura üzerinde yer alan fatura alanlarının konumlarına ve şablon yapısına göre yapılmıştır. Fatura şablonuna göre sınıflandırma yapıldıktan sonra şablonu tespit edilen faturaya OCR uygulanarak fatura üzerindeki karakterler otomatik olarak okunmuş ve doğal dil işleme birimine aktarılmıştır. Fatura görüntüsünden alınan verilerin hangi fatura alanına ait olduğunun tespiti ve fatura üzerindeki konumunun belirlenmesi için doğal dil işleme birimi kullanılmıştır. Minimum personel gücü gerektiren bu sistem sayesinde personellerin fatura girişi sırasında yapması muhtemel olan hata sayısı minimuma ineceğinden fatura giriş süreci çok daha kolay ve güvenli bir hale gelmiş olacaktır.
Today, all companies pay for the expenses made on behalf of the company for various reasons and the invoices for the payment are kept for accounting purposes. As the company grows, the number of personnel increases and the number of supplier companies that the company works with increases in parallel. With the increase in the number of personnel and supplier companies, the amount of expenditure on behalf of the company also increases. Depending on the increasing amount of expenditure, the number of invoices for expenditures also reaches large numbers. In order to access the information on the invoice images later, the information on the image must be stored. Storage of this information is also necessary for legal reasons. Invoices that are physically sent to the accounting units are transferred to the digital environment manually by the accounting support personnel. Since very large companies will have much more invoices, much more personnel power will be spent during the transfer of invoices to the digital environment. In cases where the staff cannot transfer huge amounts of invoices, more accounting personnel are recruited. In addition, when too many invoices are entered in a limited time, the amount of error made during entry also increases and additional time and effort is consumed for corrections. The purpose of this thesis study is to automate the manual invoice entry processes performed by the personnel working within the company. Accordingly, an architecture based on convolutional neural networks, which is one of the deep learning methods, was established and invoices were classified according to their templates. The classification process is made according to the location of the invoice fields on the invoice and the template structure. After the invoice is classified according to the template, OCR is applied to the invoice whose template has been determined, and the characters on the invoice are automatically read and transferred to the natural language processing unit. Natural language processing unit was used to determine which invoice field belongs to the data taken from the invoice image and to determine its position on the invoice. With the new method that requires minimum personnel power, the number of possible mistakes that the personnel may make during entry will be minimized, and the invoice entry process will become much easier and safer.
URI: https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=9MiDp3x86xrwjpi5-14w-RbvIYZFMQRJqiByplLKdlN3JTW_WIcwKaolqGmDd76a
https://hdl.handle.net/20.500.13091/142
Appears in Collections:Tez Koleksiyonu

Files in This Item:
File SizeFormat 
661903.pdf5.12 MBAdobe PDFView/Open
Show full item record



CORE Recommender

Page view(s)

282
checked on Apr 22, 2024

Download(s)

356
checked on Apr 22, 2024

Google ScholarTM

Check





Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.