Метод багатопрофільного розпізнавання рукописних текстів offline
Abstract
Магістерська дипломна робота присвячена розробці програмного забезпечення для багатопрофільного offline-розпізнавання рукописного тексту. Під «багатопрофільним» розуміється розпізнавання незалежно від почерку людини. Розробка системи на базі штучних нейронних мереж (ШНМ) передбачає збір, аналіз і структурування вихідних даних, перетворення даних до заданого зразку та власне процес навчання мережі. У роботі проаналізовано сучасні методи оптичного розпізнавання символів (ОРС), особливості розпізнавання рукописного тексту, розглянуто різні типи нейронних мереж та підходи до їх навчання. Систему створено у форматі додатку, що складається з кількох окремих модулів для підготовки вхідних даних, навчання мережі та прогнозування слів за їхніми зображеннями. Програмне забезпечення розроблено з використанням мови Python, а також спеціалізованих бібліотек для машинного навчання та обробки зображень: Keras, Numpy, Scikit, Pillow та інші. The master’s thesis is devoted to the software development for multi-profile offline recognition of handwritten text. Under “multi-profile” is understood recognition independent on human script. Development of the system based on artificial neural network (ANN) implies collecting, analyzing and structuring input data, transforming it to specified format and the process of network’s learning. The thesis contains analysis of actual methods for optical character recognition (OCR), handwritten recognition features as well as observation of different neural networks types and kinds of learning. The system is created in a form of application composed of several independent modudles for preparing data, network learning and predicting a word by its image. The software is developed using Python programming language, as well as specialized libraries for machine learning and image processing: Keras, Numpy, Scikit, Pillow etc.
URI:
http://ir.lib.vntu.edu.ua//handle/123456789/25089