Методи опрацювання зображень текстів арабської абетки
Електронний науковий архів Науково-технічної бібліотеки Національного університету "Львівська політехніка"
Переглянути архів ІнформаціяПоле | Співвідношення | |
Title |
Методи опрацювання зображень текстів арабської абетки
Методы обработки изображений текстов арабского алфавита Methods of processing texts in Arabic alphabet |
|
Creator |
Імад, І.А.
|
|
Subject |
зображення арабського тексту
змазування і дефокусування зображень методи відновлення зображень інтегральне рівняння Фредгольма метод регуляризації інформаційна система послідовності Фрімана изображения арабского текста смазывание и расфокусирование изображений методы восстановления изображений интегральное уравнение Фредгольма метод регуляризации информационная система последовательности Фримана image of Arabic text smearing and unsharpness of images methods of restoration of images Fredholm equation method of regularization information system Freeman sequence |
|
Description |
Дисертація присвячена розробці інформаційної технології для методів опрацювання спотворених зображень арабського тексту для поліпшення їх автоматичного розпізнавання. Показано, що при отриманні первинного зображення або низькій якості оригіналу (наприклад, з фотографії, факсу і т.п.) можливі спотворення тексту, що виявляються у вигляді нерізкості або змазування. Такі спотворення не дозволяють застосувати отримане зображення для автоматичного розпізнавання і вимагають його попередньої обробки з метою відновлення. Розглянуті характеристики арабських текстів, показані складність задач розпізнавання таких текстів через наявність діакритичних знаків і різне написання букв в залежності від їх розташування в слові (на початку, в кінці, посередині) або ізольовано в реченні, відмінності в стилях написання, запропонована методика розпізнавання знаків, що зливаються або накладаються. Для вирішення задач відновлення розглянуті математичні проблеми попередньої обробки спотворених в результаті змазування або дефокусування зображень. Показано, що задача реконструкції спотвореного зображення зводиться до розв’язку відповідного інтегрального рівняння Фредгольма першого роду, що розв’язується методом регуляризації згідно запропонованих формул. Проведено порівняння різних методів відновлення зображень, розглянуто методи компенсації краєвих ефектів при відновленні зображень. Розроблена і реалізована інформаційна система для розпізнавання арабських символів на основі послідовностей Фрімана та розроблених методів покращення зображень. Диссертация посвящена разработке информационной технологии для методов обработки искаженных изображений арабского текста для улучшения их автоматического распознавания, основываясь на общей теории решения некорректных задач. Показано, что при получении первичного изображения или низком качестве оригинала (например, с фотографии, факса и т.п.) возможны искажения текста, которые проявляются в виде нерезкости или смазывания. Такие искажения не позволяют использовать полученное изображение для автоматического распознавания и требуют его предварительной обработки с целью восстановления. Рассмотрены характеристики арабских текстов, показаны сложность задач распознавания таких текстов из-за наличия диакритических знаков и различного написания букв в зависимости от их расположения в слове (в начале, в конце, посредине) или изолировано в предложении, отличий в стилях написания, предложена методика распознавания знаков, которые сливаются или накладываются. Для решения задач восстановления рассмотрены математические проблемы предварительной обработки искаженных в результате смазывания или расфокусирования изображений. Показано, что задача реконструкции искаженного изображения сводится к решению соответствующего интегрального уравнения Фредгольма первого рода, которое решается методом регуляризации согласно предложенных формул. Впервые разработан и исследован метод автоматического определения параметра регуляризации по заданному уровню погрешности входных данных при обработке искаженных изображений, что в отличие от известных подходов не требует вмешательства оператора в процесс реконструкции (выбор параметра регуляризации методом подбора), а также решения соответствующего трансцендентного уравнения (выбор параметра регуляризации по невязке). Проведено сравнение разных методов восстановления изображений, рассмотрены методы компенсации краевых эффектов при восстановлении изображений. Разработана и реализована информационная система для распознавания арабских символов на базе последовательностей Фримана и разработанных методов улучшения изображений, для сегментации текста, разделения слогов один от другого и слов на буквы для изображений текстов арабского письма, что позволило классифицировать субслова и буквы в зависимости от места их написания, выполнена программная реализация информационной технологии для распознавания изображений арабского текста на основе разработанного метода предварительной обработки искаженных изображений, который показал его высокую эффективность. This dissertation is dedicated to the development of information technology for processing distorted images of the text in Arabic language to improve their automatic recognition. It has been demonstrated, that at obtaining the initial image or in case of poor quality of the original (for example, from a photograph, fax message page, etc.) there can be distortions of the text in the form of poor sharpness or smears. Such distortions do not permit to use the obtained image for automatic recognition and require its preliminary processing to restore it. The work presents characteristics of the texts in Arabic language, shows complexity of the problems of recognition of such texts caused by the presence of diacritic marks and different manners of writing the letters depending on their place in the word (in the beginning, in the middle or in the end) or in the sentence separately, by difference in the style of writing, and proposes a method of recognition of the signs that join together or become imposed on each other. Mathematical problems of preliminary processing of distorted by smearing or unsharpness images have been considered to resolve the problem of restoration. It has been shown that the problem of reconstruction of a distorted image boils down to the solving of appropriate first-order Fredholm equation solved by the method of regularization according to the suggested formulas. Comparison has been made of the various methods of restoration of the images, methods of compensation of edge effects when restoring images have been considered. Information system for recognition of the Arabic symbols based on Freeman sequence and on the developed methods of image improvement.
|
|
Date |
2010-04-09T09:38:56Z
2010-04-09T09:38:56Z 2008 |
|
Type |
Autoreferat
|
|
Identifier |
Імад, І. А. Методи опрацювання зображень текстів арабської абетки : автореферат дисертації кандидата технічних наук : 05.13.06 / І. А. Імад ; Національний університет "Львівська політехніка". - Л., 2008. - 18 с.
http://ena.lp.edu.ua:8080/handle/ntb/3082 |
|
Language |
ua
|
|
Publisher |
Національний університет "Львівська політехніка"
|
|