Экспериментальное исследование разработанной системы распознавания текста




Для генерации обучающей последовательности были использованы шрифты Comic Sans MS, Liberation Mono, Freemono, Arial и Times New Roman. Символы включали в себя точку, запятую, тире, все кириллические буквы от «а» до «я» обеих регистров (исключая буквы «й», «ы» и «ё») а также латинская буква «I» (список команд к TrecS_PatternGen — в Приложении 3). Всего 320 образов.

Для генерации проверочной последовательности были использованы шрифты Courier, DejaVu Serif, Tahoma, Verdana и Impact, также 320 образов.

В результате прогона проверочной последовательности система распознала верно 233 образов из 320 (73%). Полностью неправильно были распознаны 47 образов (14%), а для оставшиеся 40 (13%) – неправильно был определён регистр символа. Неправильное определение регистра происходит из-за того, что все образы растягиваются до размеров входного слоя сети, поэтому символы, различающиеся регистром но сходные по форме, подаются на сеть в виде сходных образов.

Обзор отладочной информации указывает на то, что большая часть неправильно распознанных символов приходится на образы, набранные шрифтом Impact. Это объясняется тем, что символы этого шрифта значительно отличаются по форме от символов шрифтов, использованных для обучающей последовательности. Как и все нейросети, неокогнитрон требует хорошего покрытия обучающей последовательностью пространства входных образов для корректного обучения.

В результате проверки обучающей последовательностью из 256 образов (без шрифта Impact) система корректно распознала 223 символа (87%), некорректно распознала 1 символ (перепутала «ъ» с «ь») и некорректно определила регистр у 32 символов (13%).

В результате распознавания трёх изображений одного и того же текста, набранного тремя разными шрифтами, система дала следующие результаты:

Times New Roman:

Люблю грозу в начале Мая.

Когда весенниич первьIич гром

Как-бьI резвяся и играя

Грохочет в небе голубом.

Courier:

ЛЮблЮ грозу В начале Мая,

Когда ВесеннИИЗ перВьIиЗ гром

КаК-бьI резВяся И Играя

Грохочет В небе голубом.

Liberation Mono:

Люблю грозу в начале Мая,

Когда весеннИИ- первЬIИ- гром

Как-бЬI резвяся И Играя

ГрохочеТ в небе голубом

Наибольшее число искажений регистра показал текст, набранный шрифтом Courier, поскольку этот шрифт не участвовал в обучении. Наименьшее число искажений регистра показал текст, набранный Times New Roman, поскольку этот шрифт относится к классу Serif и обладает дополнительными характерными чертами, позволяющими правильно отличать символы разного регистра по форме.

Однако функция определения регистра не входит в число функций модуля распознавания символов вообще и неокогнитрона — в частности. Вместо этого в системе должен существовать модуль пост-обработки текста, который в том числе исправляет регистр символов, анализируя их размеры друг относительно друга.

Выводы

Разработанная система способна распознавать текст, составленный как из образов обучающей последовательности, так и из образов проверочной последовательности.

Для корректного распознавания любых форм символов требуется значительно расширить разнообразие обучающей последовательности, чтобы она покрывала всё множество входных образов.

Организационно-экономическая часть

Введение

Система оптического распознавания текста служит для автоматического преобразования содержащих текст изображений в пригодную для обработки в текстовых процессорах форму.

В данной части дипломного проекта будет проведена оценка экономической целесообразности разработки такой системы, расчет стоимости самой разработки и конечной цены программного продукта, который появится на рынке.

Описание продукта

В 1974 году Рэй Карзвейл основал компанию Kurzweil Computer Products, Inc и возглавил разработку первой шрифто-независимой системы оптического распознавания символов — компьютерной программы, способной распознавать текст, напечатанный любым нормальным шрифтом. Он решил, что лучшим применением этой технологии будет создание читающей машины для слепых, которая бы позволила слепым людям понимать напечатанный текст, слушая как его для них читает вслух компьютер. Однако для этого устройства потребовалось изобрести две технологии — сканер и речевой интезатор. Тринадцатого Января 1976 первый продукт был показан на конференции, которую возглавлял Карзвейл и лидеры Национальной Федерации Слепых США. Устройство именуемое «Читающая Машина Карзвейла» занимало весь стол, но функционировало именно так как и предполагалось. В 1978 Kurzweil Computer Products, Inc начала продавать коммерческую версию компьютерной программы для оптического распознавания символов. LexisNexis стал первым клиентом и купил программу для преобразования в цифровую форму юридических и публицистических документов. Через два года Карзвейл продал свою компанию компании Xerox, которая заинтересовалась дальнейшей коммерциализацией аналого-цифрового преобразования текста. Сейчас Kurzweil Computer Products известна как Nuance.

Целью дипломного проектирования является создание программной системы для оптического распознавания текста. Система предназначена для преобразования содержащих текст изображений в текстовую форму, которая может быть использована в текстовых процессорах.

Анализ рынка сбыта

Потенциальными клиентами моего продукта являются работники научной сферы (поскольку система представляет определённый научный интерес), любые организации, чья работа связана с использованием как бумажных, так и цифровых текстовых документов, а также простые пользователи, обладающие необходимым для сканирования текста оборудованием.

Конкурентоспособность

На рынке уже существуют подобные системы, и проблема распознавания текста успешно решается уже более 20 лет. Однако большинство предложенных систем обладает определёнными недостатками:

1) Относительно высокая цена

2) Недостаточно гибкая интеграция со сторонними приложениями (в том числе — с текстовыми процессорами)

3) Практически полное отсутствие контроля за процессом работы системы

4) Невозможность обучения системы

Недостаток 1) присущ всем коммерческим системам (к коим относятся практически все успешные системы распознавания текста). Недостаток 2) также присущ только коммерческим системам — они расчитаны на использование совместно со строго определённым набором сторонних приложений (как правило — тоже коммерческих). Недостаток 3) выражается в отсутствии механизмов управления процессом распознавания и также присущ в основном коммерческим системам из-за их закрытости. Недостаток 4) присущ большинству систем, поскольку не все системы созданы на основе технических решений, поддерживающих концепцию обучения.

Разработанная система будет лишена перечисленных недостатков.

Маркетинг

Разработанная система является кросс-платформенной, а статус СПО позволяет использовать инфраструктуру СПО для рекламы и освещения системы в прессе. Это позволит заинтересовать системой как пользователей, так и потенциальных разработчиков. Не исключается возможность участия в разработке таких корпораций как Google, которая в последнее время интересуется системами распознавания текста.

План работ

Сроки выполнения работ не должны превышать 86 дней. В проекте занят один разработчик и один Ведущий инженер. Организационная структура представляет собой вырожденный случай иерархической структуры и изображена на рис 6.1.

Такая схема взаимодействия была выбрана из опыта ранее разработанных дипломных проектов. Руководителем проекта является ведущий инженер, ответственным исполнителем — инженер-программист 3й категории.

 

6.6 Организационный план

Выделим следующие этапы разработки:

1. Техническое задание

1.1. Постановка задачи – 2 дня

1.2. Выбор и обоснование критериев эффективности и качества разрабатываемой программы – 5 дней

1.3. Предварительный выбор методов решения задачи – 10 дней

1.4. Выбор языков программирования – 1 день

2. Эскизный проект

2.1. Предварительная разработка структуры входных и выходных

данных – 5 дней

2.2. Разработка общего описания алгоритма решения задачи – 5 дней

3. Технический проект

3.1. Разработка алгоритма решения задачи – 10

3.2. Определение формы представления входных и выходных

данных – 5 дней

4. Рабочий проект

4.1. Программирование и отладка программы – 25 дней

4.2. Разработка порядка и методики испытаний – 2 дня

5. Тестирование

5.1. Итоговое тестирование программного средства – 1

5.2. Корректировка программы и программной документации по результатам испытаний – 5 дней

6. Разработка документации

6.1. Руководство системного программиста – 1 день

6.2. Руководство программиста – 1 день

6.3. Руководство пользователя – 1 день

Итого: 79 дней.

Таблица 6.1 Расчёт трудоёмкости

103

14

55

58

111

114

Этап разработки Продолж. Исполнитель Трудоёмк. ч/дн  
  Постановка задачи   Ведущий инженер    
  Выбор и обоснование критериев эффективности и качества разрабатываемой программы   Ведущий инженер    
  Предварительный выбор методов решения задачи   Ведущий инженер    
Инженер-программист 3-й кат.    
  Выбор языков программирования   Ведущий инженер    
Инженер-программист 3-й кат.    
  Предварительная разработка структуры входных и выходных данных   Ведущий инженер    
Инженер-программист 3-й кат.    
  Разработка общего описания алгоритма решения задачи   Инженер-программист 3-й кат.    
  Разработка алгоритма решения задачи   Инженер-программист 3-й кат.    
  Определение формы представления входных и выходных данных   Ведущий инженер    
Инженер-программист 3-й кат.    
  Программирование и отладка программы   Инженер-программист 3-й кат.    
  Разработка порядка и методики испытаний   Ведущий инженер    
  Итоговое тестирование программного средства   Ведущий инженер    
Инженер-программист 3-й кат.    
  Корректировка программы и программной документации по результатам испытаний   Инженер-программист 3-й кат.    
  Руководство системного программиста   Инженер-программист 3-й кат.    
  Руководство программиста   Ведущий инженер    
Инженер-программист 3-й кат.    
  Руководство пользователя   Ведущий инженер    
Итого, дней:   Итого, человек/дней:    

Представим этапы разработки в виде диаграммы Гранта на рис. 6.2.

 

 

Расчет договорной цены

Для расчета затрат и договорной цены воспользуемся постатейным калькуляционным счетом.

 

Статья 1. Материалы и покупные изделия

Для разработки мы будем использовать среду разработки Dev-C++. Этот программный продукт обойдется нам в 0 рублей.

Далее произведем расчет канцелярских принадлежностей.

Таблица 6.2 Сводная таблица материалов и покупных изделий

Наименование материала Единица измерения Кол-во Цена за единицу, руб. Сумма, руб.  
  Бумага для оргтехники, формат А4 Пачка, 500 листов        
  Бумага для оргтехники, формат А3 Пачка, 500 листов        
  Ручки шариковые Упаковка, 20 штук        
  Скобы для степлера Упаковка, 1000 штук        
  Дискета, 1.44'' Упаковка, 10 штук        
  CD-RW, Verbatim Упаковка, 10 штук        
  USB Flash Dsik, 4Gb Штука        
Итого:    

К итоговой сумме затрат прибавим 15% в качестве транспортно-заготовительных расходов:

5370 + 5370*15% = 6175,5 руб.

Итого, по первой статье имеем 6175,5 руб.

 

Статья 2. Спецоборудование

В спецоборудовании необходимости нет, поэтому по этой статье затрат не предусмотрено.

 

Статья 3. Основная заработная плата исполнителей

Для расчета заработной платы необходимо вычислить дневную заработную плату каждого сотрудника и умножить на количество дней занятости сотрудника в проекте.

 

Таблица 6.3 Затраты по заработной плате

Исполнитель Ставка, руб/месяц Трудоёмкость ч/дн Оплата за день, руб Итого  
Ведущий инженер          
Инженер-программист 3-й кат.          
      Итого:    

Итого, затраты на основную заработную плату составят 138818 рублей.

 

Статья 4. Дополнительная заработная плата

Дополнительная заработная плата работникам составляет 20% от всей статьи «Основная заработная плата», рассчитаем ее:

ДЗП = 138818 * 20% = 27763,6 руб.

Итого, на дополнительную заработную плату понадобится 27763,6 рублей.

Статья 5. Единый Социальный Налог (ЕСН)

ЕСН составляет 26% от всего фонда заработной платы.

Фонд заработной платы = Основная З/П + Дополнительная З/П

138818 + 27763,6 = 166581,6

ЕСН = 166581,6 * 26% = 43311,216

Статья 6. Оплата услуг сторонних организаций

Привлечение сторонних организаций не предусмотрено.

Статья 7. Командировки сотрудников

Командировки во время проекта не предусмотрены.

Статья 8. Накладные расходы.

Дипломный проект представляет собой НИР и накладные расходы берем из расчета 250% от основной заработной платы.

Получим:

138818 * 250% = 347045 руб.

Итого, накладные расходы составят 347045 рублей.

Таблица 6.4 Расходы по всем статьям

Статья Сумма, руб.  
  Материалы и покупные издения    
  Спецоборудование    
  Основная заработная плата    
  Дополнительная заработная плата 27763,6  
  Единый социальный налог 43311,22  
  Оплата услуг сторонних организаций    
  Командировки сотрудников    
  Накладные расходы    
  Итого, по всем статьям 562307,82  

 

Таким образом, стоимость разработки составит 562307,82 руб.

Договорная цена программного изделия равна сумме оптовой цены предприятия и налога на добавленную стоимость. Оптовая цена предприятия составляется из суммы стоимости продукта и прибыли от его продаж. Себестоимость определяется суммой расходов по всем статьям. Прибыль определяется на уровне 25% от себестоимости.

ДС = 562307,82 * 25% = 140576,955 руб.

Таким образом оптовая цена предприятия составляет:

ОЦП = 562307,82 + 140576,955 = 702884,775 руб.

Произведем расчет НДС=18%:

НДС = 140576,955 * 18% = 25303,8519

Следовательно, с учетом НДС, договорная цена составит:

702884,775 + 25303,8519 = 728188,6269

Итого, договорная цена программного изделия равна 728188,6269 рублей.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2020-03-31 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: