Системы оптического распознавания текстов




Системы оптического распознавания текстов (Optical Character Recognition System) предназначены для распознавания текстов, содержащихся в графических файлах различных форматов (BMP, GIF, TIF, PCX и т.д.), а также текстов, считываемых с помощью сканера.

Наиболее известными и часто используемыми программами оптического распознавания текста являются программы FineReader (ABBYY Software House (BIT Software, Inc)) и CuneiForm(Cognitive Enterprises LLC и Cognitive Technologies Ltd).

Системы распознавания текста различаются наличием и уровнем предоставляемых дополнительных услуг, скоростью и качеством распознавания текста, а также возможностью организации взаимодействия и интеграции с другими программами (в частности, с текстовыми редакторами).

Системы оптического распознавания символов (Optical Character Recognition, OCR) служат для автоматизации ввода печатной информации в компьютер посредством сканера.

С помощью сканера возможно получить изображение входного документа. Но это будет лишь изображение – его можно просмотреть и, возможно, отпечатать, но воспользоваться содержащимся в нём текстом или внести в него какие-либо изменения нельзя. Редактирование такого документа возможно только с помощью графических редакторов, которые не обладают удобными средствами для работы с текстом.

Для преобразования изображения в текстовый документ созданы специальные программы (OCR). С их помощью компьютер как бы учится «читать» документ. Полученный документ можно с лёгкостью редактировать, форматировать и использовать, как и любой текстовый документ, подготовленный с помощью текстового редактора.

Электронные презентации

В последние годы значительно возросло количество выступлений с использованием переносных компьютеров, расширяющих возможности докладчиков с точки зрения наглядной демонстрации излагаемого материала во время выставки-ярмарки или конференции, а также при подготовке Web‑страниц. Использование средств, реализованных на основе мультимедиа-технологий, позволяющих в одном документе совместить текст, графику и звуковое сопровождение, организовать просмотр рекламных или демонстрационных роликов, работу пользователя-«читателя» или «зрителя» в интерактивном (диалоговом) режиме, обеспечивает более выигрышную форму подачи материала.

Электронная презентация – это электронный документ, совокупность данных, предназначенных для восприятия человеком с помощью соответствующих программных и аппаратных средств. Такой документ может включать текстовую, графическую и звуковую информацию, иметь нелинейную структуру (пользователь может сам определять порядок просмотра информации, переключаться с просмотра одной части документа на просмотр другой по установленным в документе ссылкам) и включать средства организации диалога с пользователем. Различные пользователи могут просматривать его в различной форме. Такой документ создается на основе средств мультимедиа.

Электронные презентации могут создаваться в различных форматах с помощью различных инструментальных средств (на основе HTML, например). Размещаться для просмотра презентации могут как на автономно работающих компьютерах, так и в сети.

Одной из наиболее известных специализированных систем для разработки электронных презентаций является программа Microsoft PowerPoint, входящая в состав пакета Microsoft Office. Данная программа создает презентации в форме слайд-фильмов, записываемых в файл с расширением PPT.

Назначение пакета MS PowerPointсостоит в том, чтобы помочь пользователю создать и отредактировать качественную презентацию (слайд–фильм) с информационными и рекламными целями, которую можно сопровождать аудио– и видеоматериалами, подготовить раздаточный материал, рассчитанный на определенную зрительскую аудиторию. Программа использует элементы управления ActiveX, позволяющие в ходе демонстрации создать слайд ответа, в который зрители смогут вводить свои имена и адреса для получения каких–либо дополнительных сведений.

Графические редакторы

Машинная графика – это отрасль информатики, определяемая как наука о математическом моделировании геометрических форм и облика объектов и методов их визуализации.

Интерес к синтезу изображений объясняется их высокой информативностью. Информация, содержащаяся в изображении, представлена в наиболее концентрированной форме (изображение может включать рисунки, текст), доступна для восприятия.

Для синтеза графических изображений разрабатываются специализированные пакеты программного обеспечения машинной графики, которые позволяют программными средствами формировать различные изображения.

Первоначально с помощью графических программ формировались только различные диаграммы, графики, планы, схемы и т.п. Такие изображения представляют собой графические представления числовой, табличной информации, результаты инженерных расчетов.

В настоящее время такие изображения часто внедряются в создаваемые документы в качестве иллюстративных материалов, повышающих степень восприятия материала.

С появлением специализированных графических программ для ПК машинная графика стала инструментом не только инженеров, но и специалистов многих других областей, не связанных ни с техникой, ни с программированием.

Способы представления графической информации и форматы графических файлов коротко рассматривались выше.

Быстрое развитие средств ВТ, функциональных возможностей компьютеров создало базу для развития систем машинной графики, обеспечивающих отображение динамических сюжетов, в которых изображения последовательно сменяют друг друга. Особенно широкое распространение в этом классе программного обеспечения получили системы получения двухмерных и трехмерных изображений для телевидения и кино (рекламы и мультипликации).

Пакеты, предназначенные для создания высококачественных изображений трехмерных реалистических сцен и анимации, основаны на использовании соответствующих методов построения реалистических изображений, удаления невидимых частей, геометрического моделирования. Эти программы требуют значительных вычислительных ресурсов. Наиболее распространенным пакетом, рассчитанным на ПК, является программа 3D Studio фирмы AutoDesc Inc.

В интегрированные пакеты офисного назначения включаются также собственные средства работы с графикой. Например, при установке Microsoft Office можно установить программуMicrosoft PhotoEditor, пакет деловой графики Microsoft Visio.

Правовые системы

Одним из быстро развивающихся направлений в области информационных технологий у нас в стране являются справочные правовые системы (СПС), позволившие всем желающим получить свободный доступ к правовым документам.

Компьютерная справочная правовая система – это программный комплекс, включающий в себя массив правовой информации и программные инструменты, позволяющие пользователю производить поиск конкретных документов или их фрагментов, формировать подборки необходимых документов и выводить их на бумажные носители.

СПС решают проблему открытости и доступности правовой информации, следовательно, являются одним из важнейших элементов информационного обеспечения жизни современного демократического общества.

Правовую информацию определим как массив правовых актов и тесно связанных с ними справочных, нормативно-технических и научных материалов, охватывающих все сферы правовой деятельности.

В зависимости от источника и направленности информации выделяют официальную и неофициальную правовую информацию и информацию индивидуально-правового характера.

Официальная правовая информация – это информация, исходящая от полномочных государственных органов, имеющая юридическое значение и направленная на регулирование общественных отношений. Она подразделяется на нормативную правовую информацию (законы РФ и законы субъектов РФ, подзаконные акты, международные договоры и соглашения, внутригосударственные договоры) и иную официальную правовую информацию (ненормативные акты общего характера, акты официального разъяснения, правоприменительные акты).

Информация индивидуально-правового характера, имеющая юридическое значение, исходит не от полномочных государственных органов, а от различных субъектов права, не имеющих властных полномочий, – граждан, организаций. В этом виде информации выделяют следующие группы: договоры (сделки), жалобы, заявления, порождающие юридические последствия.

Неофициальная правовая информация (материалы и сведения о законодательстве и практике его применения) не влечет правовых последствий. К этому виду информации относят материалы подготовки, обсуждения и принятия законов, материалы статистики по правовым вопросам, образцы деловых бумаг и т.д.

Первые СПС появились во второй половине 60‑х годов в виде электронных картотек. Они давали возможность найти полные сведения о реквизитах документов, интересующих пользователя, – названии, номере, дате издания, принявшем органе и т.д. Первой электронной картотекой для компьютерного поиска юридической информации была бельгийская система CREDOC, которая не предполагала работы в диалоговом режиме. Электронные картотеки не дают возможности ознакомиться с полным текстом документов, поэтому более удобны полнотекстовые системы, которые позволяют достаточно быстро находить необходимый документ и работать далее с его текстом.

В настоящее время все экономически развитые страны имеют СПС. В США это – WRU, LEXIS, WESTLAW, JURIS, FLITE; в Великобритании – PRESTEL, POLIS, LEXIS; в Италии –ITALGUIRE; в Бельгии – CREDOS; в Германии – Система Бундестага, LEXINFORM; в Финляндии – FINLEX; во Франции – IRETIV, CEDIJ, JURISDATA, SINDONI и т.д. В России из более 150 разработанных информационных систем наиболее известны следующие СПС: КОНСУЛЬТАНТ ПЛЮС, ГАРАНТ, КОДЕКС, ЭТАЛОН, ЭНЦИКЛОПЕДИЯ РОССИЙСКОГО ПРАВА (компания АРТБ), РЕФЕРЕНТ, ЮСИС (юридическое информационное агентство «Intralex»), ЮРИДИЧЕСКИЙ МИР, ВАШЕ ПРАВО, ЮРИСКОНСУЛЬТ, 1С:КОДЕКС, 1С:ГАРАНТ, ЗАКОНОДАТЕЛЬСТВО РОССИИ и т.д.

Для получения пользователями в нужный момент всей необходимой в работе информации СПС должны обладать такими характеристиками, как полнота и достоверность правовой информации, качество ее обработки, оперативность поставки.

Любая СПС может охватить лишь часть правовой информации, так как число единиц такого вида информации очень велико. Поэтому важно разделить всю правовую информацию на отдельные базы с взаимосвязанной структурой. Подразделение информации можно провести по следующим основаниям: в соответствии с классификацией правовой информации (официальная и неофициальная); по территориальному признаку (федеральные, региональные, местные правовые акты); разбиение по тематическому признаку. Взаимосвязь баз обеспечит полноту информации. Пользователь СПС должен выбрать такую систему, которая удовлетворяла бы его основные ежедневные потребности в документах.

Не менее важна и достоверность правовой информации, т.е. ее соответствие тексту оригинала (официальному экземпляру правового акта, официальной публикации, зарегистрированному печатному изданию и т.д.), которая достигается тщательной многократной сверкой электронного документа с бумажными текстами – копиями подлинников с печатью (подписью) или с их официальными публикациями.

Также очевидна важность оперативного включения в СПС новых документов и поддержания уже имеющихся документов в соответствии с текущим законодательством (оперативная актуализация). Электронные документы должны включаться в СПС после юридической обработки, которая предполагает определение его достоверности, актуальности, нормативности, а также классификацию (рубрикацию) документа, подбор ключевых слов, выявление взаимосвязей документов, формирование перекрестных ссылок между документами, составление примечаний, справочных сведений к документу, подготовка новой редакции документа при издании официальных изменений.

Рассмотрим основные возможности СПС, которые присущи любой, находящей широкое промышленное применение программной системе, используя в качестве типичного примера системы КонсультантПлюс.

Хранение и обработка больших объемов правовой информации – основное требование, предъявляемое к СПС. Так, например, информационный правовой комплекс «КонсультантПлюс: Эксперт» на 1 января 1999 г. содержал более 80 тысяч актов, или более 250 тысяч страниц информации. Ежемесячно в систему поступает более двух тысяч актов, или более 6 тысяч страниц новой информации. Таким образом, конкурентоспособные СПС реализуются как сложные СУБД, ориентированные на работу с текстовыми полями большого размера, с развитым полнотекстовым поиском, гипертекстом.

Возможность быстрого поиска по различным основаниям: по реквизитам документов, полнотекстовый поиск, поиск по специализированным классификаторам, а также одновременное использование нескольких видов поиска.

Поиск по реквизитам документа предполагает поиск по номеру, виду документа, принявшему органу, дате принятия и т.д. Его возможно применить, если точно известны реквизиты конкретного документа.

Полнотекстовый поиск (автоматический поиск по словам из текста документа) основан на быстрых алгоритмах поиска, которые предполагают существование общего словаря, содержащего все слова из включенных документов со ссылками на источники. Кроме того, такой поиск содержит различные способы формирования поисковых запросов с помощью логических связок «и» и «или». При формировании сложных запросов дополнительно можно использовать признак близости слов. Таким образом, на любой запрос можно получить полный и точный список документов, в которых встречаются искомые слова. Недостатком такого метода поиска может быть выявление множества документов, в которых искомое слово содержится не в нужном контексте, а также могут быть не найдены те документы, где встречаются синонимы данного термина.

Поиск по специализированным классификаторам, которые разделяют на иерархические и алфавитные, предполагает разделение документов и их фрагментов по рубрикам (темам) и юридическим понятиям, расположенным в алфавитном порядке.Рубрики могут быть достаточно сложными: состоять из некоторого набора терминов и представлять собой описание определенной ситуации.

Возможность регулярного и оперативного обновления позволяет специалистам своевременно получать свежую информацию, что для правовой информации является решающим фактором.

Правовые базы также могут быть доступны через сеть Internet, так как все наиболее известные СПС представлены в этой сети своими специальными онлайновыми версиями. В Internetтакже можно найти серверы государственных органов с правовой информацией в открытом доступе, содержащие ограниченные наборы документов отдельных ведомств.

Отметим еще ряд дополнительных сервисных возможностей, закладываемых в СПС высокого уровня:

 Создание собственных постоянных подборок документов по какой-либо проблеме (папок документов).

 Расстановка закладок в тексте.

 Наличие гипертекстовых связей между документами.

 Экспорт документов в текстовый редактор Microsoft Word c возможностью конвертации текстовых таблиц в «раздвижные» таблицы редактора, готовые к заполнению.

Работа с СПС в общем случае состоит из следующей последовательности действий:

 формирование запроса на поиск интересующего пользователя набора документов;

 работа со списком документов;

 работа с текстом выбранного в списке документа.

Любой правовой документ имеет определенные идентификационные характеристики (реквизиты): название, дата принятия, вид документа и т.д. Поэтому запрос на поиск нужного документа (документов) может быть сформирован путем заполнения Карточки реквизитов, которая появляется автоматически после входа в базу данных «КонсультантПлюс: ВерсияПроф.» и является основным средством поиска документов. Поиск документов в системе основан на принципе последовательного сужения круга соответствующих запросу документов.

Для поиска конкретного документа следует ввести в карточку известные данные. Если реквизиты документа известны точно, то результатом поиска будет один требуемый документ, иначе будет сформирован список документов, удовлетворяющих запросу. Для поиска информации по определенному вопросу следует начать с максимально широкого запроса и использовать тематический поиск (начиная с рубрик верхнего уровня), затем продолжить поиск по словам и словосочетаниям, входящим в текст документа, а также поиск по ключевым словам. При поиске по тексту документа следует обязательно использовать возможные синонимы, задавать условие близости слов, делать перестановку слов в словосочетаниях.

В том случае, когда требуется найти документы по некоторому кругу вопросов или же когда реквизиты нужного документа неизвестны, для поиска возможно использование полей «Тематика», «Текст документа», «Ключевые слова».

Работа со списком документов возможна только после формирования запроса и его выполнения в отдельном окне, которое называется «Текущая папка». Каждый документ представлен следующей информацией: вид документа, принявший орган, дата принятия, регистрационный номер, название документа, наличие или отсутствие текста документа, объем документа в килобайтах (одна печатная страница текста имеет объем примерно 4 Кб), статус документа (недействующая редакция, утратил силу, все остальные), представленный в виде пиктограмм и записей. Таким образом, это окно позволяет провести дополнительную сортировку документов по его реквизитам, а также дает возможность просмотреть тексты документов в отдельном окне без выхода из списка документов. Также КонсультантПлюс предоставляет возможность создания тематических подборок документов в специальные папки.

Учетные системы

Бухгалтерский учет – это информационная технология, которая отображает движение средств и их источников. Целью бухгалтерского учета является выявление финансового результата – прибыли предприятия – путем подсчета его доходов и расходов за определенный период (месяц, квартал, год). Прибыль рассчитывается как разница между доходами и расходами. Основными функциями бухгалтерского учета являются контроль движения средств и их источников с целью обеспечения их сохранности и предоставление достоверной отчетности государственной налоговой службе и другим организациям, получающим отчетность. Поэтому любому предприятию необходимо в первую очередь решать учетные задачи, необходимые также и для оперативного планирования и управления.

На рынке программных продуктов предлагается большое число различных бухгалтерских программ, программ по статистике, налоговому планированию и т.д. Наиболее известные среди них 1С, Инфо-Бухгалтер, Инфин, Гобсек, Финмастер, Бест, Русский стиль, Янус, Турбо-Бухгалтер, Мини-Бухгалтер и др.

Кроме комплексных бухгалтерских программ, распространены прикладные пакеты программ, выполняющие отдельные функции учета: Платежные поручения, Касса, Склад, Зарплата, Учет и т.п.

Практически все бухгалтерские приложения предназначены для решения следующего вида учетных задач: ввод начальных данных учета, ввод новой информации и сведений об изменении имеющейся, обработка и трансформация данных, вывод результатов.

Основные требования, предъявляемые пользователями к бухгалтерским программам: доступность для своего круга пользователей, возможность внесения изменений в прошлые данные, возможность автоматического перерасчета при внесении изменений, возможность построения разного вида отчетов и их изменения в соответствии с законодательством, отсутствие дублирования ввода первичных документов.

В каждом известном бухгалтерском пакете имеется модуль генерации отчетов, который связывает расчетные или контекстные данные с соответствующими полями бланков установленного образца.

Рассмотрим основные возможности и принципы работы таких пакетов на примере программной системы (ПС) 1С:Предприятие.

ПС позволяет вести бухгалтерский учет в соответствии с текущим законодательством Российской Федерации; оперативный учет наличия и движения средств, состояния взаиморасчетов с контрагентами; расчет заработной платы, учет перемещений сотрудников предприятия; регистрацию изменений кадровых и расчетных данных сотрудников.

Бухгалтерский учет, реализованный в системе с использованием функциональных возможностей компоненты «Бухгалтерский учет», реализует стандартную методологию учета для хозрасчетных организаций в соответствии с текущим законодательством Российской Федерации.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-07-22 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: