Системы распознания текста и ввода данных




 

Говоря о системах распознания текста, главным образом выделяют лидера в данном направлении – компанию ABBYY.

Интеллектуальная система оптического распознавания ABBYY FineReader 9.0 позволяет быстро и точно переводить бумажные документы, цифровые фотографии документов и PDF-файлы в электронный вид. При распознавании ABBYY FineReader полностью сохраняет оформление документа: иллюстрации, картинки, списки и т. д. Полученные результаты можно исправлять в программах Microsoft Office, сохранять в разных форматах, отправлять по электронной почте и публиковать в интернете.

 

 

ABBYY FineReader представляет революционно новый подход к распознаванию документов. Теперь документ анализируется и обрабатывается целиком, а не постранично, что позволяет FineReader понять такие элементы его внутренней структуры, как верхние и нижние колонтитулы, сноски, подписи к картинкам и диаграммам, стили, шрифты и т.д. Элементы исходного документа восстанавливаются в результирующем документе. Например, при сохранении в Word верхние и нижние колонтитулы, сноски воспроизводятся как соответствующие объекты в Word.

Система оптического распознавания ABBYY FineReader точно распознает и максимально полно сохраняет исходное оформление любого документа (в том числе с текстом на фоне картинок, с цветным текстом на цветном фоне, с обтеканием картинок текстом и т.д.)

ABBYY FineReader распознаёт документы на 179 языках, включая русский, английский, немецкий, французский, испанский, итальянский, шведский, финский, болгарский, венгерский, словацкий, чешский, башкирский, белорусский, казахский, украинский. Для 36 языков, предусмотрена проверка орфографии. Текст документа может быть составлен на двух и более языках. Пользователь может указать свой язык распознавания для каждого блока типа «текст» или для каждой ячейки таблицы.

Как известно, некоторые PDF-файлы содержат так называемый текстовый слой, причём его содержимое может не полностью соответствовать видимому на экране документу. FineReader предварительно анализирует содержимое файла и для каждого текстового блока принимает решение: распознать его или извлечь соответствующий текст из текстового слоя. Таким образом удаётся увеличить качество распознавания и сократить время обработки.

Теперь для распознавания необязательно оснащать компьютер сканером. ABBYY FineReader позволяет распознавать фотографии документов, сделанные цифровой камерой (рекомендуется использовать цифровой фотоаппарат с разрешением матрицы 4 Мпикс и выше).

Существует множество случаев, когда для получения изображения удобнее использовать фотоаппарат, нежели сканер. Например, во время деловой встречи вне офиса, при распознавании вывесок или объявлений, в библиотеке, особенно при работе с толстыми или старинными книгами. Не говоря уже о том, что цифровой фотоаппарат работает в несколько раз быстрее любого сканера.

ABBYY FineReader находит в тексте ссылки на веб-сайты, адреса электронной почты, файлы, ftp-серверы и воспроизводит их в выходных документах.

Такие документы могут быть сохранены в форматах Microsoft Word, PDF и HTML. Кроме того, в распознанный текст можно добавлять собственные гиперссылки.

При распознавании PDF-файлов, помимо внешних ссылок, восстанавливаются и внутренние (на другие страницы того же документа).

В комплект поставки системы включен ABBYY Screenshot Reader. Это простое и удобное приложение предназначено для распознавания текста с любой области экрана. ABBYY Screenshot Reader переводит в редактируемый формат такие тексты, которые нельзя скопировать обычным способом – системные сообщения, надписи во Flash-роликах и т.д. Как распознанный текст, так и снимок экрана могут быть сохранены в виде файла или переданы в буфер обмена.

ABBYY FineReader поддерживает также распознавание штрих-кодов, в том числе двухмерных типа PDF-417.

Практически каждый пользователь рано или поздно сталкивается с понятием BIOS и, как правило, возможность поработать с БИОС пугает. Все дело в том, что большинство пользователей, которые впервые сталкиваются с такой необходимостью, думают о BIOS, как о какой-то суперсистеме, которая понятна только профессионалам.

Как показывает жизненная практика, каждый пользователь, независимо от уровня подготовки должен иметь хотя бы элементарное представление о настройках BIOS.

BIOS включает в себя большой набор программ, благодаря которым операционная система и программы, могут взаимодействовать с устройствами, подключенными к компьютеру, а также со всеми внутренними компонентами.

BIOS материнской платы отвечает за инициализацию (подготовку к работе), тестирование и запуск всех ее компонентов.

При помощи базовой системы ввода-вывода (Basic Input/Output System) операционная система и прикладные программы работают с аппаратным обеспечением компьютера. Другими словами можно сказать - BIOS - это набор программ, которые переводят понятные пользователю команды Windows на язык, понятный компьютеру.

Если говорить более конкретно о системах ввода информации и распознания текста, стоит рассмотреть Windows XP Tablet PC Edition.

Microsoft сопроводила выход новой версии громким девизом: "Новая операционная система с улучшенными возможностями рукописного ввода информации, комбинированной системой безопасности и улучшенным управлением".

Начнем, пожалуй, с самой главной особенности Windows XP Tablet PC edition – системы управления вводом данных.

Данная система подверглась серьезным улучшениям с точки зрения удобства интерфейса, а также функциональной переработке. Напомним, что система ввода информации в Windows XP Tablet PC Edition поддерживает четыре различных технологии: рукописный ввод, ввод с виртуальной клавиатуры, использование клавиатуры обычной и, наконец, речевой ввод информации.

Наиболее существенной модификации подверглась система рукописного ввода. Когда курсор попадает в поле для ввода, совсем рядом, чуть ниже поля, появляется всплывающее окно с областью для ввода информации. Причем сам способ ввода информации можно варьировать, нажимая соответствующие кнопки. Безусловно, такое решение обеспечивает интуитивный и более быстрый ввод информации при помощи стилуса - не приходится переводить взгляд на окно ввода, которое в предыдущей версии располагалось всегда в нижней части рабочего стола.

Поскольку улучшенное окно ввода информации является частью операционной системы, его функциональность поддерживается в любых приложениях для Windows XP.

Однако главным коньком системы ввода информации стало мгновенное распознавание вводимых данных с возможностью представить пользователю результаты распознавания непосредственно перед вставкой их в поле ввода. Поле ввода автоматически добавляет пробелы, позволяя делать вставки отдельных слов или фраз в уже существующий текст. Пользователь может исправить уже распознанный текст, отдельные слова, буквы и цифры. С точки зрения удобства это нововведение реализовано очень удачно.

Разработчики учли даже возможность контекстных особенностей полей для ввода определенных данных. К примеру, в поле "Индекс", где содержатся только цифры, система распознавания никогда не перепутает цифру "2" с буквой "Z" или "5" с "S". Эта особенность также может быть использована в любых приложениях для Windows XP, что позволяет быстро и правильно вводить данные при помощи пера.

Стоит особенно отметить улучшенную интеграцию новой версии Windows XP TabletPC Edition с программами Microsoft Office в плане ввода и распознавания данных. Пользователю предлагается простой механизм ввода, а также возможность совмещать распознанный текст с графическими комментариями в программах семейства Microsoft Office 2003: Word 2003, Excel 2003 и, что особенно полезно, в PowerPoint 2003. Часто необходимо что-нибудь подчеркнуть в диаграмме, нарисовать тренд, подчеркнуть важную цифру. Все это теперь можно сделать в процессе создания, либо демонстрации презентации, и в дальнейшем, к примеру, отправить по электронной почте через Outlook 2003.

Однако в наибольшей степени новые возможности интеграции почувствуют на себе пользователи универсального менеджера заметок Microsoft Office OneNote 2003. Эта программа сочетает в себе возможности инструмента для хранения и редактирования текстовых и графических записей, мультимедийного контента, таблиц, и веб-контента. Все данные можно хранить в одном файле. К сожалению, Microsoft Office OneNote 2003 не входит и не будет включена в состав программ Microsoft Office, так что приобретать ее придется отдельно.

Вслед за выходом новой версии ОС разработчики получили новую платформу Windows XP Tablet PC Edition Software Development Kit 1.7, нацеленную на создание приложений с базовой поддержкой рукописного ввода и и контекстных свойств полей.

Приятным сюрпризом оказалась обновленная поддержка беспроводных устройств, в особенности, работающих через Bluetooth.

Помимо новых возможностей ввода информации, особое место в данной версии ОС занимает вопрос безопасности.

Нововведения заключаются в использовании усовершенствованной технологии безопасности - Advanced Security Technology, целью которой являются упреждающие и более консервативные меры защиты. Новшества, знакомые пользователям обычной Windows XP по второму сервис-паку, можно разделить на две главных части.

Новая версия ОС содержит ключевые обновления, закрывающие многочисленные бреши, и по умолчанию использует усиленные настройки безопасности, что позволяет более эффективно противостоять вирусным и хакерским атакам. Большую роль в этом играет встроенный брандмауэр Windows Firewall, известный в предыдущей версии как Internet Connection Firewall. Windows Firewall включен по умолчанию для всех без исключений программ и служб, что позволяет легко разобраться с межсетевой инфраструктурой и контролировать входящий и исходящий трафик. Важной особенностью Windows Firewall является то, что он обеспечивает защиту даже во время загрузки и завершения работы компьютера.

Улучшенная управляемость и контроль создает неоспоримые преимущества для простого конфигурирования и управления ресурсами безопасности. Появившийся в Панели управления новый комопнент Windows Security Center обеспечивает мониторинг работы Windows Firewall, службы автоматических обновлений, а также осуществляет контроль за антивирусным программным обеспечением. Это позволяет вовремя предоставить пользователю информацию о необходимых шагах для улучшения эффективности системы безопасности.

Новшества в системе автоматического обновления позволяют автоматически, в зависимости от скорости соединения с сайтом Windows Update, ранжировать и загружать критические обновления, ликвидирующие дыры, представляющие серьезную угрозу безопасности.

В заключении, хочется отметить более устойчивую работу компьютера, причем все программы сохранили свою функциональность (перечень протестированных программ можно уточнить у автора статьи).

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2020-03-31 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: