Системы оптического распознавания документов.




Задания по ОУД.09.Информатика для группы Б-11 от 6 апреля 2020

 

Тема занятия "Программы-переводчики. Возможности систем распознавания текстов. Гипертекстовое представление информации"

Задание для обучающихся:

1. Прочитайте материал занятия, последовательно выполняя задания.

2. Работу прислать в виде одного файла с именем "Фамилия_Б-11_6апреля" преподавателю в ЛИЧНОМ СООБЩЕНИИ в ВК.

3. Срок сдачи работы: 6–8 апреля 2020 г. Работы, представленные на проверку позже указанного срока, оцениваются на 1 балл ниже.

Проверьте правильность оформления документа.

5. Критерии оценки:

оценка «5» ставится, если:

- работа выполнена полностью и получен верный ответ или иное требуемое представление результата работы;

оценка «4» ставится, если:

- работа выполнена полностью, но при выполнении обнаружилось недостаточное владение навыками работы с ПК в рамках поставленной задачи;

- правильно выполнена большая часть работы (свыше 85 %), допущено не более трех ошибок;

- работа выполнена полностью, но использованы наименее оптимальные подходы к решению поставленной задачи.

оценка «3» ставится, если:

- работа выполнена не полностью, допущено более трех ошибок, но обучающийся владеет основными навыками работы на ПК, требуемыми для решения поставленной задачи.

оценка «2» ставится, если:

- допущены существенные ошибки, показавшие, что обучающийся не владеет обязательными знаниями, умениями и навыками работы на ПК или значительная часть работы выполнена не самостоятельно.

6. При возникновении затруднений можно написать преподавателю ЛИЧНОЕ СООБЩЕНИЕ в ВК.

 

Задание 1. Внимательно прочитайте учебный материал по теме занятия.

Компьютерные словари и системы машинного перевода текстов.

В настоящее время существуют тысячи словарей для перевода между сотнями языков (англо-русский, немецко-французский и другие), причем каждый из них может содержать десятки тысяч слов.

В бумажном варианте словарь – это толстая книга с большим количеством страниц, поиск в нем довольно трудоемкий процесс.

Компьютерные словари (например, Lingvo, «Контекст») тоже содержат перевод слов, но они предоставляют дополнительные возможности.

· Компьютерные словари в основном являются многоязычными, то есть дают пользователю возможность выбрать языки и направление перевода (например, англо-русский, испано-русский и другие).

· Кроме основного словаря общеупотребительных слов, часто они содержат десятки специализированных словарей по областям знаний (техника, медицина, информатика и другие).

· Они обеспечивают быстрый поиск словарных статей: «быстрый набор», когда в процессе набора слова возникает список похожих слов; доступ к часто используемым словам по закладкам; возможность ввода словосочетаний.

· Некоторые компьютерные словари предоставляют пользователю возможность прослушивания слов в исполнении дикторов, носителей языка, то есть являются мультимедийными.

Кроме того, существуют системы машинного перевода, позволяющие переводить не только отдельные слова и словосочетания, но и целый документ (текст) с высокой скоростью, и Web-страницу в режиме реального времени.

Лучшими среди российских систем машинного перевода считаются PROMT и «Сократ».

Системы машинного перевода осуществляют перевод текстов, основываясь на формальном «знании» языка (синтаксиса языка – правил построения предложений, правил словообразования) и использовании словарей. Программа-переводчик сначала анализирует текст на одном языке, а затем конструирует этот текст на другом языке.

Современные системы машинного перевода используются для перевода технической документации, деловой переписки и других специализированных текстов, но они неприменимы для перевода художественной литературы, так как им недоступны аллегории, метафоры и другие элементы художественного творчества человека.

 

Системы оптического распознавания документов.

Переход от бумажного документа к электронному состоит из двух этапов.

1. Сканирование. С помощью сканера получается изображение страницы текста в графическом файле.

2. Распознавание текста. Для преобразования элементов графического изображения в последовательности символов используются системы оптического распознавания символов.

Запустив такую систему, сначала надо распознать структуру размещения текста на странице: выделить колонки, таблицы, изображения и так далее. Далее текстовые фрагменты графического изображения страницы преобразовываются в текст.

Существует два метода распознавания:



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2020-12-08 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: