Оцифровка документов и создание электронного архива




Несмотря на кажущуюся простоту, создание цифровых копий документов – это комплексный и технически сложный процесс, который зависит от типа документного комплекса вашей организации, его характерных особенностей. Цели и задачи, которые ставит перед собой ваша организация, лягут в основу принципов отбора документов для оцифровки. Это может быть создание рабочего фонда документов для их интенсивного использования, фонда хранения, создание поисковой системы или создание полнофункционального электронного архива.

Создание электронного архива – это работа, которая включает индивидуальный подход к документальным материалам заказчика, постановку задачи, выбор средств для ее реализации и определенную последовательность специальных процедур. Работы ведутся в несколько этапов: некоторые из них обязательны применительно к любым целям оцифровки, другие же опциональны и используются лишь при ограниченном круге задач.

Параметры сканирования и сохранения результатов

Сколько dpi?

При сканировании документов важно правильно выбрать технические параметры для того, чтобы получить наиболее качественный результат. Руководствуясь рекомендациями Национального архива США, при сканировании документов использует разрешение 300 dpi (точек на дюйм). Такое разрешение позволяет получить копию высокого качества, при последующей печати которой будет полностью сохранена вся информация подлинника. В отдельных случаях при сканировании документов сложной структуры и для их последующего распознавания оправдано сканирование с более высоким разрешением.

Формат tiff или PDF?

Для получения копий, полностью сохраняющих информацию, качество и внешние особенности подлинника в международной практике обычно применяется формат tif (англ. Tagged Image File Format) — формат хранения растровых графических изображений). Документы, сохраненные в файлах такого формата, используют как для постоянного обращения, так и для долговременного архивного хранения. Однако у них есть один недостаток – они довольно объемны и при оцифровке больших массивов требуют значительного пространства на хранящим их носителе. По этой же причине такие файлы не очень удобны при передаче данных с использованием сетей.

Если вы предполагаете постоянное обращение к цифровым копиям, включающее многопользовательский режим, частую пересылку и печать документов, то возможно для вашей организации предпочтительнее хранить массив в файлах формата pdf (англ. Portable Document Format — переносимый формат документов). Особой популярностью сегодня пользуются так называемые двухслойные документы pdf, в которых на одной странице находятся одновременно и отсканированный вариант страницы, и распознанный, что позволяет даже использовать контекстный поиск по отсканированным изображениям. Зачастую предпочитают иметь свои документы в обоих вариантах. Tif – для хранения документов и печати тех из них, что требуют высокого качества копии; и pdf – для интенсивного офисного использования.

3.3. Запустите программу Fine Reader.

3.4. Отсканируйте тексты из Приложения:

– текст обычный

– текст с рисунком

– текст, разбитый на несколько колонок

– сведения в табличном виде

3.5. Отсегментируйте и распознайте отсканированные данные.

3.6. Проверьте орфографию распознанных данных.

3.7. Скопируйте и сохраните данные в Word.

3.8. Сохраните отсканированные документы в своей папке.

3.9. Напечатайте отчет о выполненной практической работе.

3.10. Сохраните полученный документ под названием Отчет к работе 15.

3.11. Распечатайте полученные документы.

3.12. Сделайте вывод.

4. Отчет должен содержать:

4.1.Цель работы.

4.2.Перечень оборудования.

4.3.Распечатки документов.

4.4.Вывод.

 

5. Контрольные вопросы:

5.1. Перечислите основные элементы окна программы Fine Reader.

5.2. Из каких основных этапов состоит процесс сканирования?

5.3. Какой стороной нужно помещать “оригинал” в сканер?

5.4. Какие типы распознаваемых блоков вы знаете?

5.5. Как распознать только часть текста сканируемого документа?

5.6. Назначение и сфера применения программ OCR.

5.7. Что такое “разрешение”, в каких единицах оно измеряется?

5.8. Какие типы сканеров Вы знаете?

5.9. Можно ли распознать фотографию текста, записанную в виде файла?

5.10. С каким разрешением лучше сканировать большую фотографию, которую в дальнейшем нужно показать на экране компьютера?

5.11. Зачем нужны программы распознавания текста?

5.12. Как происходит распознавание текста?

5.13. Какие программы распознания текста вы знаете? Какими пользовались?

 


 

Приложение

 

“Если подарить человеку одну рыбу — он будет сыт один день, если подарить две рыбы — он будет сыт два дня, если же научить его ловить рыбу — он будет сыт всю жизнь”.

Японская пословица

 

В условиях коренных изменений, происходящих в настоящее время в нашем обществе и системе высшего образования, резко возрастает роль и значение самостоятельной работы студентов в вузе. Проблема организации самостоятельной работы студентов существовала всегда и давно волнует преподавателей высшей школы, ибо глубокие прочные знания и устойчивые умения могут быть приобретены студентами только в результате самостоятельной работы. Нельзя сказать, что преподаватель только сообщает студентам определенную сумму знаний по различным курсам, а далее они сами сумеют взять из полученного ими все необходимое. Знать — это значит уметь применять знания, которые должны быть активными, развивающимися, говорил еще В.А.Сухомлинский. При таком подходе знания студентов не являются конечной целью, а служат лишь средством для их дальнейшего развития.

Проблема интенсификации учебного процесса за счет уменьшения рутинной работы студентов неоднократно ставилась нами в различных публикациях. В данной работе мы рассмотрим лишь одно из направлений возможной оптимизации самостоятельной работы студентов, а именно организацию информационной подготовки студентов в библиотеке вуза.

Самостоятельная работа студента может быть двух видов: организуемая преподавателем и самостоятельная работа без непосредственного контроля преподавателя (подготовка к практическим занятиям, зачетам, написание рефератов, курсовых, дипломных работ и др.). И та и другая предполагают использование ресурсов библиотек для получения дополнительных сведений по изучаемым курсам. Часто руководство самостоятельной работой студентов сводится лишь к тому, что преподаватели дают студенту лишь тему для дальнейшей их самостоятельной работы. И выбор оптимального получения информации зависит непосредственно от студента. От умения ориентироваться в информационном пространстве современной библиотеки с ее информационными ресурсами, представленными как в традиционном виде, так и на современных электронных носителях зависит эффективность его самостоятельной работы, а также количество времени, затрачиваемое на поиск необходимой информации.

 

Потрясающая Грейс

 

Всегда проще попросить прощения потом,

чем просить разрешения вначале.

Малютка Грейс

 

Когда я поближе познакомился с историей жизни контр-адмирала ВМФ США, “матери компьютера”, “бабушки КОБОЛа”, “королевы программного обеспечения”, несравненной Грейс Брюстер Мюррей Хоппер, мне оставалось лишь удивляться тому, что никто из наших внимательных читателей до сих пор не потребовал от меня подробнейшего жизнеописания этой потрясающей женщины. Вне всяких сомнений сия особа заслуживает здоровенного нерушимого изваяния на компьютерном Олимпе, рядом с которым, как средство борьбы с чрезмерной пафосностью, будет соседствовать малюсенький монументик вредоносному насекомому, ибо, согласно легенде, именно старушка Грейс засушила первого компьютерного жука (более известного под ковбойской кличкой - Bug).

 

Грейс закончила колледж в 1928 году. В дипломе значилось “бакалавр“. в декабре 1943 приняла военную присягу. Она не попала на фронт. После ускоренных кратких курсов в военно-морской академии новоиспечённый младший лейтенант Грейс Мюррей Хоппер была прикомандирована к Интендантскому управлению ВМФ, а первым местом её службы стало Бюро артиллерийских вычислительных проектов при Гарвардском университете. Грейс была принята на работу в качестве первого программиста знаменитой электромеханической вычислительной машины Марк I (свыше ста кубометров сверкающего металла). Эта штука являла собой чудо инженерной мысли, производившее до трёх арифметических действий в секунду и имевшее целых 72 байта оперативки. Профессор (лейтенант) Грейс Хоппер попала в команду профессора (старшего лейтенанта) Говарда Эйкена. Всё складывалось как нельзя лучше, её ждали, в ней нуждались, она была на своём месте.

 


 

 





Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2019-04-30 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: