Форматы данных, используемые при подготовке электронных документов.




Формат электронного документа – это, более точно, формат файла, в котором содержится текстовая и/или аудиовизуальная информация в закодированном виде. «Закодированный» не следует путать с понятием «зашифрованный». Шифрование относится к средствам скрытия информации, а кодирование – лишь преобразование информации из одной формы в другую.

Если проанализировать современные словари компьютерных технологий, то понятие «формат» многообразно и сложно. Для пользователя достаточно знать, что формат электронного документа – это некая определенная логика или алгоритм, следуя которым информация из машиночитаемой преобразуется в понятную для человека и наоборот. Форматы могут иметь разные виды, от простых и ограниченных по возможностям до сложных и способных нести множество функций, включая возможности создания верстки, сжатия и шифрования.

В области компьютерных технологий под термином «формат» понимается структура информационного объекта. Например, форматом файла называют способ организации элементов информации (битов, байтов) в файле, а формат электронного документа определяет способ расположения и представления данных в электронном документе .

Перечислим кратко форматы электронных документов, используемые в ДОУ .

Текстовые форматы используются для создания текстов документов и чаще всего создаются при помощи текстовых процессоров.
Например:

.DOC – популярный формат электронного документа, предназначен для просмотра и изменения (редактирования) текста документа. Формат крайне удобен при одновременной работе над документом нескольких исполнителей.
.PDF – формат отображения документа в идентичном виде на любой операционной системе и в любом приложении. Популярен при составлении документов, презентационных материалов, рекламных буклетов и т. п. Ввиду того, что формат предназначен для просмотра документа и не позволяет вносить в него несанкционированно (либо незаметно) изменения, его использование в ДОУ крайне удобно. Следует отметить, что все стандарты международной организации по стандартизации (ИСО) присылаются в Ростехрегулирование именно в формате PDF.

.RTF – предназначен для просмотра документов и их редактирования в различных версиях программных продуктов. Например, версиях Word for Windows. В ДОУ формат активно используется благодаря тому, что позволяет преобразовывать файлы без потери структуры и содержательной части документа и работать с ними в одной операционной системе, но в различных ее временных версиях.
Графические форматы хранят изображение (например, фотографию, рисунок) и делятся на два основных типа: векторные форматы, которые хранят изображение как набор геометрических фигур (DXF, EPS, CGM), и растровые форматы, которые хранят изображение как набор точек-пикселей (BMP, TIFF, GIF). Сохраненное изображение можно добавить к тексту документа и использовать его при оформлении презентации.

Форматы баз данных создаются при помощи систем управления базами данных (СУБД). Они состоят из полей и таблиц, содержащих отдельные элементы информации. Про­грамма позволяет устанавливать связи между разрозненными элементами. Например, база данных о сотрудниках может содержать поля с фамилиями сотрудников, адресами и сведениями о выполняемой работе.

Файлы в формате электронных таблиц хранят в ячейках числа и взаимосвязи между этими числами. Так, одна ячейка может содержать формулу, которая суммирует данные двух других ячеек. Как и файлы баз данных, файлы электронных таблиц обычно имеют формат той программы, при помощи которой созданы. Этот формат удобен при учете рабочего времени и т. п.

Видео- и аудиоформаты содержат движущиеся изображения (цифровое видео, анимацию) и звуковые данные, которые чаше всего создаются и просматриваются при помощи соответствующих программ и хранятся в однопрограммном формате. Наиболее используемыми из них являются форматы QuickTime и MPEG. В ДОУ с их помощью можно протоколировать заседания, совещания и т.д.

Более подробно остановимся на форматах разметки, которые содержат встроенные инструкции по отображению и понятности содержания файла.

Определять язык разметки текстов электронных документов можно на метаязыке SGML (Standard Generalized Markup Language). Изначально он был разработан для совместного использования машиночитаемых документов в больших правительственных и аэрокосмических проектах. Он широко использовался в печатной и издательской сфере, но его сложность затруднила его широкое распространения для повседневного использования.

SGML был утвержден Международной организацией по стандартизации ISO в качестве международного стандарта ISO 8879:1986 «Information processing – Text and office systems – Standard Generalized Markup Language (SGML)» и используется в государственных органах многих стран мира.

От языка разметки текстов документов SGML произошли новые, более совершенные языки разметки HTML и XML.

HTML (Hypertext Markup Language – «язык разметки гипертекста») – это приложение SGML. Он используется для отображения почти всей информации в сети. Соответствует международному стандарту ISO 8879:1986 и является стандартным языком разметки документов во Всемирной паутине (www).

XML (Extensible Markup Language) – подмножество языка SGML. Получил популярность при управлении информацией и обмене ею, как относительно простой язык разметки текстов документов. XML – текстовый формат, предназначенный для хранения структурированных данных (взамен существующих файлов баз данных), для обмена информацией между программами, а также для создания на его основе более специализированных языков разметки, иногда называемых словарями.

Формат XML принят органами стандартизации интернет-сообщества в лице консорциума World Wide Web (W3C), который разрабатывает и внедряет технологические стандарты для Всемирной паутины и организации UDDI (Universal Description, Discovery and Integration), развивающей стандарт Универсального описания, обнаружения и интеграции, предназначенного для определения, регистрации и обнаружения Web-служб, предлагаемых компаниями. Это спецификация, устанавливающаяся требования к распределенному информационному регистру Web-службы .

По назначению форматы электронных документов можно условно разделить на:
–форматы для просмотра документа;
– форматы для просмотра и изменения документа;
– форматы для изменения документа.

По возможности переноса форматы электронных документов бывают:
– переносимые межплатформенно;
– переносимые межпрограммно;
– специализированные.

Как правило, четкой границы между этими категориями не бывает. Форматы, переносимые между различными платформами, могут быть и переносимыми межпрограммно. Специализированные форматы применяются в узких задачах и используются, как правило, только приложениями одной фирмы и чаще всего являются закрытыми.

По доступности форматы могут быть открытыми и закрытыми. Закрытые форматы всегда являются собственностью конкретной организации, которая использует их как для того чтобы гарантировать потребителю качество продукта, так и для защиты от заимствования технологии конкурентами.

Открытый формат – общедоступная спецификация хранения цифровых данных, свободная от лицензионных ограничений при использовании. В частности, должна быть возможность включать поддержку открытых форматов как в свободное (открытое), так и в проприетарное (собственническое, несвободное) ПО, распространяемое по лицензиям, характерным для каждого из этих типов. Главная цель открытых форматов – гарантировать возможность доступа к данным в течение долгого времени без оглядки на лицензионные права и технические спецификации. Открытый формат электронного документа защищает потребителя не только при смене версий программы, но и дает возможность читать документы в условиях недоступности программы, при помощи которой был создан электронный документ.

Чем примечателен формат XML? Расширяемый язык разметки Extensible Markup Language содержит в себе не только данные, но и «несет информа­цию, описывающую эти данные. Он применим к любому компьютерному приложению и позволяет передавать большие объемы информации без необходимости трудоемкого преобразования структур данных» .

В настоящее время производители программного обеспечения оперативно переключились на использование XML в своей продукции и, таким образом, реализуют идею стандартизации форматов документов на основе XML, по сути открытого формата электронных документов.

 

 





©2015-2017 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.

Обратная связь

ТОП 5 активных страниц!