Форматы электронных книг




Электронная книга (англ. e-book, e-text) - версия книги в электронном (цифровом) виде. Такие книги можно читать с помощью компьютеров, мобильных телефонов или специализированных устройств.

Чтобы оценить преимущества и недостатки того или иного формата, необходимо сформулировать свод требований к электронным книгам.

Читабельность. Легкость и удобство чтения текста. Поскольку это обеспечивают программные и аппаратные средства для чтения, от самого формата требуются несколько иные качества, а именно два нижеследующих:

Полиграфичность. Возможность отформатировать текст, выделить заголовки, вставить иллюстрации, содержание и. т.д. То есть, приблизиться к бумажным изданиям.

Масштабируемость. Возможность читать e-book при разных разрешениях экрана и размерах рабочего окна.

Кроссплатформенность. Электронная книга в идеале должна одинаково легко читаться на различных устройствах — от специализированного ридера до персонального компьютера.

Конвертируемость. Очень важный параметр, учитывая постоянно меняющиеся стандарты.

Гипертекст. Тоже весьма существенный для e-book параметр. Возможность мгновенно перейти в нужное место книги, щелкнув по ссылке.

Возможность редактирования. Не обязательно, но желательно. Иногда достаточно возможности делать закладки и пометки на полях.

PDF (Portable Document Format) это переносимый формат документов, созданный Adobe как средство межплатформенного обмена данными. Хотя существует масса способов передать документ, например, между Windows и Mac OS, Adobe PDF предлагает наиболее элегантное решение. Формат не накладывает никаких ограничений на внешний вид документа — текст, векторная и растровая графика могут быть объединены произвольным образом. Реализуется принцип «все мое ношу с собой» — для просмотра PDF-файла не нужно ничего, кроме самого файла и бесплатной программы Acrobat Reader.PDF создавался как формат электронного документа. Необходимость быстрого перемещения по страницам и объектам документа обусловила иерархическую структуру данных PDF. В начале файла находится оглавление, показывающее где и какие объекты расположены в файле, затем идут сами данные. Для того, чтобы что-либо делать с PDF-файлом, его нужно иметь целиком, поскольку фрагмент данных, который понадобится первым, может находиться в любой части файла — в том числе и в самом конце. Для документов с явным преобладанием текста и векторной графики формат PDF, как правило, обеспечивает заметное сокращение объема файла (с соответствующим сокращением времени пересылки по сети и т. д.).

Простейшим способом создания PDF-документов является их печать из выбранного приложения (к примеру MS-Word) на виртуальный принтерный порт Adobe Acrobat Distiller. Откроем файл в MS-Word, который мы желаем сконвертировать в PDF и из меню Файл выберем пункт Печать. В отобразившемся окне параметров печати выберем из установленных в системе принтеров Acrobat Distiller, и кликнув мышью на кнопке Свойства отобразим окно параметров преобразования. В этом окне выберем закладку настройка Adobe PDF и рассмотрим ее более подробно. В нижней части закладки перечислены общие параметры сохранения PDF-файла. Из них наиболее важным является внедрение шрифтов в создаваемый PDF-документ. При установленной галочке шрифты не внедряются, если вы желаете, чтобы созданный вами файл просматривался на всех компьютерах, вам необходимо убрать галочку с этого параметра, пусть это даже увеличит размер результирующего файла. Выше располагается блок параметров преобразования документа. Качество, размер и набор шрифтов в документе устанавливаются здесь. Вы можете либо выбрать один из предустановленных параметров, или создать свой, соответствующий вашим требованиям к качеству результирующего PDF-документа. Предустановленных параметров четыре:

1. eBook - низкое качество, для публикации в Internet

2. Press - самое высокое качество, для публикации.

3. Print - высокое качество, оптимизировано для печати на принтер.

4. Screen - самое низкое качество, оптимизировано для отображения на экране.

Свой тип параметра преобразования можно создать выбрав один из предустановленных параметров и отредактировав его составляющие. Нажав на кнопку "Редактировать настройки преобразования" мы попадем в окно редактирования настроек преобразования, которые сгруппированы в пять закладок, из которых наиболее важными являются первые три.

Закладка "Главное" - устанавливает версию PDF-документа. Важным параметром является оптическое разрешение документа определяемое как и при сканировании в dpi (количестве точек на дюйм). Документ с меньшим оптическим разрешением будет занимать меньше места, в то время как документ с большим будет более качественным. Последним важным пунктом в этой закладке является размер страницы документа, на который следует обратить особенное внимание если документ предназначен для печати. Размер страницы можно указывать в точках, пикселях, дюймах и сантиметрах.

Закладка "Компрессия" - определяет параметры сжатия изображений, которые включает преобразуемый документ. Параметры сжатия отдельно устанавливаются для цветных, черно-белых и монохромных изображений. Для каждого из типов изображений можно установить: тип масштабирования (наиболее оптимальный бикубический), разрешение в dpi, метод сжатия (Jpeg и Zip для цветных и черно-белых документов, CCITT или Zip для монохромных изображений) и качество сжатия (а для монохромных изображений еще и параметры сглаживания).

Закладка "Шрифты" - очень важна для тех, кто создает русскоязычные PDF-документы. Здесь определяется перечень шрифтов, вставляемых в документ. Вам необходимо указать здесь все шрифты, которые вы использовали при создании документа.

Когда мы установили все параметры преобразования документа, в окне печать кликнем на Ok для запуска преобразования. В панели задач отобразится пиктограмма принтера, как при выводе документов на печать и пиктограмма Adobe Acrobat. Поле завершения процесса преобразования созданный документ отобразится в Adobe Acrobat (если мы оставили галочку напротив "Просмотреть результат в Adobe Acrobat" включенной).

Полиграфичность. Абсолютная.

Масштабируемость. Низкая! На портативных устройствах читать PDF проблематично.

Кроссплатформенность. Cредняя.

Гипертекст. Есть.

Возможность редактирования. Низкая. К тому же, для этого нужно устанавливать громоздкий Adobe Acrobat.

DjVu (дежа-вю) - графический формат, разработанный фирмой AT&T, оптимизированный для хранения отсканированных документов. Особое значение этот формат приобретает для переноса в сеть математической и вообще технической литератуы, где обилие схем и формул делает распознавание и перевод в текстовый формат практически невыполнимым.. В настоящее время DjVu становится фактическим стандартом для электронных библиотек технической и научной литературы. Отныне существует компромисный вариант - перевод отсканированных картинок в формат DjVu (дежа-вю). При этом текст и контрастные рисунки сохраняются с разрешением 300dpi, все остальное считается фоном и сохраняется с пониженным разрешением. Это позволяет хорошо сжать электронный документ без потери его читаемости. Размер файла отсканированной книги оказывается в пределах нескольких мегабайт, что вполне приемлемо. Технология DjVu обеспечивает для файлов с черно-белыми монохромными изображениями сжатие порядка 500:1. Выигрыш в размере файла по сравнению с форматом GIF составляет в среднем 20 раз. Суть технологии DjVu заключается в автоматическом разбиении изображения на несколько участков (например, текст, логотип фирмы и растровая фотография), для каждого из которых выбирается оптимальный для данного графического образа алгоритм сжатия. Право на коммерческое использование технологии DjVu продано компании LizardTech.

CHM (Compiled HTML) Изначально формат CHM был создан для формирования удобной и функциональной справочной системы к программам Windows. Этот формат часто используется не только для создания хелп-систем к ПО, но и для издания книг в электронном виде. Самой сильной стороной этого формата является наличие в CHM файлах полнотекстового поиска. Вкратце файл CHM —это набор скомпилированных HTML-файлов, т. е., другим языком, что-то вроде архива из Web-страниц. И действует CHM-файл по принципу архива, сжимает данные, хранящиеся в нем, но не все, а только текстовые или содержащие текст, отформатированный с помощью тегов HTML (HTML, TXT, CSS и файлы других форматов).

*.TXT

Текст. Простая последовательность восьмибитных (как правило) кодов, каждый из которых соответствует либо символу, либо управляющему коду. Отличается лишь кодировкой и способом перевода строки.

Противоречивый формат. С одной стороны, он не поддерживает оформление текста, а с другой — нет такой платформы, на которой txt-файл нельзя было бы прочесть.

Полиграфичность. Низкая. Набор средств разметки у текста весьма невелик. Форматирование абзацев, отступы и выделение заглавными буквами.

Масштабируемость. Все зависит, от того, как сформатирован текст. Если он аккуратно отформатирован по абзацам с выравниванием, то очень низкая. Если же разбиения на строки нет — «один абзац — одна строка» — тогда масштабируемость высокая.

Кроссплатформенность. Практически абсолютная.

Конвертируемость. Практически абсолютная.

Гипертекст. Нет.

Возможность редактирования. Абсолютная.

*.RTF- расширенный текстовый формат (англ. Rich Text Format, RTF) - межплатформенный формат хранения размеченных текстовых документов

Этот формат был специально разработан компанией Micro$oft в 1987 году для переноса текста с разметкой из одной программы в другую. В таком качестве он используется и по сей день. RTF понимают практически все современные текстовые редакторы и издательские системы.

Полиграфичность. Выше среднего.

Масштабируемость. Почти абсолютная.

Кроссплатформенность. Очень высокая.

Конвертируемость. Очень высокая.

Гипертекст. Нет.

Возможность редактирования. Абсолютная.

RTF до сих пор широко используется в русскоязычных онлайн-библиотеках. Главным образом, именно из-за его хорошей совместимости с различным программным обеспечением.

 

*.DOC, DOCX - документ Micro$oft Word

Формат DOC — это внутренний формат Micro$oft Word и предназначен для хранения текстовых документов, подготовленных в этой программе. Распространенность Micro$oft Office и Micro$oft Word как его части, обусловила широкое распространение формата DOC.

Полиграфичность. Высокая.

Масштабируемость. Высокая.

Кроссплатформенность. Ниже среднего.

Конвертируемость. Высокая.

Гипертекст. Присутствует.

Возможность редактирования. Абсолютная.

 

*.HTML (.HTM;.CHM;.MHT)

Язык HTML (HyperText Markup Language) используется для отображения информации в сети Интернет.

Полиграфичность. Высокая.

Масштабируемость. Очень высокая.

Кроссплатформенность. Практически абсолютная.

Конвертируемость. Практически абсолютная.

Гипертекст. Разумеется, есть.

Возможность редактирования. Абсолютная.

Хотя НTML позволяет неплохо оформить текстовый документ, он все же не слишком подходит для e-book. Далеко не всем нравится читать книги в браузере. При использовании же программы-ридера, HTML конвертируется в обычный текст и теряет все свои преимущества.

 

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2021-06-09 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: