Перед теми, кто занимается оцифровкой изданий или набором книг непосредственно на ПК, рано или поздно встает вопрос – в каком формате – поскольку их множество – издавать электронную книгу или, соответственно, в какой формат ее импортировать из текстового.
Существует несколько групп форматов электронных книг – графические и растровые форматы. Растровые форматы представляют объект в виде множества точек, векторные – в виде простейших геометрических фигур (точки, линии, многоугольники). Таблица внизу классифицирует их именно по этому признаку.
Однако, как и любая другая, эта классификация условна. Например, PostScript (.ps, .eps), PDF могут быть чисто векторными. Так же DOC, PDF могут содержать только растровые отсканированные картинки или же наоборот – содержать только текст.
Существует также разделение форматов электронных книг на предназначенные для чтения текста он-лайн и для сохранения на компьютере пользователя. К первой группе относятся файлы такого формата, как HTML и TXT, ко второй – RTF, DjVu, PDF и проч.
Здесь вы можете узнать краткую справочную информацию о различных форматах электронных книг.
Графические растровые форматы | |
TIFF | Формат для хранения изображений с большой глубиной цвета. Чаще всего используется при сканировании, отправке факсов, распознавании текста, в полиграфии, широко поддерживается графическими приложениями. Глубина изображение делает TIFF незаменимым форматом для тех, кто занимается оцифровкой бумажных изданий, так как процесс распознавания текста упрощается во много раз. |
JPEG | Данный формат использует сильное сжатие, уровень которого можно регулировать, с потерей информации.
Применяется для хранения высококачественных изображений, позволяет использовать до 16 миллионов цветов, именно поэтому электронные книги в этом формате также имеют место – для печати он непригоден, а для демонстрации на дисплее подходит идеально. |
DjVu | Использует специальный алгоритм, позволяющий получать файлы меньшего размера при сжатии без потерь за счет технологии, разработанной специально для хранения оцифрованных документов рукописей, книг, журналов. Популярнейший формат книг в файлообменных сетях. |
Графические векторные форматы с оформлением | |
RTF | Формат, поддерживаемый большинством текстовых редакторов, созданный для документов в среде ОС Windows. обеспечивает возможность сохранения структуры текстовых документов, позволяет выделять их фрагменты (курсивом или жирным шрифтом, создавать колонки и т. п.). Книги в формате RTF доступны для скачивания во многих книгообменных сайтах. |
HTML | Стандартный язык разметки документов во Всемирной паутине. Разметка позволяет вставку спецсимволов, изменение размера, типа, начертания шрифта, создание гиперссылок и таблиц, выравнивание текста. Электронные книги в формате HTML чаще всего выставляются в полнотекстовом виде на сайте, в этом случае в скачивании на компьютер нет необходимости. |
OPF FlipBook | Открытый формат электронных книг – стандартная версия программы FlipAlbum создает альбомы-книги FlipBooks с расширением OPF (Open Electronic Book Package Format). Эти файлы могут быть просмотрены с помощью самой программы или бесплатной утилиты для работы с OPF-файлами. |
CHM | Книга – файл формата .chm (HTMLHelp). Содержит в себе набор HTML-страниц , может также включать в себя содержание со ссылками на страницы, предметный указатель, а также базу для полнотекстового поиска по содержимому страниц. Используется для создания справки в ОС Windows и, по аналогии, для создания книг, с помощью специального программного обеспечения. |
SGML | Стандартный общий язык разметки для документов. Широко используется в издательском деле – рукописи зачастую передаются в электронном SGML-структурированном виде, что значительно облегчает работу наборщиков и дизайнеров. |
XML | XML – текстовый формат, предназначенный для хранения структурированных данных, для обмена информацией между программами, а также для создания на его основе более специализированных языков разметки. XML позволяет легко создавать документы, готовые к непосредственному использованию и программной обработке (конвертации, хранению, управлению) в любой среде, поэтому на его основе создан формат FictionBook. |
FB2 | Открытый формат, основан на XML. Основное преимущество FictionBook(.fb2) – возможность без труда создавать (в том числе и автоматически) книги в этом формате из файлов всех популярных текстовых форматов (*.txt, *.doc, *.rtf. *.html и пр.). Кроме того, FictionBook поддерживается большинством распространенных программ и устройств для чтения книг. |
FB3 | Формат fb3 разрабатывается для удовлетворения возросших требований к форматированию текста книг и возможностям их каталогизации. Современное состояние стандартов и технологий позволяет, помимо простого расширения набора тегов, привести формат к совместимости с наиболее удачными и перспективными наработками. В частности, в основу fb3 положен стандарт Open Packaging Convention (ECMA-376 Part 2). Помимо этого в качестве картинок можно использовать SVG-файлы (и GIF-файлы, патент на которые закончился). |
TEX | TEX – система вёрстки, разработанная в целях создания компьютерной типографии. В неё входят средства для секционирования документов, для работы с перекрёстными ссылками и для набора сложных математических формул. Документы набираются на собственном языке разметки в виде файлов, содержащих информацию о форматировании текста или выводе изображений. Электронные книги обычно имеют расширение .tex, конвертируются специальной программой в файлы «.dvi», которые могут быть отображены на экране или напечатаны. DVI-книги можно специальными программами преобразовать в PostScript, PDF, или другой электронный формат. |
Формат электронных документов, созданный фирмой Adobe Systems с использованием ряда возможностей языка PostScript. Обычно используется для книг с иллюстрациями (в т.ч. схемы и математические формулы). PDF – формат, позволяющий внедрять необходимые, векторные и растровые изображения, формы и мультимедиа-вставки. | |
LIT | Фирменный формат Microsoft (.lit) , достаточно распространенный, в том числе из-за поддержки производителя. Существует некоторое затруднение с прочтением, поскольку формат читается в основном с помощью Microsoft Reader, официального ПО. Microsoft LIT включает ряд функций, из-за которых его считают очень похожим на Adobe PDF: закладки, аннотации и масштабирование. |
PostScript и EPS | PostScript (.ps)- язык составления документов, главная функция – описание страниц, чтобы при выводе на печать они выглядели так же, как на экране. Формат EPS (Encapsulated PostScript) был создан для сохранения графики (содержащей изображения всех типов, контуры, текстовые поля и др. – в том числе и электронных книг), предназначенной для печати на «PostScript-принтерах». EPS, в котором, как правило, сохраняют конечный результат работы, это упрощенная версия формата PostScript. |
ExeBook | Книга в формате ExeBook – по сути, Win32-приложение, скомпилированное с помощью специального программного обеспечения. Основной особенностью книги в формате EXE является ее максимальная приближенность к бумажному аналогу. |
RBS | RBS (Radix-Tools REBUS) – это защищенный формат, основанный на HTML и включающий в себя текстовый, графический, мультимедиа-контент и интерактивные составляющие. Использование в формате HTML-языка позволяет легко конвертировать файлы практически любого формата в RBS-вид с помощью специального ПО. В электронном виде в формате RBS может быть представлено множество типов бумажных изданий, как то – учебные и контрольные тесты, анкеты – результаты опросов, картографические документы, справочники, энциклопедические материалы и художественная литература. |
PRC | Сжатый формат PRC – так называемый Palm-формат, использует механизм шифрования контента электронной книги, что обеспечивает защиту интеллектуальной собственности при ее продаже. Файлы с расширением PRC используются для электронных книг в формате Mobipocket Reader для чтения книг на кпк и телефонах . |
ePUB | Формат, основанный на XML. Позволяет издателям производить и распространять цифровую публикацию в одном файле, обеспечивая совместимость между программным и аппаратным обеспечением, необходимым для воспроизведения незашифрованных цифровых книг и других публикаций с плавающей версткой». |
Простой текст (plain text) | |
TXT | Файлы формата TXT имеют наименьший вес, поэтому зачастую использовались в самом начале эры электронных интернет-библиотек, у посетителей которых была предельно низкая скорость скачивания, равно как и объемы жестких дисков, а также различных носителей. Для того, чтобы скачать крупное издание, создавались ZIP-архивы, объединяющие все главы книги. Основной плюс TXT – его совместимость со всеми устройствами и практически любым программным продуктом, Хотя данный формат и не поддерживает графику и сложное форматирование. |