Тема 6. Создание электронных книг онлайн

1. Понятие электронных книг

В последние годы электронные книги стали популярным трендом как среди любителей технических новинок, так и среди обычных читателей. Это очередной этап развития книг. Электронные книги стали для пользователей привычным гаджетом. Однако, часто разные устройства поддерживают определённый набор форматов электронных книг, которые может «прочесть» или распознать. До недавнего времени электронные книги существовали только в программной интерпретации, во всевозможных форматах, например, .txt, .doc, .htm, .chm, .pdf, .rtf, .djvu, .fb2. Некоторые файлы электронных книг созданы, как самостоятельные приложения, в формате исполняемых exe-файлов. Рассмотрим некоторые форматы электронных книг и их достоинства и недостатки.  

Наиболее распространённые типы файлов

  Формат   Назначение  Кроссплатформенность Способ создания книги   Недостатки
  PDF  Формат пригоден для создания книг, буклетов и т. д. с высоким качеством изображений  Да  Текстовый редактор MS Word, специальное ПО Большой размер конечного файла
DJVU   Открытый формат подходит для хранения сканов прессы и книг, где не требуется высокое качество изображений или где трудно распознать текст Да, при наличии специального ПО  Конвертер  Не всегда высокое качество результата 
  DOC Подходит как для создания текста “с нуля”, так и для размещения готовой информации (графической или текстовой)  Нет. Только Windows. Unix и JAVA (при наличии ПО (конвертер))  Текстовый редактор MS Word  Большой размер, не всегда удобный просмотр с мобильных устройств и ридеров
  HTML  Язык гипертекстовой разметки, который подходит для отображения любого текста и графики Да  Текстовый редактор или HTML-редактор Нужны навыки работы, небольшие возможности форматирования 
FB2   Основан на XML, служит для отображения любого текста или графики, легко создается из DJVU и HTML формата Да, при наличии ПО  Специальное приложение или конвертер   Не всегда корректное отображение некоторых символов и таблиц
  EXE  Компилируется на основе HTML и позволяет создавать книги с самым разнообразным контентом Нет, только Windows  Специальное приложение-компилятор  Поддержка формата только семейством Windows 
  CHM Чаще всего используется для создания файлов справки к программе, компилируется на основе HTML  Да, для Windows, остальные — при наличии специального ПО  Специальное приложение или конвертер  Поддержка формата только семейством Windows 
  JAVA Используется для чтения книг на мобильных телефонах, КПК и т. п. устройствах  Нет  Конвертер  Не всегда корректное отображение некоторых символов и изображений
Разные форматы используются для разных типов литературы. Для художественных текстов чаще используются форматы  EPUB, FB2 или MOBI , а для научной, технической и учебной литературы -  PDF, DJVU, DOC (DOCX) . Рассмотрим, с чем это связано.

2. Художественная литература

К специализированным форматам, предназначенным именно для художественной литературы, относятся  EPUB, MOBI, FB2  (и его разновидность  FB2.ZIP ). Данные форматы основаны на так называемой «плавающей верстке» , которая позволяет менять размер, гарнитуру шрифта, величину межстрочного интервала и ширину полей. При этом данные форматы поддерживают картинки, таблицы, автоматически создаваемое оглавление, сноски и многое другое.

3. Научная, техническая и учебная литература

Подобная литература обычно распространяется в форматах  PDF, DJVU, DOC (DOCX), каждый из которых, имеет определенные недостатки. Бывают ситуации, что некоторые книги доступны только в одном формате, а подчас — и только в одной версии.

     

Формат DOC хорошо подходит для чтения книг с компьютера. Но другие устройства для чтения могут отображать его некорректно, исключая ряд иллюстраций, таблицы, формулы и прочее или же отображать текст как картинку: элементы оформления показываются, но нельзя менять размер и гарнитуру шрифта, что на маленьком экране очень затрудняет чтение.

Формат файла PDF (от англ. Portable Document Format - переносимый формат документов) - предназначен для представления в электронном виде различных документов с полным сохранением форматирования (какой вид имеет документ при создании, так он и будет отображаться).

Данный формат был разработан компанией Adobe и предназначался для отображения полиграфической продукции, различных глянцевых журналов и периодических изданий. PDF файл, после создания, не может быть отредактирован, так изначально задумано разработчиками.

Сегодня формат PDF является незаменимым инструментом при создании и ведении документации, создании иллюстрированных электронных книг, хранении различной технической информации.

Есть три варианта этого формата:

  • текстовый,
  • графический («картиночный»)
  • графический («картиночный») с OCR-слоем.

OCR (оптическое распознавание символов) – это технология, которая позволяет преобразовывать цифровые изображения и PDF-файлы в электронные текстовые документы для удобного редактирования, копирования, поиска и хранения в электронном архиве. Первый вариант наиболее предпочтителен: он может содержать все элементы форматирования, а текст остается масштабируемым. В случае же с графическим PDF текст является просто картинкой, которую можно увеличивать только целиком; размер шрифта изменению не подлежит. На устройствах с маленькими экранами графические PDF читать поэтому очень затруднительно.

Иногда на страницы графических PDF накладывается OCR-слой при помощи программы распознавания текста.  В книге PDF с OCR-слоем можно проводить поиск, использовать словарь. Это вариант неплохой. Но не все устройства для чтения этот OCR-слой «видят». Да и увеличить размер шрифта он не позволяет. Поэтому OCR-слой часто оказывается бесполезным.

Формат  DJVU в целом напоминает графический PDF: обычно это просто набор сканов или фотографий бумажной книги.  Иногда на сканы/фото накладывается OCR-слой при помощи программы распознавания текста. В книге DJVU с OCR-слоем можно проводить поиск, использовать словарь.

4. Документы, таблицы и презентации

Многие документы, таблицы и презентации распространяется в форматах MS Office:  DOC/DOCX, XLS/XLSX, PPT/PPTX. Это форматы очень функциональные, но, к сожалению, довольно «громоздкие» и «закрытые» (иными словами, сторонним разработчикам довольно сложно создать программу для чтения файлов в данных форматах). Поэтому некоторые устройства их не поддерживают. По этой причине, следует переводить документы в  PDF

5. Зачем уметь создавать электронные книги?

Умения создавать электронные книги может оказаться полезным в следующих случаях:

  • подготовка макета книги/документа для передачи в издательство или типографию;
  • вы обладаете книгой, которой хотели бы поделиться с обществом, но она в бумажном варианте;
  • вы решили заняться информационным бизнесом и стремитесь привлечь внимание к своему сайту/блогу/услуге или продукту;
  • вы любите читать, у вас есть ридер и вы хотели бы читать книги, которые правильно отображаются;
  • в Интернете можно заработать на распространении электронных книг;
  • в электронных книгах значительно легче защитить контент от копирования;
  • хранение информации в электронных книгах может оказаться незаменимым, если не всегда есть возможность обратиться к сети Интернет.

Вопросы для самоконтроля

1. Для чего предназначен формат PDF?

2. Для какой литературы (художественная, научная или другие документы) применяется формат EPUB?

3. Что такое OCR-слой и зачем он используется?

Перейти к выполнению Лабораторной работы 6

Сообщить о нарушении Подробнее