The Ebook. Книга об электронных книгах

Прохоренков Владимир Борисович

Часть 2. Контент

 

 

Вступление к разделу

Довольно часто термин «электронные книги» ассоциируется с чем-то конкретным — с устройством, с текстом, с графикой, мультимедиа, с интерактивной средой, с отдельной программой, которая сама по себе может быть интерпретацией книги в виде игры и так далее. Возникает путаница — являются ли «электронные книги» текстом или устройством? Очень редко термин воспринимается как единое целое, у которого есть вполне конкретная совокупная стоимость владения, то есть учитывающая общую сумму целевых затрат. Пользователи считают и ошибаются, очень часто какая-то часть общего термина попросту не учитывается. Например, если бумажная книга воспринимается единым целым, потому что объект оценки вполне конкретная физическая вещь, цена на неё становится известна и понятна, то, как оценить стоимость «электронной книги»? Что именно должно оцениваться? Именно в этот момент приходит осознание «электронных книг» как единого целого.

Термин «электронные книги» базируется на существовании «контента», как первичного признака.

Текст книги — это содержимое «электронной книги», её важная часть. Исторически принято называть «контентом», от английского «content» — «содержание», или «содержимое». Им может быть любое информационное наполнение — текст, мультимедиа, графика, звук, видео.

Основным контентом для книг, в большей степени, является текст, для комиксов — это графика, соответственно, для аудиокниг — это записанный звук.

Довольно часто, контентом называют совокупность различного содержания. HTML документ, на котором основано отображение сайтов в Интернет, может содержать в себе целый набор различных данных, а не только «голый текст». Одним словом — это также можно назвать «содержимым», то есть, авторы сайтов создают «контент» в рамках идеи, ради чего и появляется привлекательность ресурса.

Изначально «контент» является смыслом существования обмена информацией. В современном мире — это становится уже более широким значением для существования целых направлений экономики, бизнеса, государственного статуса и тем более для осознания общественных ценностей, уникальности, нравов, культуры и законов. Именно контент делает книги священным писанием, историю достоверной цепочкой событий, которую можно хранить и изучать, а научные труды распространять с помощью учебников.

Текстовый и графический контент — это пока единственные формы, которые технически доказали, что существует возможность передавать информацию на протяжении более длительного времени, чем жизнь автора, с минимальным ущербом, в отличие от более современных форм записи — мультимедиа, которым ещё предстоит найти собственный долговечный носитель.

Контент влияет на развитие электронных книг. В различных странах это достигается соразмерно со скоростью развития цифрового контента, доступностью и распространённостью Интернет.

Контент пока единственная причина удерживать читателей в качестве регулярных потребителей, рядом с производителем устройств, в отличие от тех компаний, которые не могут или, пренебрегают работать с контентом. Довольно сложно придумать иную полноценную систему, при которой потребитель постоянно возвращается к производителю и тем самым становится лояльным потребителем. Без контента потребитель совершает единственную самодостаточную покупку и может никогда более не возвращаться к этому производителю. Не происходит накопления, привыкания, зависимости. Производитель устройств может сколько угодно много произвести различных моделей, но его положение оказывается очень шатким и даже временным, независимо от того, насколько хорошо осуществлялись продажи на определённом этапе. Такой производитель фактически всегда вкладывает деньги в рекламу всего одного устройства, а не целой платформы. Он вынужден подражать бюджетным моделям конкурентов, хотя у них для поддержания низкой цены существует контент и лояльность потребителей.

Интересно, что если производитель устройств работает с контентом, эта связь помогает лучше понимать потребности читателей. Появляются уникальные функции, которые никогда не образуются у обычного производителя. Последнему присуще изменение внешности разрабатываемых устройств, но программное обеспечение не развивается и просто потому, что производитель не знает, что делать с контентом, кроме как поддержка функции «открыть файл».

Основным потребителем устройств, которые не обеспечиваются контентом, является осведомленный и подготовленный пользователь, который хорошо знает, где и как можно скопировать или приобрести готовые книги. Эти потребители могут мириться с отсутствием книг и предпочитают совершенно иной набор доступной литературы.

Для привязки потребителей к легальным магазинам широко используется метод «распространения и защиты современных бестселлеров и авторов». Рекомендательные сети поддерживают интерес к определённому набору литературы, к рекламе авторов и обложек книг, что становится долгосрочным психологическим заделом. Потребитель быстро выхватывает взглядом книги, из целой гирлянды, представленных в магазине, обложки которых он видел ранее.

Контент является единственной формой создания лояльных потребителей, но он же становится причиной накопления привычек для нелегального копирования. Ответственность за нарушение авторских прав несут не только пиратские ресурсы, но и производители устройств, которые создают электронный носитель для чтения «бесплатных файлов» и тем самым оправдывают высокую стоимость своего продукта. Если «книжное пиратство» преследуется по закону, то производители даже морально не осуждаются за свою деятельность, так как их задача «создавать устройства», а не контролировать цели эксплуатации. Точно так же, как производители компьютеров не контролируют нелегальное использование программного обеспечения, что в свою очередь, так же, является «контентом».

Общество ещё не научилось оценивать значимость контента, который за последние десятилетия обеспечивает смыслом существования миллионы человек. Очень легко понять, сколько людей останутся без работы, если убрать из компьютеров программное обеспечение. Точно также пострадают люди, которые создают книги, технические справочники, учебники, сопроводительную документацию к лекарствам или к игрушкам. Современный мир обеспечивает работой за счёт существования легального контента, потому что миром правят «ботаники» и «информационные технологии».

У обычного потребителя вместе с осознанием значимости контента появляются дополнительные бытовые вопросы — «откуда берутся книги», «какие форматы лучше», «как копировать книгу в устройство» и так далее. Все это предмет отдельного рассмотрения. Некоторые вопросы становятся причиной выбора электронного устройства и предпочтения различного рода литературы. Часть потребителей фанатично переходят на электронное чтение полностью, заменяя книги, журналы и газеты цифровым контентом. Другие используют устройства только для регулярного чтения и это удобно на расстоянии от книжного магазина или другого источника бумажного контента.

Бумажная пресса стала проигрывать не столько цифровым вариантам распространения, сколько Интернету, которым можно пользоваться с помощью обычного браузера. Потребителям уже не хочется владеть всем выпуском газеты или журнала, сколько интересно прочитать отдельную статью, рассмотреть фотографии или подключиться к тематической дискуссии. Появились ресурсы, которые позволяют собирать отдельные статьи (в одном месте) для чтения на экране устройства или даже подписываться на поток узкоспециализированной информации. Контентом становится даже результат поискового запроса, который отображается не только в реальном времени, но также можно отслеживать все новые результаты по мере их появления.

Современная пресса стала новым видом информации — «динамическим контентом». Он уже не подчиняется одному человеку или изданию. Современная пресса становится бесплатной, спонтанной и не профессиональной, потому что этот динамический поток держится на голом энтузиазме отдельных личностей и трансформации того, что существует на рекламные отчисления или иной форме поддержки.

Подобное легко осознать как разницу в контенте между профессиональным телевидением и множеством любительских видеороликов на популярном видеохостинге, например YouTube от Google.

Таким образом «уникальность» и «актуальность» становятся качественной характеристикой любого контента. Они делятся по типу создания: «авторский», «пользовательский», «тематический», «постоянный» и «пополняемый» контент.

Любой контент имеет несколько градаций сложности и ресурсозатратности методов создания. Во многом это влияет на конечную стоимость интеллектуального продукта и является основным критерием для определения разницы между «легальностью» и «пиратством»:

• Оригинальный авторский метод — оригинальный контент создаётся одним или группой авторов, независимо от стоимости разработки и вероятности продать за деньги или распространять бесплатно результат труда. Не существует точного метода для оценки стоимости произведений, хотя затраты можно рассчитать заранее или как-то оценить впоследствии.

• Допустимо оригинальный метод — очень схож с «авторским», но может использовать вкрапления стороннего контента, цитат, стихов, может заимствовать частичные идеи других авторов, реальные имена людей или придерживаться сюжетного направления, в зависимости от ограничений и коммерческого заказа. И так далее. Данный метод также является ресурсозатратным, но чаще используется в разработке коммерческого или заказного контента с заранее определёнными рамками развития и сопровождения. Интересно, что в этом методе легко уживается автор книги и совершенно другой человек, написавший по книге сценарий для фильма. Это два разных автора и любой из них может заработать больше. Автором может выступать очевидец событий, который пересказал сюжет сценаристу, а тот получил право на использование этой идеи. Вариантов для этого метода гораздо больше, чем чисто творческий подход «авторского метода».

• Метод заимствования — основан на копировании, на плагиате чужого контента. Пиратство и плагиат — это, по своей сути, заимствование авторского контента в собственных целях, независимо от способа распространения. Метод основан на отсутствии информации о легальности и оригинальности, а также на неуважении к интеллектуальной собственности. В большинстве случаев подобный контент оценивается за счёт используемых ресурсов распространения.

Контент важно оценивать не только как оригинальный продукт, но и в качестве продвижения идей, задач, рекламы, пропаганды, функций и прочего. Отсутствие уникальности снижает общий интерес, понижает авторитетность информации или выполняемых задач. Ключевые фразы позволяют определять тематику контента. Актуальность привлекает целевую аудиторию и делает её лояльной. Лёгкая форма позволяет логически управлять восприятием контента.

И последняя классическая форма — это трастовый контент, от английского слова «trust» — «доверие». Эту форму можно назвать пропагандой, религией или убеждением в чем-либо. Подобный контент внушает доверие к определённой форме информации. В основе заложена форма подачи, которая не требует рекламы, какого-то давления или принуждения. Трастовый контент направляет добровольный интерес в сторону конкретных идей, идеологии, товаров, услуг и так далее, в том числе к личностям. Подобного контента более чем достаточно и базируется он на вере в истинные или ложные ценности. Трастовая форма может изменяться во времени. Актуальная сейчас или ранее литература перестаёт пользоваться спросом в дальнейшем, или становится классикой, которая не теряет свои качественные свойства на протяжении очень длительного времени.

Некоторые современные виды контента являются трансформацией устаревшей формы «доверительной» информации.

По мере освоения потребителями электронной формы чтения и закрепления безбумажного способа распространения контента, ценность книг (и информации) будет пересматриваться по многу раз. Будет меняться принцип и форма того, что именно нужно оплачивать или раздавать бесплатно, чтобы сохранять оригинальность литературных и других видов контента.

Очень важно иметь возможность поддерживать достойный уровень жизни творческих людей, которых с каждым годом становится больше, к сожалению, не во всех областях общественной жизни, экономики и даже морали.

 

Откуда берутся книги

 

Общие сведения

Когда существовала монополия бумажных книг, наверное, никто не задумывался над вопросом «откуда берутся книги». (Вообще, странно называть монополией откровенный дефицит). Каждый знал, что главный «виновник» рождения произведения — это автор. Далеко не каждый догадывался, как написанная книга попадает в руки читателей. В большинстве случаев это был долгий путь. Особенно для неизвестных авторов. Написать, убедить, опубликовать, продать и быть прочитанным. Каждый, по своим убеждениям, может выбросить не заслуживающие внимания пункты из этой цепочки. Может добавить свои, мало ли какие существуют убеждения.

В эпоху электронных книг изменилось многое, в том числе источники появления книг. Их стало больше и это в дополнение к существовавшей ранее монополии. Подобное расширение можно назвать увеличением родников одной большой творческой реки, которая вливается в озеро или даже в огромный океан литературы.

Важно понимать, что кроме источников распространения появились новые носители — электронный и программный. Если письма в прошлую эпоху отправляли физически — конверт и текст на листе бумаги, то в современном мире главенствует электронный файл. Содержимое файла называется электронным контентом.

Если в бумажную пору было накладно тиражировать содержимое книги, то электронный файл воспринимается как нечто вовсе бесплатное, что в корне неверно по отношению к авторским правам. Тем не менее, файл не только снизил стоимость тиражирования, но осуществил мечту издателей — предложить потребителям доставку контента «по требованию». (Есть такой термин и в среде бумажных книг, когда читатель приобретает книгу по индивидуальному заказу). Есть в этом недостаток — копия не соответствует первоначальному эталону, такому, каким его задумал издатель вместе с автором и оформителями. Электронный файл является точной копией электронного первоисточника, если в него не вносились изменения.

В любом случае, «физически» распространяется файл, что действительно экономически выгодно, но внутри него находится произведение, которое должно приносить пользу не только читателям, но и их авторам. Это труд, но он не может определяться точными расценками. Право на любую форму распространения принадлежит соответствующему владельцу, вне зависимости, как оценивается произведение. Право на произведение — всегда принадлежит автору пожизненно и его родственникам с учётом локальных законов и соответствующих сроков.

В России авторское право может нарушаться или попросту не выполняться, но никто не может лишить автора его прав бессрочно. Подобное отношение приводит к нарушению закона не только заинтересованными организациями или частными лицами, но и читателями.

В связи с тем, что электронный файл воспринимается как логический и бесплатный носитель, отношение к распространению должно быть чётким и ясным в своей основе, но ещё очень важно уметь трансформироваться в современном мире. Некоторые ограничения, которые навязывают владельцы прав, дурно влияют на выполнение не только закона, но и сами косвенно нарушают авторское право. При монопольных ограничениях создаются условия, при которых копирование файла воспринимается как ответная реакция на дефицит.

Наступила эпоха распространения электронного контента. В самом его начале бесконтрольное и незаконное распространение поддерживалось продавцами и фактически поддерживается производителями устройств до сих пор, хотя бы косвенно. Отношение к электронному контенту таково, что есть электронное устройство, а бесплатных книг в Интернет много. Это ощущение не родилось само по себе, а стало наследством эпохи «дефицита электронных копий книг».

Когда почти ещё никто не имел понятия о существовании специализированных устройств для чтения, большинство пользовалось подручными средствами для чтения «файлов». Это были распечатки, настольные и ручные компьютеры или что угодно в таком духе, способное воспроизводить файлы на каком-то физическом носителе. Это всё различные формы адаптации текста.

Контент всегда появлялся раньше устройств. На локальных рынках было различное отношение к появлению файлов как электронных книг. Коммерческое распространение контента в Америке значительно более эффективно, в отличие от нашего отечественного рынка, который поднимали энтузиасты и подхватили немногочисленные специалисты. Позже, «свободное распространение» признали «пиратством», только по той причине, что отношение к копированию и тиражированию не изменилось вместе с современным миром.

История сама разделила и классифицировала источники распространения контента. В современном понимании существует несколько форм:

1. Прямая копия — вид копирования, когда файл передаётся от одного частного лица другому. Создание файла не обязательное условие, это может быть готовая копия.

2. Публичная копия — когда копирование файлов становится публичным и массовым. Для доступа к контенту не всегда применяется регистрация нового читателя. Создание файла также не обязательно. Владельцы публичных ресурсов могут пополнять свои коллекции любым из доступных им способов, в том числе копированием контента из других источников.

3. Платное и бесплатное копирование — вид деятельности, когда владелец авторских прав самостоятельно решает применять определённый тип распространения.

В этих условиях общепризнано несколько наименований источников контента: файл, библиотека, магазин.

1. Файл — копирование основано на логической копии электронной книги любым способом. Это может быть не только прямая копия, но и публичный открытый или закрытый источник. Применяется в основном для передачи данных на носитель. Например, файл применяется при копировании на карту памяти, компьютер и так далее. Копирование подразумевает дальнейшее хранение и чтение любым доступным способом.

2. Библиотека — распространённое наименование публичного источника любого типа. В электронном мире членство в библиотеке не обязательно. Название ассоциируется с привычной физической библиотекой для бумажных книг, но соблюдение закона об авторском праве не обязательное условие. Большинство «пиратских» источников можно смело отнести к «библиотеке», а условия распространения зависят от владельцев коллекции файлов. В отличие от физической формы, платное членство в электронной библиотеке означает покупку контента и согласие с условиями членства, а ресурс относится уже к магазину, вне зависимости от причин оплаты и оправданий владельца библиотеки. Особой формой пополнения контента может быть не только бесплатное копирование и предоставление произведений для распространения авторами, но и сбор средств для приобретения контента в платных источниках, что ни в коей мере не может отражаться на читателях, вне зависимости от их долевого участия в пополнении коллекции. Например, библиотека в качестве ресурса для самиздата предполагает предоставление произведений авторами на безвозмездной основе. Или библиотекой может быть открытый или закрытый ресурс, где читатели могут бесплатно получить копию электронной книги. Также характерный пример, когда библиотекой не может быть источник, который берет плату за членство ради бесплатного копирования книг, но может быть ресурсом, который обогащается для своих нужд за счёт рекламы. И так далее. Нельзя сравнивать физическую и логическую библиотеку по единым правилам. В отличие от электронной, обычная библиотека получает физические копии книг и не предоставляет доступ сверх этой меры. По этой причине электронные библиотеки в помещениях не предоставляют копии на вынос из здания без носителя.

3. Магазин — форма, наиболее понятная любому читателю. Контент оплачивается как покупка только для личных нужд, без учёта дальнейшего копирования. Покупка незащищённого контента не даёт права для дальнейшего тиражирования, а лишь упрощает возможность владения файлом на различных устройствах, даже тех, которые ещё не появились у владельца. Защита контента ограничивает количество возможных копий на другие устройства, вне зависимости от количества владельцев. Магазины вправе распространять бесплатный контент на своих условиях или бесплатно. Стоимость бесплатных книг определяется как сервис.

Ко всем формам распространения и сервиса стоит добавить физические носители и аналогичную передачу данных. Например, книга может распространяться на карте памяти или в составе нового устройства.

Основные споры и сомнения читателей, использующих электронный носитель, лежат в плоскости определения доступности книги по цене владения файлом. Это навязанное обществом отношение к тому, что бесплатное владение лучше платного. Подобное не учитывает общественную значимость будущего владельца и его вклада в экономику, а не только литературы как некой формы информации. Что в какой-то условной мере и при определённых условиях конечно лучше и может даже правильно.

Существует мнение, что книга — это информация и должна быть бесплатной. Это настолько же верно, как утверждение, что цена на товар должна быть разумной. Но это неверно в современном мире, хотя бы по той причине, что писательство стало способом не только самовыражения, но и формой труда, а также совокупной наживы, где ряд книг приносят убытки, а не прибыль. Соответственно любой труд должен быть оплачен, тем более, если нет иных форм существования автора или если таковым является его законное желание, выраженное в виде юридически составленного договора с издателем или распространителем.

Надо понимать, что «книга» и «информация» имеют не совсем равные значения и определения. Это верно к обоим терминам.

Книга, прежде всего — это творчество и даже бизнес. Что первично не всегда можно определить точно.

Информация — это образование и неотъемлемое право на свободу слова.

И то, и другое может существовать в любой платной или бесплатной форме, но всегда свободно по определению. Никто не вправе ограничивать не только свободу слова, но и творчества. Полицейское государство и ворующее общество ведёт к нарушению естественных свобод в современном понимании.

Все кто ратует за бесплатную форму распространения книг и информации — должны доказывать это на собственном примере, предоставляя обществу результат своего труда в пропагандируемой форме доступности.

Не стоит бояться оплачивать труд писателя, копируя бесплатные файлы. По статистике человек читает не так много, чтобы ограничивать себя на покупке книг. С другой стороны электронная форма чтения может предоставить новые улучшенные условия для безошибочного приобретения контента. Наличие бесплатного фрагмента защищает не только литературу как коммерческую форму искусства, но и позволяет «не тратить деньги» потребителей на сомнительное чтиво.

Надо понимать, что современный мир должен быть гуманным во всем, а не только в области авторского права. Если общество создаёт дефицит знаний, то никакие источники пополнения контента не спасут от деградации. Разумная цена во многом влияет на доступность не только контента, но и национальный уровень образования и грамотности, следовательно — безопасности.

Беда в том, что мир не является разумным существом и создаётся на временных законах, причём они не всегда отвечают современным требованиям. Любой источник контента пригоден для использования. Законность действий потребителей зависит от наличия дефицита и законных прав на распространение контента. Электронный формат не означает, что у какого-то издательства есть законное право на подобную форму распространения и этот пробел заполняют «пираты», которые тем самым фактически владеют эксклюзивным правом собственности на редкое издание, доступное в электронной форме и конкурируют там, где собственника (фактически) просто нет.

 

Контент

Книга, как текст с иллюстрациями и без них, как содержимое носителя — вероятно, самая важная часть составного определения «электронные книги». До недавних пор «книгой» считался один из видов печатной продукции и ассоциировался не только с содержимым, над которым работал автор, но и с самим носителем информации. При появлении и массовом распространении «электронных книг», общепринято уточнять «о какой книге идёт речь», подразумевая вопросом, что уточняется конкретный носитель. Кроме того, содержимое носителя не всегда ассоциируется только с текстом, именно поэтому распространённым становится определение термина «контент», как более широкого толкования того, ради чего покупается электронное устройство (ридер, планшет, плеер и так далее). Чтобы не путаться, далее (и возможно чаще всего) в этом разделе будет использоваться слово «контент» для определения «содержимого» электронной книги, исполняющей роль носителя.

Перенос контента в цифровую форму определён историческими традициями. В мире электронных книг отдельный файл ассоциируется с публикацией. Необязательно нужно подразумевать только «текстовые книги», но и газеты, журналы, программы, справочники, словари, музыкальные альбомы и так далее.

Книга, как контент — это непериодическое издание, состоящее из сброшюрованных страниц. Электронный контент имеет более широкое определение. Зависит от используемого типа и не обязательно является отдельным и логически законченным томом.

Контент в электронной форме состоит из неопределённого заранее количества слов и иллюстраций, разделённых на виртуальных страницах. Количество страниц в отдельном издании может изменяться в зависимости от масштаба изображения на экране.

Разделение понятий «контент» и «носитель» привело к тому, что в электронных книгах не существует понятия «мягкий» или «жёсткий переплёт» по отношению к «книге».

Есть ещё ряд особенностей электронного контента и это во многом зависит от источника получения, от способа изготовления готовой книги, от способа передачи файлов и так далее. Например, при покупке устройства для чтения, потребителя беспокоят не только характеристики аппаратной части ридера. Очень часто возникают типовые вопросы «о происхождении контента» — как его получить, где купить, как сделать самостоятельно и главное — как много источников и книг.

Для выбора одного или нескольких способов приобретения контента нужно понимать разницу между источниками и происхождением файлов. Далее по тексту «приобретение» — должно восприниматься как универсальная форма доставки контента, вне зависимости от стоимости и источника.

В большинстве случаев знания потребителей ограничиваются пониманием того, что если издательство опубликовало книгу в бумажном виде, то оно может очень просто и легко предоставить электронную копию своим читателям, что далеко не всегда является истиной. Причин огромное множество. Чтобы это чётко понимать, рассмотрим каждый из источников появления электронного контента отдельно, не забывая о том, что книги бывают двух типов — «платным и бесплатным», как в прямом, так и в переносном смысле.

Все источники контента можно разделить на несколько видов:

1. «Явный» — когда источник очевиден и о нем знают читатели, его могут рекомендовать или упоминать продавцы и сами покупатели.

2. «Случайный» — когда источник контента не предполагался как существующий или читатель использует его не регулярно, а только по необходимости.

3. «Условно общий» — когда доступность книги создаёт иллюзию, что читатель является частью и совладельцем всего, что есть в конкретном источнике или группе онлайн ресурсов схожего типа.

4. «Клубный или имеющий ограничения в доступе» — когда ресурс ограничивает возможность чтения, скачивания, общения, обсуждения, приобретение контента, где для указанных действий необходимо иметь привилегию в виде регулярного или временного членства.

5. «Личный или частный» — когда контент создаёт сам читатель в виде электронной копии с физического носителя. Владелец может использовать для чтения собственные документы из различных источников, как частных, так и чисто профессиональных. Причём не только для чтения, но и демонстрации документов третьим лицам.

Все виды, источники и способы создания или получения контента не имеет смысла запоминать полностью и навсегда, как в школе. Систематизировано для общей информации и определения собственных предпочтений. Часть из них можно просто отбросить, если не предполагается к применению. Здесь не существует «более правильных» решений.

Чаще всего читатели получают готовые книги из доступных источников, но это не говорит о том, что файл невозможно создать самостоятельно. Это потребует знаний, умения, свободного времени и вложения дополнительных средств, в зависимости от выбранного вида оцифровки документов.

 

Авторы

Самый первый и самый важный источник появления цифрового контента — автор произведения. Его основная задача написать книгу и сделать её доступной для массового чтения. Именно автор в большинстве случаев является собственником произведения, и именно он решает изначально, каким образом распространять итог своей работы — платно или бесплатно, через посредников или самостоятельно. На основе этого права, автор принимает решение о предоставлении рукописи в первичный репозиторий, с которого по цепочке начнётся распространение контента.

Дальнейшая судьба произведения в руках распространителей, рекламы и удачи.

Эта часть повествования, в результате, окажется самой короткой и она не должна вводить в заблуждение при чтении «о незначительной роли авторов на существование контента» в электронном устройстве читателя.

 

Магазины

В большинстве случаев магазины, которые торгуют электронным контентом, находятся в сети Интернет. В этой роли могут выступать не только узкоспециализированные сайты. Довольно часто, продажа контента является дополнительным бизнесом. Сам термин «магазин» предполагает, что контент будет доступен только на платной основе, но не обязательно весь ассортимент. В качестве стимулирующего фактора магазины активно предлагают бесплатный контент.

Чаще всего к «бесплатному контенту» приравниваются «классические произведения».

Магазин вправе регулировать и устанавливать произвольные цены. На решение о продаже не влияет общественное мнение «об аморальности ценообразования на книги из списка общественно доступных». В большинстве случаев это связано с корпоративным стимулом заниматься определённым видом деятельности и если магазин решается продавать контент из списка «общественно доступных», то в первую очередь это связано с накладными расходами и источником получения произведений.

Во всем мире существует небольшое количество узкоспециализированных магазинов по продаже контента. В большинстве случаев магазины универсальны, могут быть знамениты, как магазин контента, но дополнительно всё равно занимаются чем-то побочным и не менее прибыльным. В современном понимании «узкоспециализированными магазинами» можно назвать только те сайты, которые не выходят за рамки книжной индустрии существующим ассортиментом товаров и услуг.

Amazon.com, Inc. — это американская компания, крупнейшая в мире по обороту товаров и услуг через Интернет. Сейчас на площадках Amazon представлены несколько тысяч позиций и миллионы различных товаров. Компания присутствует в некоторых европейских странах. Электронный контент является дополнительным видом бизнеса. Amazon начинал свою деятельность с продажи бумажных книг, и электронный контент стал для неё естественным видом деятельности и приносит регулярную прибыль, начиная с 2007 года. Можно констатировать, что развитие семейства устройств Kindle и электронного контента принесло компании заметную долю всемирной известности.

Компания Barnes & Noble в большей степени до недавнего времени была ориентирована на розничные продажи. Barnes & Noble, Inc. является крупнейшей книготорговой сетью в США. Розничная сеть Barnes & Noble насчитывала более 700 магазинов во всех штатах Америки по состоянию в конце 2011 года. Кроме книг, можно приобрести журналы, газеты, комиксы, подарки, игры, видеофильмы, музыку и многое другое. В конце 2009 года Barnes & Noble выпускает первую модель Nook для чтения электронных книг и активно занимается продажей цифрового контента.

Среди отечественных магазинов таких гигантов просто не существует, но отечественный рынок имеет несколько узкоспециализированных магазинов, которых встретить (в таком виде) на зарубежных рынках значительно сложнее, тем более учитывая объёмы продаж.

Компания Литрес известна не только как магазин цифрового контента, но и как агрегатор авторских прав. Она может не только продавать книги, но и заключать с партнёрами индивидуальные соглашения ради распространения цифрового контента. Среди партнёров Литрес значатся известные бренды среди отечественных и зарубежных компаний.

Ближайший исторический конкурент и партнёр Литрес — компания айМобилко. Отличается утончённым вкусом и креативным мышлением в популяризации контента, но в рамках своего проекта. АйМобилко одна из первых отечественных компаний, которая опробовала на себе все «преимущества» и «последствия» от наличия фирменного устройства для чтения.

Отечественные площадки отличаются от зарубежных магазинов поддержкой нескольких популярных форматов книг, что является более независимым решением среди разнообразных платформ для чтения. В большинстве случаев для приобретения контента используется дополнительное устройство, например настольный компьютер, как посредник между магазином и конечным устройством для чтения, чего нет в зарубежных магазинах. Amazon и Barnes & Noble передают контент непосредственно в устройство, и оно должно быть зарегистрировано в этом магазине, вне зависимости от того, что для приобретения контента может использоваться компьютер.

Очень часто можно услышать мнение, что «западные гиганты привязывают свои устройства только к своему магазину», но это не означает, что в их устройства нельзя добавить контент из стороннего репозитория, а говорит лишь о том, что «контент магазина не получить на устройства других производителей» на уровне механизма магазина.

Смысл сказанного сводится к тому, что в магазинах такого типа можно приобрести контент кому угодно и как угодно, но получить его можно только непосредственно на зарегистрированное устройство.

Отечественные магазины, в аналогичном случае, продают контент файлами, которые впоследствии можно скопировать в устройство для чтения по личному усмотрению.

 

Услуги операторов

«Операторами» можно условно назвать любой «вторичный магазин», который занимается не столько сбором контента для последующего распространения, сколько приобретает пакетное право у агрегаторов (на продажу контента). В большинстве случаев цены на книги не отличаются между магазинами и операторами.

Первыми «операторами» были компании занимающиеся предоставлением услуг сотовой связи, от них и появилось определение.

Операторами могут быть различные компании, которые предлагают цифровой контент для своих потребителей в качестве расширения ассортимента услуг и преимуществ перед конкурентами. В зависимости от деятельности оператора, предоставление контента может оказаться основным видом деятельности. То есть, выступая посредником, оператор зарабатывает на качестве своего сервиса.

Чтобы это легче понять, достаточно представить «кабельных операторов», которые перепродают телевизионные каналы целыми пакетами, создавая для зрителя необходимые условия для просмотра.

 

Библиотеки

В отличие от магазинов, библиотеки могут распространять контент бесплатно. Это ничего не говорит потребителю о законности распространения контента, но указывает в явной форме, что контент может быть публичным и бесплатным. Если библиотека осуществляет именно такой вид деятельности, то оговорки здесь будут уместны, так как есть исключения.

Некоторые библиотеки устанавливают платный доступ к книгам и условия распространения контента могут существенно отличаться в зависимости от легальности и популярности репозитория.

В большинстве случаев, библиотеки можно рассматривать как «бесплатные магазины» распространяющие контент в том виде, в котором легче всего воспринимается локальным рынком для привлечения массового внимания к ресурсу.

Существуют не только популярные и универсальные библиотечные ресурсы, но и тематические. Они, как правило, размещаются на небольших серверах, имеют небольшое количество книг и преследуют единственную цель — как можно шире представить контент в определённой тематике. Подобные библиотеки могут размещать книги по «кулинарии», «авиации» и «флоту» или чему-то ещё в этом роде.

Библиотеки не только символ бесплатного контента, в современном мире они стали синонимом «пиратства». Они могут игнорировать законные ограничения на копирование и принадлежность произведений их авторам. Обоснований для рождения и существования таких библиотек много — от «ощущения восстановления справедливости» до элементарного «энтузиазма» и даже ради «желания прославиться».

Библиотеки были первым и важным этапом зарождения цифрового контента. Этим занимались энтузиасты. Именно они смогли первично насытить и создать условия для зарождения «электронных книг», но не все из существующих библиотек можно отнести к этому определению. Каждая (из исторически известных) добавила в развитие электронных книг что-то своё, уникальное, добавила преимущества и оголила недостатки «авторского права».

В отечественной истории ряд библиотек стал фактическим полигоном для развития формата FB2. Именно они доказали необходимость и живучесть идеи «создания формата», который «отражает разметку книг», а не пытается быть всёопределяющим стандартом, содержащим в себе всю необходимую типографику документа. Со временем эти библиотеки трансформировались в легальный магазин, который таким же образом стал новым полигоном для развития уже не только формата FB3, но и легального контента.

Если при разработке чего-либо всегда есть вероятность появления ошибок и возможность их последующего устранения, например, при создании формата книг, то отечественный рынок стал негативно воспринимать аналогичную деятельность при формировании новых и непонятных (пока) моральных основ. Тем более при учёте несовершенных юридических законов в области авторских прав, которые уже не отражают все вероятные способы распространения контента.

 

Торренты и файлообменные сети

Существующие файлообменные сети формируют список для распространения цифрового контента. В большинстве случаев такие сети являются ещё одним вариантом распространённого понятия «библиотеки», где основной упор делается на доступности и универсальности контента и даже на возможности пакетного скачивания файлов. Эти сети в меньшей степени интересует чёткая библиотечная структура, так как для популярности среди пользователей они расширяют сервисные функции обмена файлами, не ограничиваясь узкоспециализированным контентом.

Если «торрент сети» являются трекером контента и содержат только ссылки для скачивания между пользовательскими компьютерами и серверами, то файлообменные сети специализируются на хранении и распространении любых файлов на своих серверах. В некоторых сетях такого типа существует оплата за услуги, как на уровне регулярных платежей, так и на уровне скачивания одного единственного файла. Обоснований для этого больше, чем в библиотеках и торрент сетях.

Современным вариантом файлообменных сетей — являются «облачные сервисы» (анг. «Cloud»). Они предоставляют пользователям владеть дисковым пространством в сети, выкладывать файлы не только для частного использования, но и предоставлять к ним публичный доступ, в том числе без какой-либо защиты от скачивания.

 

Копирование

Копирование — наиболее распространённый приём для записи копии файла с одного носителя на другой. При копировании содержимое файла копируется в одном месте и записывается в другом. Сам термин предполагает, что исходный файл сохраняется полностью, а на новом месте появляется только копия документа, иначе применяется термин «перенос информации», то есть с одного места в другое с удалением исходного материала.

Синонимами «копирования» могут являться выражения: «клонирование», «дублирование» или «заимствование» в зависимости от применяемого способа, программного обеспечения или просто привычек пользователя называть данную операцию конкретным термином.

В английском языке используется слово Copy для копирования и Move для переноса информации.

В момент копирования, или до операции, может понадобиться конвертация данных по разным причинам. «Исходник книги» может быть в неподдерживаемом формате или когда требуется перевод в машинный код устройства.

При использовании некоторых видов операций применяется термин «прямое копирование», когда подразумевается клонирование оригинала непосредственно в устройство.

Различные модели устройств могут использовать наличие копии файла не только на внешнем носителе, например карте памяти, но и во внутренней памяти. Она является частью конструкции и неотделима от устройства, в отличие от карты памяти. При наличии сразу двух типов памяти, пользователь самостоятельно определяет для себя наиболее удобное расположение файлов для дальнейшего чтения. Наличие сразу двух копий в разных областях памяти приводит к двойному отображению книг в устройстве, и они воспринимаются как два различных документа. При таком размещении файлов, в некоторых устройствах невозможно определить расположение книги внутри устройства, в других случаях рядом с названием книги можно увидеть небольшую пиктограмму с символом расположения файла. Ряд устройств позволяют видеть только одну область памяти — либо внутреннюю, либо карту памяти, что не позволяет запутаться, но и не даёт возможность виртуального объединения всей коллекции книг внутри устройства.

Подобный дискомфорт могут привнести одинаковые книги в различных форматах. Совершенно нет необходимости копировать книгу в нескольких доступных пользователю форматах. Достаточно выбрать один, наиболее удобный при чтении с устройства.

Операция «копирование» может осуществляться несколькими способами.

При локальном копировании файла наиболее простым способом является соединение компьютера и устройства между собой посредством кабеля USB. Пользователь определяет один или несколько файлов для копирования внутри компьютера и копирует их в устройство. Простота операции зависит от привычек пользователя, используемой операционной системы и файлового менеджера. В большинстве случаев пользователь просто перетаскивает мышкой файлы из одного места в другое. Операция проста и визуально понятна.

Кроме применения кабеля USB, для копирования можно использовать запись непосредственно на карту памяти, для чего необходимо вынуть её из устройства и подключить к картридеру. Это специализированное приспособление для чтения и записи карт памяти. Надо учитывать, что далеко не во всех устройствах пользователь имеет прямой доступ к карте памяти и данная операция может потребовать больше времени, отчего она становится сложной и дискомфортной. Если карта памяти находится внутри устройства или под трудно открываемой крышкой лучше использовать само устройство для чтения как картридер, используя кабель USB.

Теоретически, при наличии Wi-Fi или Bluetooth в устройстве и компьютере, копирование книг можно осуществлять с помощью «синхронизации» какого-то раздела. Практически, ничто не мешает эту же операцию применять при наличии кабеля USB или картридера. Необходима специализированная программа, такая как GoodSync или похожая.

Программа GoodSync удобна, так как имеет развитые возможности и существует для нескольких компьютерных платформ. C другой стороны, наличие огромных возможностей и относительно высокая цена могут подтолкнуть пользователя, чтобы найти другую аналогичную программу — более удобную или более дешёвую.

Лучше всего, если устройство умеет работать с директориями для наиболее комфортного копирования и дальнейшего чтения книг.

Программа для синхронизации создаёт точную копию структуры, выбранного в качестве источника раздела, и все файлы размещаются в устройстве в соответствующую директорию. При наличии нескольких форматов одной книги, во время синхронизации можно задать шаблон по расширению файла. Например, AZW, PRC и MOBI файлы копировать в устройство Kindle, в то время как другие файлы будут игнорироваться. Подобное можно применять до тех пор, пока пользователь не сменит устройство на модель другого производителя.

Надо помнить, что программа для синхронизации будет воспринимать удалённые в устройстве файлы как отсутствующие и постарается восполнить этот пробел, скопировав недостающий файл в нужную директорию.

Современным способом копирования является сохранение файла из Интернета непосредственно в устройстве, минуя компьютер или другой носитель. Все это возможно, если устройство имеет доступ в сеть при тандеме встроенного модуля связи и браузера. Некоторые модели для чтения могут в качестве браузера применять встроенную оболочку для магазина книг. В таком случае происходит аналогичная операция копирования.

При использовании Интернет для копирования, пользователь может добиться независимости от компьютера, что не скажешь о Wi-Fi, которому лучше предпочесть 3G, так как он не требует наличия специализированного оборудования, но устройство должно поддерживать этот тип связи.

Наличие в устройстве Wi-Fi или 3G само по себе не говорит о том, что оно пригодно для копирования книг через Интернет. Довольно много случаев, когда наличие модуля связи лишь увеличивает стоимость устройства, но не даёт никаких преимуществ. Кроме того, не каждый пользователь покупает книги в том магазине, на который рассчитано устройство. Чаще всего это происходит из-за локальных ограничений авторских прав или отсутствия необходимости в иностранной литературе. В таком случае, лучше подбирать устройство, в котором есть обычный браузер, и скорость его работы не станет ограничением при навигации по различным сайтам.

Некоторые производители могут поставлять с устройством специализированную программу для каталогизации книг и копирования их в устройство. Подобные программы существуют двух видов:

1. В качестве замены файлового менеджера и удобства доступа к магазину книг, но при использовании компьютера.

2. Если программа конвертирует книгу в пригодный для чтения формат, с последующим копированием файла в устройство для чтения.

Существуют довольно схожие по значению программы от сторонних разработчиков. Например, программа Calibre от Ковида Гояла (анг. Kovid Goyal) или популярная, но устаревшая BookDesigner от Валерия Войцеховского. Последнюю имеет смысл использовать для устаревших устройств, таких как Palm, REB, SoftBook и так далее.

Программа для конвертации может быть необходима ещё по одной причине, если устройство не читает популярные форматы напрямую, а используется готовый машинный код для чтения. Таким образом, все основные вычисления для отображения текста на экране производит компьютер, а не устройство, которое по этой причине может работать быстрее и это при том, что оно оснащается конструктивно более слабым процессором и программным обеспечением. Довольно часто этот метод использовался для преобразования готовых электронных книг в формат, пригодный для чтения в простейших сотовых телефонах с поддержкой Java или для чтения книг в устройстве SoftBook в формате IMP.

При определённых видах копирования могут возникать характерные ошибки, которые встречаются довольно часто, причём в устройствах различных производителей.

Прямое копирование на устройство с помощью кабеля USB может быть затруднено из-за того, что компьютер «не видит устройство» или карту памяти.

В случае использования Mac OS X ошибку исправить порой невозможно, просто потому, что таким образом создано устройство, но копировать можно непосредственно на карту памяти, которую Macintosh абсолютно точно увидит, если нет проблем с чтением (в основном из-за дефекта носителя).

В случае с компьютерами под управлением Windows происходят сбои с драйверами системы, а не потому, что производитель не предоставил таковой (хотя, теоретически подобная ситуация тоже возможна). Если Windows использует неверный драйвер, который установил ранее, то подключённое к компьютеру устройство опознать не получится, его «не видно». Для исправления ошибки необходимо удалить драйверы, используя «диспетчер устройств» и Windows повторно установит необходимые «правильные» при повторном подключении устройства к компьютеру.

 

Покупка на носителе

До начала массового использования Интернет распространение книг на «физическом носителе» было популярным источником цифрового контента. Он распространялся с помощью карт памяти, USB накопителей или посредством копирования с любого физического носителя, который был популярен для конкретного времени в истории, например, CD, HDD и так далее.

В современном мире физические носители становятся все менее популярным видом распространения контента. Переосмыслению подвергаются не только электронные книги, но и целые индустрии развлечений — кино, игры, музыка и так далее.

В большинстве случаев контент на физическом носителе можно приобрести в розничных магазинах или с помощью курьерской доставки из какого-либо онлайн ресурса, где им далеко не всегда является типичный интернет-магазин. Некоторые файлообменные сети могут предлагать такой вид сервиса.

В книжных розничных магазинах покупка на физическом носителе оправдана, но далеко не всегда это является удобной формой сервиса. Для такого вида деятельности обычно адаптируют компьютер в зале магазина, в котором сначала нужно выбрать книгу, потом оплатить на кассе и только в самом конце всей процедуры скопировать файл на физический носитель покупателя. В редких случаях можно встретить «специализированные торговые киоски» для продажи контента.

Исторически, когда тиражирование контента на физическом носителе стала очевидной выгодой, и это казалось естественным способом защиты от копирования, некоторые магазины и производители специализированных гаджетов предлагали готовый контент «в коробке». Для приобретения цифровой книги достаточно было приобрести, например, карту памяти или так называемый «картридж», на котором уже заранее был записан выбранный потребителем контент.

До сих пор этот метод практикуется среди продавцов электронных словарей и GPS навигаторов, игровых консолей и так далее. Подобный механизм рано или поздно погубит популярность этих устройств и даст возможность более расторопным конкурентам привязать потребителей к своей продукции, только благодаря наличию современной и более доступной формы распространения контента. Кроме того, в розничных магазинах уже практически нет места на полках для «цифрового контента в коробках».

 

Частные и локальные источники

Существуют частные и локальные источники получения контента. То, что называется «из рук в руки». В большинстве случаев это не означает, что эти источники являются авторами произведений, а могут быть просто файлами из «частной коллекции». Так обмениваются между собой несколько пользователей, которые используют распространение контента в публичной форме. Для копирования используется частная переписка с помощью электронной почты, файловый обмен по сети, копирование с физического носителя и так далее. Некоторые пользователи создают в локальных сетях публичные директории для обмена контентом и доступ к ним ограничен рамками сети, а также знанием о существовании источника.

«Частным репозиторием» можно назвать желание владельца файла выложить произведение в публичный доступ и при наступлении события «частная форма» преобразуется уже в совершенно иную, для которой «частные» юридические определения уже не применяются.

 

Оцифровка книг

Определение оцифровки, причём только бумажных книг, не совсем точное определение. Процесс предполагает носитель в качестве источника, а им не всегда является только бумага. В современном мире существует несколько типов носителей информации — бумажные книги, экран компьютера, графические файлы, сайты, мультимедийные издания и так далее.

Более точное определение процесса «оцифровки книг» — это создание или использование готовой графической копии страницы в одном из соответствующих форматов. Например, TIFF, JPG, PDF, DJVU и PNG с последующим (не всегда обязательным) распознаванием текста и перевод результата в электронную форму для дальнейшего копирования, тиражирования, хранения и в том числе перевод первичной копии в другие цифровые форматы необходимого для использования типа.

Самый популярный способ оцифровки — перевод растрового изображения в цифровой формат книг. Среди форматов могут быть графические — PDF, DJVU, форматы для комиксов — CBZ, CBR, текстовые — TXT, FB2, EPUB, PDF, HTML, DOC и так далее. Как правило, графические форматы не являются масштабируемыми. Они сохраняют пропорции и размер исходной страницы вместе с содержимым. В них и довольно часто, для компактности сокращают пустые поля страницы, чтобы текстовое окно, как образ книги, лучше вписывался в экраны мобильных устройств.

Оцифровка книг — это ещё один возможный источник получения электронного контента для чтения.

Оцифровка книг применяется для различных целей. От личного использования до профессиональных нужд. Как хобби и вид заработка. Для наполнения библиотек и магазинов контентом. Довольно закономерное правило — чем больше контента продаётся или распространяется бесплатно, тем меньше используется оцифровка для создания электронного контента. Этот вид деятельности переходит в узкоспециализированное русло для увлечённых людей и профессионалов. В то же время, наполнение библиотек происходит путём обмена, а не создания новых цифровых копий.

Магазины и музейные архивы активно оцифровывают книги по нескольким причинам, основным из которых является недоступность цифровой копии у правообладателя, ограниченное количество или старинные книги, исходный материал создавался не цифровым набором.

Владельцы копий узкоспециализированной литературы не стремятся создавать для массового потребителя контент, источником которого являются редкие книги. В этом случае цифровая копия создаётся для изучения книг без ущерба их первичного носителя, не только со стороны читателя, но и для исключения разрушительного воздействия воздуха, света, различных газов, паразитов и так далее. Редкие цифровые копии книг и рукописей чаще всего находятся в рамках исторических архивов и библиотек.

Электронные книги, как файлы, создаются несколькими способами: прямая цифровая копия из подготовленной профессиональной или иной вёрстки, а также оцифровка бумажной книги или другого источника в электронную форму. Устаревшей формой оцифровки можно признать ручной набор текста и диктант.

Не всегда и везде оцифрованная книга должна и может содержать текст, который возможно впоследствии масштабировать и даже редактировать, в том числе применять конвертацию в другие текстовые форматы электронных книг. Оцифрованные книги могут быть факсимильной копией, то есть графически точно отражать вид бумажной страницы.

Текстовые книги получаются с помощью распознавания текста. Применяется метод OCR — оптическое распознавание символов (анг. optical character recognition). Страницы книги предварительно сканируются в графический формат, и впоследствии текст распознаётся с помощью специального программного обеспечения. Точность распознавания зависит от качества шрифта, контраста текста, наличия дефектов и графических иллюстраций. Финальное качество, в большинстве случаев, контролируется корректорами, которые сверяют текст между первоисточником и цифровой копией.

(Довольно много разногласий между специалистами OCR вызывает необходимость или возможность сохранения опечаток в цифровой копии, которые имели место в бумажной книге).

Подготовленная цифровая книга трансформируется в один из текстовых форматов. Впоследствии можно преобразовать готовую книгу в другие популярные форматы, с возможной потерей вёрстки, так как не все из них поддерживают совместимый набор разметки текста и иллюстраций. Первично выбранный формат зависит от предпочтений оцифровщика и использования технологической цепочки для последующей трансформации. Чаще выбирают форматы с развитой структурой разметки.

Графические книги создаются за счёт точного образа страницы или факсимильной копии с помощью оптического прибора, чаще с помощью сканера, реже с помощью фотоаппарата. Метод выбирается за счёт определения скорости преобразования, и вероятного вреда, который может быть нанесён первоисточнику внешним освещением, нагревом или физическими изломами оригинала.

Каждая страница отсканированного материала — это графический файл JPEG, TIFF или любой другой, в том числе контейнеры, которыми могут быть PDF и DJVU. Выбор формата зависит от дальнейшего преобразования множества файлов в один документ или наоборот, когда из одного файла создаётся множество промежуточных, для координации профессиональной обработки.

Сканеры существуют нескольких типов — отличаются скоростью работы, встроенными средствами распознавания, конструкцией и конечно размерами. Немаловажная разница заключается в цене решения при эксплуатации того или иного типа сканера и сложности управления процессом.

Малораспространённый тип — это ручные компактные сканеры, которые не точны, имеют небольшую скорость работы, за один раз охватывают небольшую зону изображения и не имеют встроенных механизмов автоматизации процесса. Но за счёт низкой стоимости, малого веса и компактности — применяются до сих пор. Они удобны для отдельных рукописей, страниц или только для сканирования подписи автора.

Другие типы сканеров являются стационарными приборами. Они подразделяются между собой на типовые, специализированные и профессиональные.

«Типовые» — они же массовый продукт, который существует в продаже, имеют компактные формы, тратят в рабочем режиме на одну страницу несколько секунд или минут. Точность и качество цифровой копии зависит в основном от прилегания исходной страницы на поверхности сканера. Для отдельных листов, существуют автоматические лотки для подачи бумаги, что увеличивает скорость работы, так как фактически не тратится время на смену листов первоисточника.

«Специализированные сканеры» — отличаются от «типовых» возможностью создания «бестеневой копии» с оригинала и они не всегда сканеры в привычном понимании. Позволяют «сканирование листа в край» даже для книг с корешком. Иногда имеют встроенное программное обеспечение для сбора отдельных копий в единый документ, хотя производители чаще прикладывают в комплекте со сканером программное обеспечение для PC и Mac. Такая работа более наглядна, происходит на большом экране компьютера.

Чаще всего, специализированные сканеры называют «книжными». Они относятся к планшетному типу. Наиболее доступными по цене и популярными среди потребителей можно признать продукцию компании Plustek. Модель OpticBook A300 позволяет сканировать не только в край, но и вплоть до A3 формата листа оригинала.

Профессиональные сканеры имеют большие габариты, скорость работы и отличаются методом сканирования.

«Планетарные сканеры» — это оптическая копия с помощью одной или нескольких фотокамер. Называются так из-за расположения камеры, как спутника над планетой, которой является сканируемый оригинал. Некоторые модели сканеров могут использовать две камеры, чтобы одновременно делать копию разворота страниц.

Компания Atiz выпускает популярную серию сканеров BookDrive, которые похожи скорее на небольшую фотостудию. Отличаются размером основной площадки, на которую помещается оригинал. Можно оцифровать газету или книгу, которые располагаются на основе под углом 90° между листами, а камеры направлены перпендикулярно в сторону каждого раскрытого листа, чтобы сохранить геометрию страницы без искажений.

Серия планетарных сканеров Microbox book2net от компании Xerox имеют одну площадку, где издание одним листом располагается на основании, а оптический прибор фотографирует только одну страницу или разворот, при том, что он должен быть максимально плоским, чтобы избежать теней на корешке.

Роботизированные сканеры имеют крупные габариты, обычно это готовый набор в шкафу, в котором есть все необходимое для автоматического сканирования целого издания — свет, оптический сканер, система для перелистывания страниц, компьютер для управления и узкоспециализированные сервисные функции. Сканируемое издание располагается под меньшим углом. Для увеличения производительности осуществляется съёмка сразу двух страниц разворота.

Компания Treventus уже несколько лет выпускает роботизированные сканеры ScanRobot, которые за короткое время могут оцифровать целые библиотеки при минимальном участии человека. Лицевая часть сканера может закрываться во время работы, чтобы исключить паразитную засветку от внешних источников света.

Планетарные и роботизированные сканеры работают с производительностью от 500 страниц в час, а лучшие модели способны сканировать на скорости до 3000 страниц в час.

После сканирования изображения с оригинальной страницы необходимо распознать текст и иллюстрации. Для этой цели понадобится специальное программное обеспечение, способное оптически и логически распознавать объекты в изображении. Сложность распознавания заключается в форме букв оригинала, контрастности изображения, наличия цветовых подложек, рисунков или сложной структуры вёрстки. В момент распознавания происходят типовые проблемы и ошибки для конкретного оборудования и программного обеспечения, которые специалист по OCR попытается компенсировать с помощью скриптов и проверки орфографии.

Скрипты — это самодельная надстройка для исправления ошибок. Именно подобное отношение отличает разных специалистов к качеству распознавания текста. Скрипты создают специалисты OCR для личного использования, и они актуальны только для личного метода распознавания текста и используемого оборудования. Подчистка текста нужна не только для исправления вероятных грамматических ошибок, но и для задания тексту базовой типографики.

Для автоматизации первичной очистки текста, можно рекомендовать программу OCR Pad от Валерия Войцеховского.

Компьютерными технологиями не ограничивается точность распознавания. Очень важную роль играют корректоры, которые считывают текст и сверяют его с оригиналом. Это очень важно, особенно для технической литературы.

Для ускорения процесса редактирования текста используется «распределённый метод» — части документа распределяются между группой корректоров. Этот способ позволяет вычитать книгу полностью за несколько минут, но не всем под силу организация такого процесса. Обычно используется веб-интерфейс, без необходимости устанавливать дополнительное программное обеспечение на множество компьютеров.

Для вычитки текста не обязательны профессиональные лингвисты. Обычно этим занимаются люди, наделённые вниманием и наблюдательностью. Важна не столько грамотность, сколько умение сравнивать печатный и электронный текст между собой, замечать разницу в технических опечатках, разницу между буквами и цифрами.

Художественная литература может считываться только для поиска орфографических ошибок.

В «OCR мастерских» небольшого размера «работают» парами. Обычно специалист по OCR является организатором процесса и сотрудничает с одним или группой корректоров. Группа существует на особом сочетании характеров и возможностей. При переходе к другому типу распространения готовых электронных книг, «мастерская» может распадаться, часть группы придерживается идеологических взглядов на свою деятельность.

В момент зарождения электронных книг, OCR-щики первыми протоптали дорожку для читателей к бесплатным библиотекам и собрали для них контент. Если библиотеки известны массовому читателю, то наполняли эти библиотеки не магазинные копии книг, а частные коллекции OCR.

Среди специалистов по распознаванию текста есть профессиональные объединения, свой кодекс, честь и прочее. Самой известной в отечественной истории была «OCR-группа Вадима Ершова», которая располагалась по адресу publ.lib.ru и работала изначально только для библиотеки Мошкова (других не существовало). Впоследствии форум группы Ершова стал местом сбора и общения профессионалов в области OCR.

Время идёт. Меняются приоритеты, интересы и источники оцифровки книг. Интерес к книжному распознаванию стал меньше и перешёл в профессиональное русло. Доля собственной оцифровки в бесплатных библиотеках значительно ниже доли копирования или «заимствования» готового материала. Поэтому, если кого-то интересует собственная оцифровка, то обычно это редкие и детские книги.

В последнее время часто оцифровывают с экрана компьютера, без использования сканера для бумажных книг. Таких любителей не много и пока это работает как «спортивный интерес» по взлому защищённых цифровых изданий.

Обычный читатель может самостоятельно оцифровать книгу, читать и вычитывать её в электронном виде. Частной заинтересованности в этом мало, слишком трудоёмко. Интерес быстро перерастает в «желание поделиться» оцифрованной книгой со всеми в Интернет. Так рождаются потоки новых книг и мелкие частные библиотеки. Хобби становится профессиональным занятием.

 

Законность приобретения книг

Любой существующий способ копирования контента — в любом случае подчиняется локальным законам государства. Незнание или вольная интерпретация законов не отменяет и не изменяет форму легальности распространения.

В современном мире, где Интернет не знает границ, определение локальности и законов конкретного государства является сложной и неопределённой задачей для реализации защиты авторских прав. Каждое государство может толковать нарушение законов исходя из моральных устоев, сферы политического влияния и межгосударственными договорами.

В большинстве случаев законы предусматривают пресечение нелегальной деятельности в рамках государства, собственных граждан и влияние на локальный рынок извне, если репозиторий не ограничивает свою деятельность самостоятельно в рамках конкретного региона.

Проще всего устанавливаются границы дозволенного в легальных магазинах, которые ориентируются на государственную принадлежность потребителя по биллингу платёжной системы.

Некоторые пользователи сети Интернет могут наивно предполагать степень легальности своих поступков. Например, выкладывают файлы для публичного доступа и сопровождают их сообщением: «данное произведение выложено для частного и образовательного использования», что не является оправданием нарушения существующих законов об авторском праве, а является лишь копией предупреждения заимствованной с легальной продукции и произвольной интерпретацией существующих локальных законов.

Некоторые файлообменные сети имеют «лицензионный договор с пользователем», где чётко написано, что «пользователь прямо соглашается c тем, что использует Ресурс на свой собственный страх и риск». Делается это — умышлено, чтобы владелец файловой сети мог избежать судебного преследования и умышленно перекладывает вину на пользователя. В большинстве случаев такая схема не работает, если ресурс предоставляет открытый доступ для просмотра содержимого сайта, даже без права копирования. То есть, наличие факта существования контрафактной продукции уже даёт право преследовать юридически, игнорируя желание ресурса прикрыть свои тылы «пользовательским соглашением».

Законность копирования основана на личной ответственности, вне зависимости от массовости в неверной интерпретации законов, мнений, суждений, используемых владельцами ресурсов, лозунгов и прочего. Что на самом деле может быть частью популяризации своего вида деятельности, и на самом деле никакого отношения к реальным законам и осуществляемым целям не имеет.

Развитые страны уже много лет контролируют копирование на уровне пользователя и фиксируют факт распространения путём определения направления потока данных. Например, в Германии и США это является отдельным видом бизнеса, когда сотрудники специализированных компаний доказывают факт нарушения авторских прав и направляют личное уведомление о возмещение ущерба. Если пользователь отказывается заплатить указанную сумму в определённые сроки, дело отправляется в суд с автоматическим увеличением финансовых претензий. В большинстве случаев конечный потребитель не хочет оспаривать свои действия в суде, если не преследует иные цели. Но такой подход отбивает какое-либо желание афишировать причастность к «пиратской деятельности», как минимум.

Задача юридических служб в зарубежных странах направлена на уменьшение популярности нелегального копирования через потребителей, в то время как отечественные правообладатели до сих пор оперируют понятием легальности по отношению к ресурсам. Метод создаёт обратную реакцию, объединяет единомышленников вокруг файлообменных сетей любого типа, не оказывая никакого влияния на их личную ответственность перед законом, увеличивая степень безнаказанности.

Несовершенство законодательной базы создаёт прецеденты для нарушения законов об авторском праве и увеличивает условную личную свободу при использовании «нелегального копирования», как естественную идеологию потребителей на современном этапе, в то время как исполнение существующего закона не рассматривается в качестве важного фактора для развития интеллектуальной собственности.

В качестве доказательства необходимости бесконтрольного копирования и несовершенства законодательства используется обоснование того, что авторские права имеют слишком большой временной период, что искусство должно принадлежать более широким массам, особенно среди так называемых классических произведений, что слишком высока цена за отдельный экземпляр и многое другое. Выбор и широта оправданий зависит от степени подготовленности, временных рамок, страны проживания, личных убеждений и многого другого.

Законность приобретения контента во многом зависит от степени развития отрасли. Это верно не только по отношению к электронным книгам, как к сегменту рынка. Во многом законность зависит от социального развития общества, от увеличения спроса на собственность в области интеллектуальной деятельности.

Законность тех или иных видов деятельности вырабатывается государством и обществом последовательно в течение длительного периода. От запретительных и карательных мер к более широкому, тонкому толкованию законов и их соблюдению.

Нарушение законов говорит только о том, что существующее авторское право не отвечает современным запросам общества на основные свободы и отсутствует умение поддерживать точное соблюдение законов на уровне государства, а также международных договоров.

 

Какие форматы лучше?

 

Общие сведения

Выбор интересной книги для чтения в электронном виде многие читатели начинают с пристрастия к цифровому формату. Это постепенно становится устаревшим представлением о ценности контента в той или иной форме, но до сих пор является актуальным представлением, потому что люди спорят и доказывают себе преимущество форматов исходя из доступности контента.

Каким-то образом потребитель выбирает лучший для него формат из всех существующих, потом это становится привычкой, и основной поток литературы читается в одном и том же формате независимо от того, что формат может быть неудобен для другого устройства, которое рано или поздно появится. Приверженность к формату не учитывает перспектив и более длительного хранения библиотеки в цифровой форме, в отличие от бумажных книг, где носитель является неотъемлемой частью контента. Любой существующий цифровой формат невозможно представить как «форму наследства». Контент в определённом формате живёт до тех пор, пока актуален «носитель» и «распространитель».

Довольно часто подобное происходит с плохо масштабируемыми форматами PDF и DJVU, которые не подходят для маленьких экранов и медлительных устройств. Например, пользователь начал привыкать к электронному чтению через эти форматы, читая на большом экране компьютера, собрав большую коллекцию книг и переведя собственные документы в электронный вид. Все это было удобно, красиво, классифицировано, наглядно, похоже на настоящую электронную библиотеку внутри компьютера и являлось откровенной гордостью владельца. Но когда пришёл очередной этап развития, захотелось читать накопленные файлы на мобильном устройстве, в этот момент — привычка, а не комфорт, берет вверх! Огромная библиотека оказывается не востребованной внутри маленького устройства. История повторяется. Начинается мучительное и длительное отвыкание от «самого лучшего формата» в пользу другого «лучшего», распространённого и популярного для конкретной платформы. После очередного накопления книг в электронной библиотеке, формат вновь становится незаменимым, а, следовательно «лучшим». Библиотека формируется заново различными способами конвертации и с помощью повторного приобретения.

Окунаясь в историю с головой можно проследить приверженность пользователей к «лучшим форматам» и к рождению популярных для локальных рынков и устройств.

 

Популярность форматов

В 1994 году Максим Мошков создал самую популярную (по тем временам) русскоязычную библиотеку Lib.ru. Со слов основателя: «начал с собирательства файлов, а читал бумажные книги». Будет интересно узнать, что Мошкова (тогда) «мнение окружающих об электронных книгах не волновало совершенно. Это стало объектом собирательства, коллекционирования. Файлы собирал, а читать не мог — глаза болели от обычных мониторов». По мнению Максима: «только сейчас, что-то меняется, когда оказалось, что эти файлы ещё и читать можно, причём без риска ослепнуть окончательно».

Тем не менее, к 2000 году это была самая крупная библиотека книг в формате TXT и не только на русском языке. Основной потребитель библиотеки использовал для чтения громоздкий компьютер, а небольшая часть пользователей уже тогда читала книги на мобильных устройствах, которые были доступны в продаже на тот момент.

На стыке веков родился самый популярный отечественный формат FB2. В его задачу входило создать структуру привычной книги в цифровой форме, а не контейнер в готовом виде, в котором прописано всё и сразу, на все случаи жизни, что обычно усложняет эту самую жизнь на различных устройствах.

Дмитрий Грибов, разработчик FB2, изначально создал структурированный формат на основе XML. У автора был перерыв в чтении бумажных книг, а потом резкий старт и пристрастие к электронной форме чтения, так как был виден иной смысл — не в накоплении файлов, а в комфорте чтения и хранении книг. С его слов: «начал читать — начал думать, как сделать действительно удобную библиотеку».

Для создания любви к «отечественному формату» была выбрана тактика «популяризация и привыкание». Для готового формата FB2 были необходимы потребители, которые его оценят. Сделать это можно, если предложить попробовать готовый контент в специализированной программе и желательно на мобильном устройстве.

В 2002 году, через 3 года после начала разработки формата, был представлен финальный вариант второй версии формата «Fiction Book», одновременно с открытием небольшой библиотеки fictionbook.ru. Программа Haali Reader (на тот момент) была максимально популярной на мобильной платформе и уже поддерживала первую и впоследствии вторую версию Fiction Book. Таким образом, Михаил Мацнев, как автор программы, стал ещё и соучастником в популяризации формата FB2.

Библиотека fictionbook.ru демонстрировала очень важную и главную цель нового формата — «удобство хранения книг с помощью FB2». Формат был задуман как «первоисточник контента», из которого можно автоматически пересоздавать книги в любых форматах. FB2 имеет структуру книги, а не готовое форматирование текста, всё остальное настраиваемо не только при чтении, но и при конвертации. Таким образом, создавалась «книга-исходник» в FB2 и через несколько секунд сервер её конвертировал в любые другие форматы. Соответственно для веб-сервера также автоматически генерировалась основная титульная информация привычной библиотеки — название книги, автор, обложка, анонс, различные коды для хранения и идентификации.

Изначально преимущество формата сводилось к тому, что достаточно «создать и опубликовать файл», всё остальное уже «известно как делать» и «что создавать». Это коренное отличие, которое позволяет расширять возможности структуры формата FB2 до бесконечности. Любой может вставить свою собственную ячейку с данными в существующую структуру контента для своих целей, причём устройства и программы будут считывать контент без искажения, он по-прежнему будет валидным, но они проигнорируют неизвестное, а создавший новую структуру удовлетворён новыми свойствами формата.

Чтобы стало понятно, можно легко придумать пример. Скажем нужно точно знать — какие книги надлежащего качества и кем проверенны. Вставляется пара тегов в готовый файл по правилам XML. Например:

<quality> атрибут качества </quality>

Теперь в программу каталогизатор достаточно вставить распознавание тега и добавления его в случае первичного осмотра.

Это так просто, что можно влюбиться!

Абсолютно очевидно, что страсть к книгам в простотелом формате TXT быстро подхватил FB2 и стал популярным сразу в нескольких странах Европы и Азии.

По историческим меркам подобный метод является классической формой популяризации формата (с любой точки зрения) — «популярному формату нужна платформа и доступность контента» и неважно кто это делает и как. При этом стоимость всего решения или отдельных частей не может учитываться и на самом деле являются абстрактными в полной мере.

Если контент можно не покупать (по какой-то одной или любой причине), то и устройство для чтения можно адаптировать из уже существующих у потребителя, а не приобретать специализированное, что не является обязательным решением, чтобы начать читать книги в электронной форме.

Это также верно, как если бы человек сам оцифровал часть или всю свою бумажную библиотеку. Мог бы начать читать сразу, на экране компьютера, не имея никакого доступа в Интернет или к ближайшему магазину электроники. Что есть, то уже может позволить читать в электронном виде. По крайней мере, с этого начиналось электронное чтение, и никто из энтузиастов не чувствовал себя ущербным по каким-либо причинам (или не сознается до сих пор, даже в частной беседе).

То есть, доступность платформы и контента позволяет сразу выбрать лучший формат для чтения с точки зрения потребителя. Очень важен первичный опыт, накопление литературы и выбираемая платформа.

Влияние на определение «лучшего формата» имеет массовый рынок в локальном и глобальном масштабе. Любой потребитель делится на несколько групп по уровню подготовленности и наличия желания в чем-либо разбираться.

Массовый рынок склонен к упрощению форматов, при том, что собственные возможности форматов путаются с развитостью программного обеспечения и устройствами.

Формат DJVU имел все шансы, чтобы стать популярным гибридным форматом, который содержит в себе не только графический образ страниц, но и текстовое дублирующее содержание, что значительно комфортнее для чтения на небольших по размеру экранах.

Например, корпоративные форматы ZINIO и PressDisplay (он же PressReader) содержат в себе сразу несколько возможностей:

• Графический образ страницы газеты, книги, журнала.

• Текстовый дубль для удобного чтения.

• Мультимедийные данные.

Но дело в том, что качество поддерживается не столько платформой, сколько источником, то есть сервером услуг (поставщиком услуг). DJVU фактически лишился этих свойств на массовом рынке, и пользователи сделали из формата контейнер для хранения графических образов печатных страниц, хотя хорошо осведомлены в вероятном существовании «OCR». И, тем не менее, они считают формат лучшим, хотя аналогичный результат можно получить в другом контейнере, даже в том, который ещё не родился. То есть, достаточно упаковать набор графических образов страниц, чтобы создать конкурента популярному формату.

Поэтому, «говоря абстрактно о преимуществе того или иного формата, следует точно представлять в нём текущий уровень качества контента».

Любой пользователь, попадая на сервер поставщика контента и сталкивающийся с тем, что книга предоставляется сразу в нескольких форматах, обязательно задаёт себе мысленный вопрос или пытается найти помощь со стороны — какой формат использовать, или какой из них лучше?

Лучшим всегда оказывает формат, который поддерживает устройство или программа для чтения, с учётом комфортного масштабирования или навигации. Родственные по возможностям форматы почти всегда можно конвертировать, если устройство имеет ограничения в их поддержке.

Можно смело утверждать, что для Kindle лучший формат — это MOBI (AZW, Kindle 8). Для Sony, Kobo, Barnes & Noble Nook и ряда других зарубежных устройств — лучше EPUB. Для отечественных и китайских устройств предпочтительнее формат FB2, а соответственно — лучше.

Форматы, защищённые DRM важны издателю, а конечный пользователь может забыть об этом «преимуществе», так как он не увеличивает комфорт чтения. DRM — это ключ на право чтения и ничего более.

Для крупных экранов и планшетных устройств подойдут любые форматы — текстовые и графические, так как экран может крупно показать читаемый фрагмент, а быстродействие и комфорт навигации позволяют быстро менять фрагмент на экране и листать страницы.

Очень трудно оценить лучший формат с точки зрения популярности, не имея точных цифр о количестве копий книг в цифровой форме. Может сложиться впечатление, что MOBI менее популярный формат, чем EPUB, хотя это не так и потребителей формата несколько десятков миллионов, что совсем не плохо! Иностранные производители, представляя свои устройства в России, очень часто включают поддержку FB2, не потому что формат является лучшим, а из-за высокой степени накопления контента в этом формате. И наконец, любой потребитель электроники скачивает с сайта производителя документацию в формате PDF и это за много лет превратилось в стандарт высокого качества поддержки и обслуживания потребителей во всем мире.

Не следует путать возможности форматов с программным обеспечением или гаджетами, хотя это надо учитывать при покупке устройства для чтения. Форматы сами по себе не осуществляют поиск по тексту, не начитывают его вслух. Это также верно, как овощи — ещё не готовый суп, а он, сам себя не съест и не похвалит!

 

Назначение форматов

Электронные книги описываются различными форматами данных, а их разнообразие зависит от назначения, возможностей, платформы, веса, кодировки, простоты или «универсальности» (последнее довольно часто субъективно). Потребителям не так важно уметь различать логически их принадлежность к целям и задачам, заменяя свои знания комфортом применения и доступностью контента в цифровом формате.

Очень важно понимать в какой формат пользователь может самостоятельно перевести свои документы, чтобы иметь возможность прочитать их с помощью различных устройств или с помощью специализированных программ. Не стоит отбрасывать в сторону возможность последующего редактирования оцифрованного документа. Если используется оцифровка книг, журналов или газет, а в последнее время ещё и статей из Интернета, то и здесь форматы могут использоваться по принципу простоты создания, архивирования и каталогизации, нежели целевого выбора и последующего комфорта чтения. Очень важно учитывать объем информации.

В результате контент может быть подготовлен фактически в любом формате, без определения качества, масштабируемости, «веса». Довольно часто использование форматов опирается на убеждение в принадлежности к чему-либо, чем на изначальную цель, которую закладывал в формат его разработчик.

Профессионалы могут поступать несколькими способами в зависимости от последующего качества применения и выделенных для этого ресурсов, в том числе и финансовых, а не только технических или людских:

• Создавать контент по природному происхождению и предназначению формата.

• Использовать формат ради последующей защиты, а не обязательного комфорта во время чтения.

• Или идти по самому короткому пути, как и обычный пользователь, упрощая создание цифрового контента, сокращая время, экономя бюджет. Для этого формат может быть выбран любой, лишь бы он мог быть доступен, и понимаем профессионалу.

• И самое неприятное свойство из всех перечисленных — неграмотность профессионала, который создаёт цифровой контент. Нет никакой разницы между созданием документа для чтения, но ради редактирования. Или наоборот, когда контент нужно сохранить для редактирования, а не для чтения в том виде, в котором невозможно создавать исправления и дополнения в тексте. На экране такой документ может выглядеть восхитительно и ради этого все создавалось неправильно.

Назначение форматов проще всего воспринимать правильно, если воспользоваться трактовкой термина — предназначение формата, определения того, ради чего нужно создать контент в определённом виде или, иначе говоря, «форме». В любом случае должна главенствовать конечная цель, которая сопоставляется с используемыми средствами (ресурсами в том числе) и возможностью последующего применения, хранения или всё одновременно.

Назначение форматов формируется за счёт нескольких свойств: возможности формата, предназначения, в которое включены свойства по созданию, редактированию и последующему чтению, причём следует учитывать конечную платформу для осуществления целей.

«Чтение» следует разделить на две части: комфорт функции и предварительный просмотр (ради ознакомления с материалом). Не всегда возможно совместить подобные свойства гармонично, или результат сводится к упрощению основной функции ради предварительного просмотра.

Здесь необходим реальный пример, чтобы чётко представлять различие.

PDF содержит в себе одну или множество страниц с контентом. RTF ничем не отличается в данном случае, хотя формат принципиально другой. Предварительный просмотр возможен с помощью вывода страницы на экран в любом объёме, то есть не обязательно демонстрировать всю страницу в полном размере. Достаточно видеть фрагмент, но при котором можно ознакомиться с содержимым, прочитать его или попросту рассмотреть. Сложность в том, что предварительный просмотр формируется по первой странице, по которой сложно определить содержимое всего документа. Всё это сводится к созданию крупной пиктограммы первой страницы.

Специализированные форматы содержат в себе дополнительные секции в структуре данных: анонс, трейлер, тизер.

Если представить электронную полку с книгами, то около обложек специализированных форматов можно вывести аннотацию, потому что она заранее известна и её не следует генерировать из основного текста. Прописана внутри данных и находится в специальной секции формата, а всем другим форматам доступна демонстрация обложки, создание крупной пиктограммы с текстом, случайное выдёргивание фрагмента после ключевого слова в тексте или после конкретной страницы и результат не предугадать заранее.

Основные предназначения форматов можно представить по типу:

• Просмотр — назначение форматов при просмотре подготовленного контента сводится к определению платформы для использования. Определяется электронный носитель или программное обеспечение для любого или специализированного устройства. Разница только в том, что создающий контент оператор подозревает конкретные ограничения при считывании формата.

• Возможности — определяются объёмом документа и разработчиком.

• Предназначение — предполагается потребителем и подразумевается разработчиком, который в свою очередь определяет степень открытости формата.

• Создание документа — определяется способом и его доступностью, технически и лично, или с помощью различных ресурсов, в том числе сторонней помощи (англ. «Freelance» — форма удалённой работы).

• Редактирование — определяются не только инструменты и программы для внесения исправлений, но и сама возможность, как часть предназначения формата. Для некоторых форматов возможности редактирования ограничены и могут применяться не для замены текста, а для редактирования графических образов и иллюстраций внутри формата.

Из указанных типов — все могут иметь ограничения в зависимости от технической реализации формата, которое сводится к защите данных (англ. «DRM» — технические средства защиты) или к сжатию определённых типов данных:

• Сжатие внедрения или связывания шрифтов и мультимедиа.

• Отдельное сжатие растровых изображений и текста.

• Сжатие самих «алгоритмов сжатия» растровых изображений.

• Использование встроенного механизма сжатия для всего документа и защита данных.

Назначение формата зависит от типа используемых данных:

• Векторные

• Графические

• Текстовые

• Мультимедиа

Каждый тип данных поддерживает цветовую модель или их гибрид: RGB, CMYK, Grayscale, Lab, Duotone, Bitmap.

В формат могут быть встроены или описаны для использования предполагаемые шрифты. Обычный и типичный набор: Times, Courier, Helvetica, Symbol, Zapf Dingbats. Можно описать шрифты по типам, а не конкретно по имени: рубленый, с засечками и символьный.

Для сокращения ошибок, но ограничения масштабирования, некоторый текст в формате может быть заменён на другой тип. Например, математические формулы описанные текстом с использованием символьных шрифтов могут быть заменены иллюстрацией. Таким образом, текст заменяется графическим типом данных. Такой подход изменяет набор инструментов для дальнейшего редактирования, и масштабирование текста может быть непропорциональным по отношению к иллюстрации.

Графические форматы могут масштабироваться на экране пропорционально изображению, но если страница сделана полностью в графическом виде, то масштабирование может быть увеличено за видимые границы экрана, тем самым используется не увеличение масштаба содержимого, а фрагментация страницы в другом масштабе. Графический текст поддерживает жёстко заданные границы полей и страниц, в отличие от текстовых форматов, которые могут увеличивать общее количество страниц в документе в зависимости от размера начертания шрифта.

В зависимости от формата данных внутри структуры документа некоторые форматы лучше использовать для определённого контента:

• TXT — используется только для текста без разметки, типографикой в данном случае будет заниматься программное обеспечение.

• EPUB, FB2 и MOBI — содержат в себе смешанный тип данных, поэтому подходят для масштабирования текста во время чтения с сохранением заложенной разметки. Типографикой будет заниматься программное обеспечение, но оно заранее знает выделение фрагментов текста. Переносы слов обычно не описываются форматом, и этим точно будет заниматься только программное обеспечение по запрограммированному алгоритму естественного языка текста.

• PDF — следует описать отдельно, так как формат хоть и можно отнести к графическому типу, из-за жёсткой разметки текста и иллюстраций, но при наличии текста внутри структуры возможно масштабирование с потерей разметки. Класс TextFlow описывает содержимое текста и внутри есть описание параграфа, ссылок, графики и разделителей.

• DJVU — графический формат, хотя может содержать в себе дополнительные элементы с текстовыми данными. Популярность формата привела к тому, что внутри документа фактически находятся только графические образы страниц и ничего более. С подобной задачей справится любой контейнер с набором иллюстраций в строгой последовательности страниц.

• CBZ и CBR — это как раз наглядный пример контейнера с графическими данными, где название файла соответствует номеру страницы (например, 001, 002, 003 и так далее). В качестве контейнера используются популярные архиваторы ZIP или RAR (последняя буква в обозначении формата).

Таким образом, форматы определяют тип используемых данных и по ним можно предположить предназначение форматов.

EPUB, FB2 и MOBI — современные форматы для чтения литературы в текстовом виде. Особой разницы для потребителей контента в них не заложено. Они в равной степени могут почти одно и то же. Изменение размера шрифта позволяет адаптировать текст под размер экрана носителя с учётом предпочтений конечного пользователя. Для профессионалов это форматы, в которых набор текста может быть сложен для табличных и формульных данных. Это трудоёмко и требует особого внимания и терпения. Часто эти типы данных конвертируют или сохраняют в графическом формате, чтобы сократить время набора и ограничить количество вероятных ошибок при сборке итогового документа. Таким образом, внутри масштабируемого формата могут быть данные, которые не подлежат масштабированию с переносом строк.

Графические форматы, к которым сейчас можно отнести почти всё, что в большей степени содержит факсимильный образ страницы, как правило, пригодны для печати. Удобство чтения форматов зависит от размера экрана электронного носителя. От комфорта — не только при увеличении или уменьшении фрагмента страницы, но и от скорости управления документом и этими функциями.

Форматы для комиксов CBZ и CBR хоть и являются полностью графическими, но лучшие существующие программы автоматически определяют границы кадров и могут по отдельности увеличивать на экране только их зоны. Не всегда возможно комфортное прочтение текста в «баблах», но это в основном в тех комиксах, которые создавались без учёта цифровой эпохи и были рассчитаны для чтения только в оригинальном размере печатной страницы.

Такие форматы как DOC или RTF годятся для последующего редактирования, но это ещё не значит, что программное обеспечение для чтения поддерживает функции не только полнофункционального редактора, но и даже самых простых возможностей — замены отдельных букв, слов, предложений и так далее. Из этого следует сделать вывод таким образом, что не существует универсально удобных инструментов для чтения и редактирования. В некоторых случаях функции доступны, но не обеспечивают должного комфорта.

Мнение об «универсальности форматов» — это тоже часть предназначения, но не их носителей. Например, PDF может быть удобен как формат с возможностью последующей распечатки на принтере или для чтения на большом экране компьютера, планшета, но плохо совместим с медлительными компактными устройствами, на которых удобно читать, но только в текстовом формате.

Поэтому, назначение форматов следует привязать между источником получения контента и носителем, где важным фактором, является «комфорт» приобретения и дальнейшего использования контента.

Полностью графические форматы JPG, PNG, TIFF и так далее, также могут применяться для чтения. Их назначение не будет отличаться от графических форматов описанных выше, но с очень важным ограничением — поддерживается только одна страница иначе это уже контейнер.

 

Проприетарность форматов

В начале взросления категории «электронные книги», приблизительно с 1998 по 2007 годы, существовала типичная схема развития, когда компания, выходящая на рынок, обеспечивала себя и для себя полный спектр необходимых элементов бизнеса: создавалось собственное устройство, формат, контент, доставка. Всё это необходимо было сделать с (почти) полного нуля или приобрести готовое, если такое вообще существовало. Это поведение можно было назвать трендом — компании хотели выйти на рынок электронного чтения и они сами создавали условия для решения конечной задачи, изобретая замкнутый круг полного цикла услуг и решений.

Именно в этот момент появилось несколько «проприетарных форматов» и это определение не совсем корректно с современной точки зрения. Потребители часто вводят себя в заблуждение, причисляя такие форматы к ущербному типу и даже являющиеся в чём-то непригодными для реального использования. В большинстве случаев это недостаток информации и выработанных привычек.

Необходимо рассмотреть несколько вариантов развития проприетарных форматов:

• Sony с самого первого устройства Librie использовала формат BBeB, специально разработанный компанией для собственных задач. Причём он делится на несколько типов — BBeB Book для книг и BBeB Dictionary для словарей. Книги существовали в двух вариантах — расширение файла LRF для книг BBeB Book и LRX для шифрованного варианта BBeB Secure Book. Если отбросить все эти нюансы в сторону и наглядно представить единый формат, в котором Sony распространяла книги и фактически заставляла конвертировать любые другие файлы в этот формат, чтобы прочитать на её устройстве, то это некий образец того, чем является проприетарный формат. Со временем BBeB не смог выдержать конкуренцию и устройства Sony стали использовать EPUB, а поддержка BBeB хоть и существовала в устройствах, но стала замалчиваться. Через несколько лет потребители полностью отказались от формата BBeB и даже забыли о нём. Потребовалось время, чтобы привыкнуть к новым правилам игры.

• Другой образец проприетарного формата — компания Amazon. Она не стала придумывать то, в чем за 3 года до появления первого устройства была не сильна и просто приобрела компанию MobiPocket заранее, со всем необходимым. Наследством стал формат MOBI и остальное, в том числе пригодились опытные специалисты по созданию и продаже цифрового контента, что до развития массового Интернета было попросту невостребованным. В контент больше вкладывали, чем зарабатывали. Amazon по тем временам использовала невероятный подход — она сделала формат незаметным. Он как бы есть — для тех, кто читает собственный контент, но его как бы нет — для тех, кто приобретает готовые книги в магазине Amazon. Формат MOBI, переименованный в AZW, существует до сих пор и развивается. Современным продолжением стал формат Kindle 8 с учётом мультимедийных данных, которые могут быть внедрены в контент. Для потребителя это по-прежнему «стелс-формат» (анг. Stealth — снижение заметности, распознавания, видимости), который есть и отсутствует одновременно.

О проприетарных форматах можно сделать важный вывод — это работает, когда формат становится массовым, востребованным внутри системы сервиса. Он не сдерживает развитие сам по себе, форматы развиваются исторически медленно.

Со страхами использования «проприетарных форматов» стоит разобраться отдельно.

«Проприетарный формат» — это принадлежность формата конкретному собственнику, как и права на дальнейшую разработку и использование на различных электронных носителях. Синонимами «проприетарного формата» можно считать свойства — закрытый, несвободный или частично свободный, частный, принадлежащий конкретному собственнику, необходимость лицензирования и так далее. То есть всё то, что можно ассоциировать с правами конкретного собственника, а не с понятием «технической ограниченности».

Сейчас определение «проприетарного формата» (по первичному значению) уже почти полностью стало размытым. Можно сказать, что существует только один формат MOBI, но, по сути, ничто не мешает читать книги в этом формате на других устройствах, если не используется защита контента, так как это требует регистрации носителя в определённой системе, что тоже технически возможно. Например, книги можно читать в устройствах под управлением операционных систем Android или iOS, и они могут быть сделаны кем угодно, а не только Amazon и не обязательно под брендом Kindle.

История показала, что устройства разделились на две группы по другому принципу: с поддержкой одного или множества форматов. Именно существование устройств с поддержкой одного формата является потребительским страхом или недостатком, причём на территории конкретного локального рынка.

В большинстве случаев, потребители многоформатных моделей устройств используют в 70 % случаях один единственный формат и какой-то ещё, то, что называется «на всякий случай». Например, 16 % потребителей читают в формате PDF, но внутри этой группы соотношение приверженности к одному формату сохраняет пропорции к использованию форматов. Найти устройство без поддержки PDF очень сложно, даже среди одноформатных устройств, это не говорит о качестве поддержки, просто как факт, а отсутствие поддержки DJVU довольно распространено даже среди многоформатных устройств, но также не говорит ничего о качестве чтения и дополнительных сервисов внутри устройства.

Самое интересное, что многоформатные устройства часто грешат качеством поддержки каждого формата в отдельности. Чаще это сводится к понятию «может открыть» и ничего более. Некоторые устройства поступают ещё более некорректно — очищают открываемый формат от лишних данных и тегов. В результате книга в формате FB2 может выглядеть на экране как «просто текст» в формате TXT, или лишена в какой-то пропорции различных возможностей — оглавления, поддержки таблиц и так далее.

Представить такую ситуацию с одноформатными устройствами сложнее. Как правило, они поддерживают 100 % возможностей формата и его структуры, а разница заключается только в количестве сервисных функций — наличие словарей, переносов слов по слогам и так далее, что не всегда определяется форматом или необязательно. Найти такие устройства без поддержки сносок фактически невозможно, другое дело, что это выглядит или работает не всегда так, как предполагается или хочется пользователю.

Чаще всего к одноформатным устройствам негативно относятся те локальные рынки, на которых исторически закрепилось желание обеспечивать себя контентом самостоятельно, но заранее не известен источник. Предполагается, что книги где-то есть и в каком-то конкретном или нескольких форматах. Эти локальные зоны не очень любят единые источники и воспринимают их как угрозу некой свободе выбора, слова и даже свободному распространению информации.

Если представить некий локальный рынок, на котором большинство читает в формате EPUB, FB2 или MOBI — разница будет заключаться только в частоте использования конкретного формата и доступности контента. Для конкретного рынка роль «проприетарного формата» уже становится не актуальной. Уже не так важно — какой формат главенствует, так как существование других форматов отрицается, недооценивается или менее распространено, что типично для локальных рынков.

Если представить устройство, которое поддерживает или будет использоваться для одного формата (и PDF ради самоуспокоения, на всякий случай), то оказывается, что в современном мире нет особой разницы между форматами на пользовательском уровне.

Представьте устройство, например от Barnes & Noble, которое поддерживает только формат EPUB. Есть ли разница с устройством от Amazon, которое поддерживает только MOBI? Точно также отечественный рынок с удовольствием использует в большинстве случаев только FB2 и не чувствует себя при этом чем-то ущербным.

Разница заключается только в предполагаемом доступном количестве контента в определённом формате. Но сегодня, когда книги в формате MOBI доступны не только в Amazon и никто не отменял конверторы, особой разницы между форматами уже нет. Существует различие в технической подготовленности и осведомлённости потребителей. Уже неважно насколько форматы проприетарные или свободные. Форматы становятся рекламой книг, устройств и сервисов.

Когда на отечественный рынок выходят мировые гиганты с собственными устройствами и программным обеспечением с поддержкой EPUB, ибо другое им неведомо, формат FB2 уже чувствует мощное давление, даже беспомощность, а развитие отечественных устройств не гарантирует преимущество только отечественному формату и это ведёт к забвению или к необходимости развиваться формату куда-то дальше, хотя для этого нет опоры и необходимости.

«Проприетарность форматов» становится выгодным мифом для продвижения товаров и услуг с собственными качествами, или попросту заблуждением потребителей. Существует очень много пользователей электронных устройств, которые не могут справиться с форматом EPUB с поддержкой DRM, хотя сам формат является свободным и очень распространённым. У таких потребителей схема работы с форматом типична — получить, загрузить и читать, и в эту схему не вписывается что-то другое, дополнительные действия. По аналогии с устройством — купил, зарядил и читай! Что ещё нужно знать, чтобы воспользоваться контентом? Всё остальное воспринимается как «отвратительный сервис» со стороны агрегатора или его контент— и сервис-провайдеров. Но такова реальность — потребители сами создают ложные убеждения в том, как это всё работает, и после этого, что естественно, остаются разочарованными результатом.

Но DRM сам по себе не проблема, если его правильно преподнести как сервис. Если программа для чтения защищённых книг настолько хороша, что пользователи её применяют каждый день, то потребитель не сталкивается ни с какими проблемами и не видит разницы между простым и защищённым форматом. Поэтому, очень важно, чтобы и распространители контента не заблуждались о качестве своего сервиса.

Для выбора «предпочитаемого формата» нужно определиться с источником контента и убедиться в том, как его поддерживает устройство для чтения. Всё остальное в современном мире уже не так важно, или устарело в определениях.

Сервис начинается с правильного выбора.

 

Форматы электронных книг

 

Общие сведения

При выборе устройства для чтения, причём можно сказать умышленно — «неважно какого», специализированного или только адаптированного для чтения (планшет, смартфон и так далее), потребитель сталкивается с серьёзной проблемой выбора подходящего «формата книг». Это очень важная характеристика, но на самом деле — довольно простая тема. Разобраться в ней не сложно, если мой читатель понимает свои потребности и не преувеличивает значение «форматов» для этих целей. Основы таких знаний помогут разобраться с уже имеющейся стереотипной информацией и понять, что является реальностью, а что только воображением, благодаря самосозданным мифам.

Формат книг — это как заклинание. «Печатный текст» с типографской разметкой упакован внутри магической оболочки. Но это всё происходит после того, как книга написана.

При чтении в нашу голову попадает текст в виде образов или значений. Эмоции и интонации «рассказанного сюжета» создают визуальное представление. Восприятие можно усилить или ослабить. Поставить акцент на фразе или разделить текст на главы. Как бы писатель ни поступил, он хочет донести до читателя не только определённый сюжет, но и смысл каждой фразы — шёпота, крика или даже сарказма.

Электронное устройство для чтения — сундучок для книг. Для множества. Самая простая форма упаковки текста в единый блок — архивирование. Эта процедура экономит место на диске, но не вмешивается в разметку текста.

Чтобы сохранить структуру печатной книги требуется набор «тегов» в начале и конце выделенной фразы, абзаца или только одной буквы. Чтобы устройство понимало, какая фраза в тексте относится к «названию главы», этот набор слов также размечается тегами, как «кавычками» — в начале и в конце фразы.

Каждый отечественный потребитель, или почти каждый, хочет иметь устройство, которое поддерживает максимальное количество форматов. Теоретически — это ничем не подкреплено, кроме желания купить универсальное устройство. Также думает производитель, неважно в каком формате будет читать потребитель, устройство будет рассчитано на поддержку большого количества форматов и это «на всякий случай».

Зарубежный производитель электронных книг, прежде всего, продаёт контент, а устройство это инструмент для чтения, носитель информации. Поддерживаются обычно только два формата: для книг и формат PDF, как средство для чтения «частных» документов и способ для привлечения новых потребителей.

Бумажная книга печатается на отдельном листе с двух сторон, и вся получившаяся стопка брошюруется в единый блок. Понятие «страница» для электронной книги — это видимый на экране текст и не более того.

Разные производители придерживаются собственные стандарты для «нумерации» страниц. Кто-то считает текст «экранными страницами» и при изменении размера шрифта количество страниц пересчитывается устройством. Таким образом, страниц становится больше или меньше. Другой производитель может использовать универсальную форму подсчёта, например, в процентах от общего количества знаков. В данном случае изменение размера текста, который влияет на количество привычных страниц, в процентном соотношении не меняется, но найти нужную страницу крайне сложно и для этого читатель ищет текст глазами. И наконец, метод, который использовался Amazon изначально для своего устройства Kindle — это крошечный блок, стандартизированный по количеству знаков, где учитывается только количество знако-мест (в том числе пробелы и знаки препинания), а не только то, что помещается на экране. При таком подходе очень просто переходить от одного устройства к другому, читая одну и ту же книгу, введя необходимое цифровое значение на экране. Количество страниц не зависит от размера букв или текстового окна (место для текста с учётом отступов от края страницы/экрана).

Электронная страница, на самом деле — это не отдельные листы текста, а длинный рулон. Даже абзац текста — это длинная череда слов и предложений оформленная единым блоком, где в начале и конце стоят теги. Впоследствии устройство разбивает текст построчно и постранично, используя разметку. Конечный тег даёт команду на осуществление какого-либо последующего действия. Например, если интерпретатор видит «конец абзаца», то следующее действие «начало нового абзаца». В то же время, не существует тега «конец страницы», вместо него интерпретатор сам определяет, нужно ли начать новую страницу, если следующий тег «название главы».

Внутри любого формата находится структура документа. Именно незнание структуры приводит к непониманию важности и бесполезности форматов для определённых задач. Например, очень трудно прямо ответить на вопрос: «какой формат лучше, например, FB2 или EPUB»? Ответ на самом деле зависит от доступности книги в одном из этих форматов. Тот и другой формат довольно легко конвертируются. FB2 может быть преобразован в EPUB и наоборот. Если внутри файла нет специфических данных для другого формата, то преобразование происходит без потерь.

По статистике — 16 % читателей использует только формат PDF. Трудно представить, но именно такое количество читателей в какой-то промежуток времени ограничивает себя чтением специфической литературы. Статистика увеличится ещё более серьёзно, если представить, какая литература читается в этом формате. Найти журнал в формате PDF гораздо проще, чем в FB2 или EPUB. Но те, кто покупает журналы и делает это регулярно, чаще читают в узкоспециализированном формате, который даёт представление не только для графических элементов, но и может содержать скрытый текст. Подобный ZINIO формат используется для специальной программы.

Основное отличие FB2 от других форматов заключается в том, что он был изначально задуман как разметка текста и ничего более. Внешним видом текста на экране занимается программный интерпретатор.

FB2 создан на основе XML для разметки текста. Разработчик формата придумал простой ход — исследовал строение книги и воспроизвёл его в тегах. Со временем часть тегов оказалась ненужной, а другая часть, наоборот, была добавлена.

Если посмотреть книгу в формате FB2 с помощью текстового редактора, то, можно будет увидеть содержание обычного TXT файла, где абзац окружён тегами. Также — глава, название книги, формулы, таблицы и так далее.

Можно считать, что EPUB — это некий, более коммерческий аналог FB2, но, по сути, читателю должно быть безразлично — какой из этих форматов использовать. Главное — это доступность книг. И очень важно, чтобы формат поддерживала программа или устройство.

Форматы книг делятся на три типа: «простой», «текстовый», «графический».

Ярким представителем «простого» типа можно назвать формат TXT. Ничего кроме текста и маркера «конец строки» (раньше, когда ещё знали, что такое «пишущая машинка», говорили: «перевод каретки»). TXT может быть в одной из общепринятых кодировок. Современное представление о форматах рекомендует использование кодировки unicode (UTF8) для поддержки множества языков и совместимости между платформами.

«Текстовый» тип, к которым относятся FB2 и EPUB, содержит в себе не только текст, но и оформительскую разметку, графические иллюстрации, ссылки и так далее. В таких форматах выделяется жирный и наклонный текст, таблицы и стихи, сноски и заголовки. Основное преимущество — возможность масштабировать текст по размеру, изменять расстояние между строками или регулировать «текстовое поле», то есть расстояние от текста до края экрана. Можно сохранять типографику даже при разбиении страницы на несколько колонок. Лишь бы это поддерживал интерпретатор текста.

«Графический» формат проще всего представить в виде «факсимильного» издания, когда с полученным текстом ничего уже сделать нельзя, кроме как увеличить фрагмент на экране. Считайте, что каждый лист это отдельная фотография, отпечаток или лист из факса. И в данном случае неважно, содержит ли PDF текст, а не его графическое изображение единой страницей. Функция Reflow позволяет масштабировать текст, если он есть внутри файла, но в ущерб вёрстки. Если текст верстался в отдельных окнах или колонках, то ничего хорошего при Reflow не получится. Текст смешается в нечитаемое пятно. В данном случае увеличивать лучше с помощью «лупы» для изменения размера изображения всего листа, а не отдельного текста.

Основным и распространённым «обманом» при выборе устройства с множеством поддерживаемых форматов — является игнорирование разметки. В списке характеристик может быть перечислено огромное количество форматов, но не факт, что они поддерживаются на должном уровне. В данном случае существует три градации качества: полное или частичное игнорирование тегов разметки, а также наоборот, полная поддержка разметки текста. Бывает так, что в характеристиках значится формат FB2, а на экране вместо него «простой текст» без разметки. Был FB2, а стал TXT. Интерпретатор удалил теги, тем самым облегчив себе задачу по выводу текста на экран. Это наиболее распространённый способ игнорирования тегов, разница только в том, сколько и какие теги игнорируются.

Сказанное не относится к сервисным функциям устройств, они везде разные. Их может быть много, ради увеличения комфорта чтения, а может быть мало, ради использования слабого процессора или за счёт элементарной лени разработчика.

Также, не стоит путать сложный интерфейс с богатством функций и настроек. Есть устройства, которые визуально отличаются интерфейсом, но делают одно и то же. Сложный интерфейс не говорит о том, что устройство может гораздо лучше, чем устройство с простым и понятным интерфейсом. Разработчики умышленно могут создавать сложные интерфейсы, чтобы вводить в заблуждение. Проще всего определять возможности устройства с помощью подсчёта количества функций: делает ли типографскую разметку текста, можно ли изменить текстовое окно, или расстояние между строк и так далее.

При выборе устройства нужно заранее предполагать, какой текст будет читаться и из какого источника будет доставляться контент. Если файл книги подготовлен профессионалом, то для чтения художественной литературы достаточно одного из форматов: FB2 или EPUB. И неважно, какого из них. Эти форматы ничем особым не отличаются от AZW (MOBI), который используется в Kindle. Особой разницы для потребителя в форматах нет, кроме распространённости их на локальном рынке.

Для более сложно-оформленного текста, такого, как научная или техническая литература, европейским читателям лучше использовать PDF или DJVU. Не потому, что эти форматы лучше, а потому, что именно в них обычно распространяются в Интернет. Разница в том, что иностранные издательства оформляют такие книги в «текстовом» формате, а наши читатели используют факсимильные копии, то есть, кем-то отсканированные постранично, как было в бумажном оригинале.

DJVU отличается тем, что в его составе отдельные листы страниц, упакованные в единый блок. Сканируется каждая страница книги в высоком разрешении и с последующим сжатием для компактности общего размера файла. Далее, страницы собираются в едином блоке. Подобный трюк можно сделать и в формате PDF, но DJVU прижился лучше. Оглавлением, индексом и прочими особенностями графических форматов, забивать голову не стоит. В большинстве случаев — это дешёвый и быстрый вариант копии бумажной книги.

Также работает CBZ и CBR — форматы для комиксов. Каждая отдельная страница в одном из графических форматов, например JPG, именуется по правилу «трёх цифр» — 001, 002, 003, 004 и так далее. Все отсканированные файлы упаковываются архиватором ZIP или RAR. Именно последняя буква в названии формата Z или R говорит о том, каким архиватором упакованы страницы.

Из сложного «текстового» формата почти всегда можно сделать «простой текст». В истории была только одна программа — BookDesigner, которая из TXT могла интуитивно создать сложную разметку текста. Она пыталась определить название главы, окончание абзаца, преобразование в наклонный или жирный текст. Это делалось не по воле и задумке автора книги, а как бы предполагалось программой, что так может быть, раз в тексте написано: «Глава 1» или абзац начинается с нескольких звёздочек: «***» или «* * *», если со знака «*», «—» или «» и абзацы повторяются — следовательно, используется перечисление неких характеристик или условий.

Ранее были тексты, которые распространялись в модемную, доинтернетовскую эпоху. Например, фраза могла начинаться и заканчивать знаком подчёркивания «_», тогда BookDesigner интерпретировал это как наклонный текст. И так далее, если мой читатель заскучал от перечислений, и стало скучно. Добавлю только, что подобную разметку сейчас называют «Markdown».

Пропорции экрана влияют на просмотр «графических» форматов. Для «текстовых» это абсолютно неважно — как заполнить буквами поверхность электронной страницы. Обычно пропорции рассчитывались по ряду Фибоначчи, или «золотого ряда» чисел. Каждый член этого ряда равен сумме двух предыдущих: 3, 5, 8, 13, 21 и так далее. Зная, что первыми идут цифры 3 и 5, легко догадаться, что следующей будет 8. И соответственно пропорциями страницы могут быть соотношения 3:5, или 8:13. Но не стоит это путать с размерами страниц, как в полиграфии, где книги могут иметь физический размер — от сверхмалой до сверхбольшой формы издания.

Это может показаться лишним знанием, когда нельзя выбрать пропорции экрана. Практически все экраны E-Ink на 5, 6 и 9.7, а также 13,3 дюйма имеют пропорции близкие к печатному листу бумаги и они почти одинаковы. Разница только в физическом размере. Исключение составляет экран размером 7 дюймов. Подобные устройства можно пересчитать по пальцам. Раз, два и всё!

Типографика — очень важна. Она влияет на настроение и интонацию передаваемого в печатном виде текста. Форматы обязуются доносить первоначальный смысл автора до своего читателя. Им не обязательно поддерживать ударения в словах или переносы по слогам. В большинстве случаев — это поддержка на уровне буквенной разметки и относится к интерпретатору.

При выборе «подходящего» для чтения формата очень важно определить, чем можно пожертвовать. Не все программы или устройства могут корректно и точно отображать не только иллюстрации, таблицы, но и теги самого текста. Есть часть читателей, которым это и не нужно. Мало того, они не могут сравнить несколько устройств между собой, поэтому считают лучшим тот, которым уже владеют.

При выборе устройства важнее знать, что ограничение поддержки качества и количества форматов — является умышленной жертвой или обманом производителя? Во всех случаях, в списках характеристик будет «безкачественное» (анг. «Without Quality») определение «поддержки и количества форматов».

Можно задать ещё один и не последний вопрос — влияет ли выбранный для чтения формат на продолжительность автономной работы устройства?

Если не учитывать некачественные устройства, сами по себе, то ответить надо так — все зависит от того, как и что делает устройство во время чтения. Устройство может брать «чистый» формат и перестраивать его отображение для вывода на экран. Для этого необходимы ресурсы процессора.

Есть и был — другой способ, когда форматирование создавалось в компьютере, а устройство получало не структуру книги, а готовый машинный код для отображения на экране. Таким способом экономится не только время обработки формата устройством, но и можно создать значительно дешевле железную часть электронного аппарата за счёт «слабых» процессоров и программного обеспечения. Нагрузка ляжет на источник возникновения книги.

Формат действительно влияет на продолжительность работы устройства, но честно говоря, это стыдно слышать и сообщать в XXI веке.

Если пользователь устройства не обременён вопросом «как читать» и больше волнуется о том «что читать» — можно легко понять, что важнее качество, а не количество поддерживаемых форматов.

Производители могут искусственно придумать собственные форматы и вписать их в характеристики устройства. Сделать на этой основе красивую рекламу — «мировой рекорд по количеству поддерживаемых форматов»! Но будет ли читателю легче от той мысли, что любая книга, в любом формате — открывается в течение нескольких десятков секунд? Этого не происходит с бумажной книгой, и быть не должной с электронной. Достаточно просто представить время открытия бумажной книги на нужной странице и опираться на этот показатель, как на «стандарт де факто».

После полученной информации о небольшом количестве перечисленных форматов следует задать последний вопрос — годится ли устройство для планируемой задачи?

Поддержку форматов конкретным устройством можно проверить в магазине или у реальных владельцев. Можно стать тем самым «другом», который купит первое попавшееся устройство и расскажет всем о его «преимуществах». Другие, надеюсь, постараются лично убедиться в качестве отображения текста на экране, прежде чем решатся на покупку. Приходите на встречи клуба «The-eBook» во множестве мест на этой планете и поинтересуйтесь не только мнением владельцев устройств, но и сравните их эмоции со своими ощущениями. Они могут быть и будут разными.

 

Краткое описание форматов

 

Популярные текстовые форматы

 

EPUB

ePub (Electronic Publication) — изначально открытый формат электронных книг, разработанный Международным форумом по цифровым публикациям IDPF.

Файлы в этом формате имеют расширение EPUB.

Первоначальный вариант — Open eBook Publication Structure или «OEB» был задуман в 1999 году, релиз EPUB в 2007 году и с тех пор остаётся самым популярным и распространённым форматом во всем мире по количеству публикаций.

Формат ePub используется, если электронный текст является основной и главенствующей частью документа. Формат удобен для быстрой публикации в электронной форме из подготовленной заранее вёрстки для традиционной печатной книги.

В последнее время экспорт в формат EPUB используется в популярных текстовых редакторах и специализированных программах для писателей.

Компания Adobe создала много предпосылок для того, чтобы профессионалы отказались от ранее популярной программы Quark Express и перешли на Adobe InDesign. Немаловажную роль сыграла поддержка финального экспорта в формат EPUB, как способ цифровой публикации.

Adobe активно продвигает формат за счёт популяризации собственного движка для мобильных устройств и средств защиты DRM. Подобную активность не следует путать с проприетарностью формата EPUB, который не принадлежит компании, но наличие собственного движка теоретически позволяет внедрять в формат не утверждённые стандарты, как и форсирование коммерческого использование EPUB3, так как единый рабочий движок может поддерживать спецификации всех современных версий формата.

EPUB позволяет издателям производить и распространять цифровую публикацию в одном файле, обеспечивая совместимость между программным и аппаратным обеспечением, необходимым для воспроизведения цифровых книг и других публикаций с «плавающей вёрсткой». Финальное формирование изображения на экране отводится программному обеспечению компьютера или устройства.

Контейнер EPUB содержит электронные тексты в форматах xHTML, HTML, описание издания в XML. Графические элементы, включая векторную графику (SVG), размещаются в директориях входящих в состав единого контейнера. Поддерживаются встроенные шрифты, таблицы стилей и т. д.

Официальный сайт: www.idpf.org

 

MOBI, AZW, KINDLE 8

AZW (сокращение от Amazon) — формат, который получила Amazon в качестве «наследства» от приобретения компании Mobipocket, буквально за 3 года до появления первого устройства Kindle. Этот формат — образец того, как Amazon планомерно и точно начала захватывать и завоёвывать рынок электронных книг. Все что сделала компания Amazon с самим форматом — переименовала расширение MOBI в AZW. Впоследствии компания начала самостоятельную разработку формата «Kindle 8» для поддержки мультимедийных изданий. Поддержка сторонними устройствами формата MOBI не означает, что они поддерживают Kindle 8, так как это совершенно разные форматы.

Файлы в формате MOBI для устройств Kindle имеют расширение AZW.

Формат AZW, если учитывать историю MOBI — является наиболее старым, известным и хорошо продуманным книжным форматом. Пользователям не стоит его бояться и тем более недооценивать. AZW поддерживается не только компанией Amazon. Книги в этом формате можно приобрести в отечественных онлайн-магазинах. Разница только в том, что Amazon не продаёт файлы «на вынос», а доставляет книги непосредственно в устройство для чтения, даже если покупка сделана на сайте amazon.com с помощью браузера настольного или мобильного компьютера. При таком способе, читателям не интересно и не нужно знать «какой формат поддерживает их Kindle». Устройства поддерживают «книги», а не «файлы».

AZW ничем не хуже и не лучше EPUB или FB2. Формат относится к той же группе форматов текстового происхождения с книжной разметкой. Поддержка DRM не является приоритетной для читателей и это качество AZW могут оценить только издатели.

Официальный сайт: www.amazon.com

 

FB2, FB3

FB2 (Fiction Book ver.2) — полностью открытый формат электронных книг, свободный от каких-либо отчислений, изначально разработанный группой энтузиастов во главе с Дмитрием Грибовым, Михаилом Мацневым и Марком Липсманом на протяжении с 1999 по 2001 годы. В 2002 году, через 3 года после начала разработки формата, был представлен финальный вариант второй версии формата «Fiction Book», одновременно с открытием небольшой библиотеки fictionbook.ru.

Формат создаёт электронную версию книг в виде XML-документов, где каждый элемент структуры книги обрамляется тегами, как «кавычками», в начале и конце каждого элемента. В отличие от некоторых других форматов — FB2 на данный момент не поддерживает DRM.

Файлы в этом формате имеют расширение FB2 или FB2.ZIP, если в качестве контейнера используется архиватор ZIP.

Стандарт призван обеспечить совместимость с любыми устройствами и форматами для воспроизведения цифровых книг и других публикаций с «плавающей вёрсткой». Документы содержат структурную разметку основных элементов текста, анонс книги, а также могут содержать вложения с двоичными файлами, в которых могут храниться иллюстрации и обложка. Финальное формирование изображения на экране отводится устройству или программе.

Для популяризации формата, Дмитрий Грибов основал открытую библиотеку с элементами автоматической обработки поступающих публикаций. В FB2 имеется информация о книге в виде, пригодном для автоматической обработки, а также для конвертации в другие форматы.

FB2 является предпочитаемым форматом для Восточной Европы и Азии. Формат используется как основа, из которой, возможно конвертировать одну книгу в несколько форматов.

FB3 — следующее поколение, контейнерный вариант формата, удобен для распределённой сборки документов, где отдельные части могут обрабатываться параллельно несколькими участниками вёрстки. Этот формат предрасполагает использование DRM, но на момент написания книги не поддерживается различными устройствами или программами.

Дмитрий Грибов до сих пор поддерживает разработку формата FB2 и контейнерную версию FB3, которая применяется только для внутренних целей и задач компанией Литрес.

Информационное сообщество: www.fictionbook.org

 

Специализированные форматы

 

PDF

PDF (Portable Document Format) — кросс-платформенный формат электронных документов, созданный компанией Adobe Systems с использованием ряда возможностей языка PostScript. В большинстве случаев формат предназначен для представления в электронном виде полиграфической продукции, факсимильных документов и анкетных данных.

Изначально программное обеспечение Adobe для чтения и создания PDF было платным, что делало формат непопулярным. Первая версия появилась в 1993 году.

Файлы в этом формате имеют расширение PDF.

Традиционным способом создания PDF документов является виртуальный принтер — печать в файл для распространения в электронной форме.

Формат PDF позволяет внедрять шрифты, векторные и растровые изображения, формы и мультимедиа. Поддерживаются цвета RGB, CMYK, Grayscale, Lab, Duotone, Bitmap и несколько типов сжатия растровой графики. Используется механизм электронных подписей для защиты и проверки подлинности документов.

PDF самый распространённый формат во всем мире для электронных публикаций в факсимильном виде. Этому формату приписываются лавры безбумажных технологий.

Размер документа PDF может быть абсолютно разным в зависимости от использования шрифтов, графики и мультимедиа. Для распространения через Интернет применяется сжатие данных и сокращение разрешения иллюстраций, в то время как для полиграфии используется точное соответствие размеров всех материалов для выводящего устройства. Чтобы ограничить чтение публикации только одним файлом — в документ «встраиваются» используемые шрифты и такое решение создаёт независимость и точность воспроизведения документа.

Официальный сайт: www.adobe.com/devnet/pdf/pdf_reference_archive.html

 

DJVU

DJVU (deja vu — «уже виденное», психическое состояние, при котором человек ощущает, что он когда-то уже был в подобной ситуации) — формат использует образ страниц различных изданий в графическом виде. Технология предполагает сканирование документов в высоком разрешении с последующим сжатием графического файла. Технология DJVU была разработана для быстрого создания цифровой копии документов без необходимости её вёрстки. Кроме того, DJVU как графический формат может быть использован не только для факсимильной передачи содержимого бумажной книги, но и для того, чтобы донести до читателя первоначальный цвет вёрстки, страницы и даже дефектов сканируемого экземпляра.

DJVU очень часто используется для создания научной библиотеки. Формат может быть заменён популярным PDF, но некоторые научные заведения используют формат DOC (Microsoft Word) для всех типов документов, в том числе для графических, что неверно, неудобно и, в конце концов — неправильно!

Файлы в этом формате имеют расширение DJVU.

Формат DJVU можно представить как набор страниц. Такая оптимизация позволяет читателю начинать чтение во время загрузки файла из сети, не дожидаясь окончания процесса копирования.

Так как DJVU графический и не масштабируемый формат, пользоваться им на небольших и неповоротливых устройствах проблематично. Лучше всего формат пригоден для чтения на компьютере, планшете или на чем-то подобном. Качество чтения на узкоспециализированных устройствах зависит от количества сервисных функций устройства и скорости его работы. Что в современном мире можно признать неудовлетворительным по качеству и комфорту чтения.

Официальный сайт: www.djvu.org

 

CBR, CBZ

CB*, где * первая буква архиватора применяемого для упаковки контейнера формата (сокращение от Comic Book Archive). Формат графических файлов в едином контейнере для чтения отсканированных страниц комиксов.

Идея формата была предложена разработчиком программы CDisplay для просмотра отсканированных комиксов. Программы для чтения не только показываю страницу комикса на экране устройства, но и сглаживают полиграфический растр, который сохраняется в файлах при сканировании.

Файлы в этом формате имеют расширение CBR или CBZ в зависимости от используемого контейнера созданного архиваторами RAR или ZIP. Кроме самых популярных форматов могут использоваться CB7, TOC, CBA в зависимости от применяемых архиваторов — 7z, TAR и соответственно ACE.

Формат состоит из множества отсканированных файлов в графическом формате, чаще в JPG, объединённых контейнером. Каждый файл отображает содержимое одной страницы книги с комиксами. Они имеют имя файла без расширения, состоящее из цифр, последовательно пронумерованные от 000 до 999, поэтому программы безошибочно определяют номер страницы, который совпадает с нумерацией файлов.

Это самый простой формат среди электронных книг, который можно создать самостоятельно, отсканировав каждую страницу комикса и упаковав соответствующим архиватором. Для преобразования CBZ в CBR достаточно переупаковать файлы архиватором RAR.

Для хранения дополнительной информации и комментариев используется отдельный XML файл, находящийся также внутри архива. Это может быть информация об авторах комикса или любые другие данные, которые необходимо сохранить с файлом цифрового комикса.

Коммерческие программы издателей могут использовать собственные форматы, отличные от Comic Book.

 

ZINIO

Zinio изначально создавался как проприетарный и узкоспециализированный формат с большими возможностями по адаптации к экрану разнообразных устройств, для публикации журналов и позже книг и справочников.

Файлы в этом формате имеют расширение ZNO, ZNA, устаревшее ZN~.

Известная по всему миру компания Zinio возникла в 2001 году в Сан-Франциско, США. Это первая издательская компания с глобальной сетью дистрибуции цифрового контента. Специализируется на периодических изданиях. До 2011 года компания имеет 26 глобальных прилавков на 33 языках мира, ежемесячно распространяла более 4 миллионов копий в более 200 странах мира, в продаже более 100.000 архивных изданий, а текущая розница составляет более 5.500 различных изданий.

Формат Zinio поддерживается только одной программой-киоском на различных платформах настольных и мобильных компьютеров.

Не все новшества платформы Zinio воспринимались пользователями равнозначно позитивно:

• Зональное масштабирование было привлекательной формой отображения для быстрого чтения одной статьи на нескольких страницах издания, которые не помещаются на одном экране. Для смены фрагмента достаточно было сделать одно нажатие по клавишам клавиатуры. Подражание двухпальцевому увеличению фрагмента на устройстве iPad изменила простоту чтения больших статей.

• Некоторые издания доступны только на определённой платформе, поэтому, чтобы исключить путаницу, журналы лучше приобретать непосредственно на выбранной платформе.

Формат Zinio много раз и безуспешно пытались взломать для нелегального чтения изданий.

Программное обеспечение Zinio включает в себя несколько разделов: чтение, киоск и помощь в выборе изданий. Для новичков предусмотрено бесплатное ознакомление с популярными изданиями.

Появление встроенного киоска в операционной системе Apple iOS сократило интерес к Zinio на этой платформе, но формат по-прежнему остаётся лучшим инструментом для чтения журналов.

Официальный сайт: www.zinio.com

 

PRESSDISPLAY, PRESSREADER

PressDisplay и впоследствии PressReader — являются не столько форматом, сколько готовой платформой для чтения крупноразмерных и регулярных изданий, каковыми являются газеты.

NewspaperDirect Inc. основана в 1999 году, а её всемирно известная платформа PressReader является мировым лидером в многоканальном, кросс-платформенной дистрибуции контента и монетизации. Имеет партнёров среди 3500 издателей из 100 стран мира.

PressReader предоставляет частным потребителям и предприятиям доступ к тысячам местных, национальных и международных газет и журналов через Интернет. Чтение доступно не только с помощью настольных компьютеров и обычного браузера, но и на мобильных устройствах под управлением операционных систем: iOS, Android, Android для Amazon, Windows 8 и Blackberry 10.

PressReader имеет масштабный и длительный опыт для предоставления газет для чтения среди миллионов читателей на 60 языках мира. В некоторых странах издания PressReader могут быть найдены в ведущих библиотеках, гостиницах, авиакомпаниях, корпоративных и правительственных зданиях, круизные линиях, залах аэропортов, школах и ресторанах.

Формат PressReader позволяет читать не только факсимильно изданные газеты и журналы, поддерживается считывание статей в отдельном окне и даже озвучивание текста.

Официальный сайт: www.pressdisplay.com (устаревший), www.pressreader.com (обновлённый)

Владелец: NewspaperDirect.com

 

Форматы для персональных документов

 

DOC

DOC (сокращение от Document) стал известен и популярен благодаря фирменному приложению Microsoft Word, так как до этого текстовые файлы не использовали разметку документа.

Файлы в этом формате имеют расширение DOC.

Существует несколько вариантов формата и полная совместимость поддерживается только на уровне корпорации Microsoft. Довольно часто сторонние программы используют в DOC только необходимые элементы форматирования, тем более, когда это касается программ и устройств для чтения. Тем самым говорить о полной поддержке специализированными средствами невозможно. Поддержка формата не гарантирует, что каждый файл DOC будет в равной степени отображаться на различных устройствах и тем более не все файлы можно хотя бы открыть для прочтения.

Данный формат лучше всего использовать для чтения пользовательских документов и это удобно для вычитывания текстов. Удобно для юристов, менеджеров и всех, кто много работает над изучением различных текстовых материалов.

DOC относится к проприетарным форматам. В 2008 году Microsoft сделала доступной спецификацию формата, но использовать информацию можно только в некоммерческих целях. Позже Microsoft попыталась перевести формат в «отрытую для обсуждения спецификацию», что довольно спорно, так как использование возможно с ограничениями.

Официальный сайт: www.microsoft.com

 

RTF

RTF (сокращённо от Rich Text Format) является текстом, который «обогащён» разметкой. Формат нельзя путать с DOC, хотя он также является синонимом компании Microsoft и является проприетарным форматом. Изначально создавался в соавторстве группы программистов из Microsoft и Adobe для редактора Word в 1982 году, который существовал как самостоятельный продукт, не входящий в состав привычного современного представления о Microsoft Office.

Файлы в этом формате имеют расширение RTF.

Через 3 года после появления формата RTF отношения между двумя компаниями Microsoft и Adobe были временно испорчены. С этого момента Adobe продолжила развивать разметку текста, заложенную в спецификацию RTF, и создала в 1985 году очень мощный язык разметки PostScript, который до сих пор используется не только для разметки текста, но и для описания очень сложной полиграфической вёрстки. В качестве формата для редактирования текста, RTF оказался проще и легче, но для профессиональной вёрстки, PostScript стал форматом де-факто.

Формат RTF довольно прост и лаконичен в своей структуре, но то, что генерируют из текста специализированные программы, уже прочитать глазами не возможно, слишком много управляющих тегов и последовательностей.

RTF часто служит в качестве формата для переноса размеченного текста из одной программы в другую. Практически все текстовые редакторы поддерживают обмен информацией через экспорт и импорт в формате RTF.

В отличие от DOC, специализированным устройствам для чтения считывать формат RTF проще, но он не заслужил себе популярности и используется в основном как источник для чтения пользовательских документов. Ряд тегов и последовательностей будут утеряны во время чтения, так как устройства умышлено, игнорируют слишком обогащённую разметку. Программное обеспечение предпочтёт вывести разметку текста, которую можно адаптировать на экране, а не уделять внимание оформлению одной буквы красивым шрифтом.

За очень редким исключением, RTF фактически не поддерживается легальными источниками распространения контента. Они предпочитают либо один единственный формат, либо набор из популярных на локальном рынке.

Разработчик: www.microsoft.com

Соавтор начальной идеи: www.adobe.com

 

TXT

TXT (текстовый файл) — распространённый формат в виде компьютерного файла, содержащий в основном текстовые данные, символы «конца строки» и «табуляции».

Файлы в этом формате имеют расширение TXT, но могут использоваться и другие расширения, так как для этого формата большую роль играет содержание, а не расширение файла. В списке характеристик специализированных устройств поддержка данного формата всегда осуществляется только через указание расширения TXT.

Отличительная особенность формата — отсутствие какой либо структуры текста и её типографики. На экране устройства или программы отображается только текст.

Некоторые программы, такие как Book Designer, в состоянии интуитивно изменить структуру «текстового файла» опираясь на подсказки в тексте. Программа реагирует на слова «Глава» или «Часть» в короткой и отдельной строке, чтобы преобразовать из простого текста простейшую книжную разметку.

Специализированные устройства, напротив, не делают преобразование текста в лучшую сторону, но могут очищать разметку текста до состояния текстового файла в формате TXT. Это не значит, что устройство поддерживает более сложные документы, такие как FB2 или EPUB, но демонстрируют поддержку TXT и возможность «открыть» указанные в характеристиках форматы, хотя бы до качества TXT.

Формат TXT считается универсальным, его поддерживает максимальное количество устройств и программ. Основные проблемы использования связаны с кодировкой текста и unicode версия признается самой универсальной формой распространения текста.

В качестве символа «конца строки» могут применяться «жёсткие» и «мягкие» переносы строк и их комбинации.

 

Устаревшие форматы

 

BBEB (LRF)

BBeB (англ. Broadband eBook) — формат для хранения и отображения текстовых данных, разработанный компанией Sony и Canon.

Файлы в этом формате имеют расширение LRF и LRX (для шифрованных данных).

Формат первоначально разработан для фирменных устройств Sony Libriй и впоследствии поддерживался Sony Reader, пока компания не внедрила поддержку формата EPUB и впоследствии вообще закрыла направление по выпуску устройств для чтения из-за финансовых проблем всей корпорации.

С 2010 года книги в формате BBeB были преобразованы в EPUB.

Официальный сайт: www.sony.com/reader

 

Копирование контента на носитель

 

Общие сведения

Описание разнообразных способов доставки контента на конечные носители может показаться слишком простой информацией, чтобы уделять ей должное внимание. Именно недооценка, как бы, простой задачи может повлиять на ограничение комфорта в регулярном чтении. Электронные книги в большей степени ассоциируются с мобильным и автономным чтением, то есть, на отдельном устройстве, которое можно использовать без привязки к месту, как обычную бумажную книгу в любой типовой позе и обстановке — сидя, лежа, стоя и как-то ещё. В таком случае могут появляться виртуальные и физические посредники в доставке контента, что с одной точки зрения упрощает доставку, делает её наглядной и понятной, с другой стороны влияет на возможность получать контент независимо, дистанционно и в удобное время ради сокращения расходов.

Здесь необходим конкретный пример, который объяснит плохо уловимую суть задачи по доставке контента.

Очень часто устройства, не имеющие жёсткой физической привязки к точке распределения контента, могут восприниматься, как некие самостоятельные устройства для совершенно других задач, чем заложили в них разработчики. Устройства только с Wi-Fi привязаны к конкретной точке доступа и отличаются от устройств, которые имеют ещё и 3G и более современные 4G (LTE) и прочие модули связи, которые появятся позднее. Каждое из этих устройств подключено к глобальной сети через средства связи. С другой стороны, устройства вовсе «идентичны», разница только в доступности сетевого протокола связи, в том числе и в стоимости решения. Ранее и в некоторых случаях до сих пор, устройства с сетевыми функциями воспринимаются как «мобильный браузер», «почта» и что-то ещё, вместо того, чтобы их воспринимать как получателей контента без проводов. Разработчик пытается «освободить устройство», сделать его независимым от проводов, а получает претензии к качеству браузера. При этом есть задачи по доставке контента, которые нельзя решить с помощью проводов или только Wi-Fi.

Существует множество способов доставки контента в целевой носитель. В данном случае следует разделять компьютер и мобильное устройство, так как последний может получать контент не напрямую из источника, а через промежуточный пункт доставки. Им может быть не только различные протоколы, используемые в Интернете, но и физические носители, такие как карты памяти, USB накопители, внешние диски и подобное.

 

Доставка контента из источника

За время развития электронных книг были перепробовано множество способов по доставке контента. К некоторым пользователи привыкли, о некоторых знают, но есть такие, когда знания отвергаются из-за пренебрежения к технологии или от того, что пользователи не могут распознать новые варианты доставки как существующие и покупают устройства с 3G (или современнее) ради совершенно других задач. Было время, когда контент доставляли и распространяли физически, что сейчас не понять, когда Интернет работает 24 часа в сутки. В любом случае, если физическая доставка устарела, она может применяться до сих пор при конкретных условиях — удалённость объекта, объем контента, секретность и так далее.

«Быстрая доставка контента» активно развивает категорию «электронных книг», услуг в этой области, универсальные платёжные системы и создают обоснование для постоянного подключения к Интернету.

Приблизительно до 2005 года, (а то и до 2007 года, смотря как считать и для какого локального рынка), появление компаний, которые хотели зарабатывать на продаже контента, создавая отличные устройства для чтения, даже по современным меркам, терпели финансовый крах. Их активно и многократно поглощали другие компании. То есть, пока Интернет не стал массовым явлением, компании «бежали впереди поезда», тратили напрасно деньги на разработку устройств, так как они были востребованы только энтузиастами в этой области. В этих условиях выживали компании, такие же энтузиасты, как и их потребители, но конечное решение было откровенно дорогим. Потребители вошли в «новую эпоху» с привычной по тем временам отметки в «$500 за устройство».

Массовый Интернет развивал не только легальный контент, но и пиратский. Если до 2005 года контентом занимались только энтузиасты, которых можно пересчитать по пальцам в любой стране, то после этой даты источники распространения росли стремительно, как на дрожжах. Появились универсальные и специализированные библиотеки.

До 2005 года энтузиасты изначально пытались заполнить пустоту, которую не хотели или не могли наполнить контентом владельцы авторских прав и производители устройств. После 2005 года тотальное большинство энтузиастов пыталось легализовать свою деятельность различными способами:

• Сократили или изменили количество контента и ассортимент.

• Организовали коммерческие организации по распространению контента, так как энтузиасты уже создали целую структуру, в которую вошли координаторы, организаторы, идейные вдохновители, оцифровщики контента, специалисты из полиграфии, издательств и прочие.

• Незначительная часть энтузиастов, вовсе отказалась от работы с контентом, сосредоточившись только на информации в этой области, или перешла на работу в специализированные компании.

• И последняя категория энтузиастов сосредоточила своё внимание на государственных или коммерческих проектах, субсидируемых или дотируемых организациями. Большинство людей в этой области оказались новичками и мало знакомыми с книжной спецификой, способами хранения, редактирования, пополнения и распространения. Именно для накопления первичного опыта им понадобились опытные специалисты.

При развитии Интернет стало очевидно развитие дистанционного обслуживания потребителей и накопление контента. Появились компании, которые превратили свою деятельность в цифровой центр, став посредником между глобальной сетью и местами на карте, где никакой связи не существует до сих пор.

Доставка контента «без проводов» является наиболее перспективным направлением развития электронных книг, так как обеспечивает контентом быстро и с минимальным количеством фактических и условных посредников.

 

В устроийство или в компьютер

Какой бы способ доставки контента не существовал до сих пор или мог бы появиться в будущем, всегда будет работать только два варианта целевого назначения:

• Контент доставляется через компьютер и совсем неважно, будет ли дальнейшее потребление внутри целевого носителя или на другом устройстве, будет ли через эту точку осуществляться последующее распространение или это конечное место хранения контента. В этом варианте компьютер универсальная форма посредника, когда назначение контента неважно или предполагается универсальный формат документа, а как его использовать, остаётся на выбор пользователя. Доставку через физический носитель можно также причислить к этой целевой группе, так как в большинстве случаев обмен контентом будет осуществляться через компьютер, иначе в нем не было смысла изначально. Ничто не мешает записать контент на карту памяти, которую временно вынули из мобильного устройства.

• Другой вариант, когда контент всегда поставляется на конечное устройство, с которого будет осуществляться последующее чтение, в обход компьютера и вопреки желанию пользователя хранить контент где-то ещё, хотя он вполне может храниться в компьютере или где-то в локальной сети. Этот способ можно трансформировать и рекомендовать как промежуточный вариант беспроводного обмена между компьютером и устройством, через сеть, в которой есть сервер для хранения контента или только в качестве передающего механизма. Это невероятно удобно, если вариант получения контента представить некой формой зарядки устройства от сети без проводов вовсе, или отсутствие необходимости размещения его в специальной док-станции! Когда можно не привязывать устройство к компьютеру и не иметь его вовсе, как необходимое условие для получения контента, а круглосуточное подключение к сети обеспечивает теоретическую возможность получать контент в любое время и на любом расстоянии от компьютера, который в данном случае не нужен.

Ни один из этих вариантов не является ущербным, менее современным или наиболее лучшим. Потребитель сам выбирает вариант обмена и доставки контента в зависимости от средств, времени или особых условий эксплуатации мобильного устройства для чтения. Чтобы разобраться в различиях, необходимо рассмотреть конкретные примеры использования. Среди них может оказаться такой, который ранее не предполагался, как возможный.

 

Прямое копирование

В любом случае контент должен попасть в зону видимости программного обеспечения и устройства, будет храниться на физическом или логическом носителе.

• Физический носитель — предполагает наиболее близкое расположение контента и в этом варианте является автономным, живущим вместе с носителем и зависящим от него. Файлы могут располагаться во внутренней памяти устройства или на внешнем носителе, который подключён к устройству, например, карта памяти, внешний диск. Причём варианты подключения внешнего носителя без проводов и располагающиеся в одном корпусе с устройством наиболее предпочтительны с эстетической точки зрения, они не нарушают понятие «мобильность» и «целостность». Появление внешних дисков со встроенной сетевой раздачей Wi-Fi или Bluetooth больше подходят для массивного контента, такого как аудио или видео, но не для маленьких по размеру текстовых файлов, которых и на 1 Гб памяти может поместиться очень много. Исключением можно считать хорошо иллюстрированные книги, которые больше походят на «презентации», чем на классическое чтение с картинками. Им понадобится много места, особенно, если во время чтения будут использоваться сразу несколько книг, между которыми постоянно происходит переключение. Подобное возможно для планшетных компьютеров, но не для существующих специализированных читалок. Внутренняя память устройств, как правило, ограничена в своём размере и не всегда может быть расширена за счёт внешнего носителя, хотя для объективности следует знать, что подобное не всегда требуется в виду избыточности первоначальной ёмкости для актуального контента. Здесь, вероятно, следует разделять предназначение устройства для чтения контента и его продолжительного хранения. Если есть задача носить с собой всю доступную пользователю библиотеку, то памяти для хранения понадобится неопределённо больше.

• Логический носитель — раньше считалось, что подобный термин больше подходит к разбиению информации на отдельные пространства внутри одного физического носителя. Например, файлы на диске, но в разных директориях. Или, диск один, но разделён на несколько логических. И так далее. Сегодня привычный термин лучше трансформировать в понятие «условный носитель», так как информация может располагаться где угодно в рамках компьютерной системы. Когда появилась компьютерная компания SUN, что расшифровывается «Stanford University Networks», а переводится как «солнце», основатель Вэн Пратт на долгое время оказался в одиночестве из-за рекламного лозунга компании: «The Network is the Computer» (рус. «Сеть — это компьютер»). Сейчас, после 30 лет существования компании, трудно представить, что-то иное, кроме истинности утверждения! Кроме того, сеть не только компьютер, но и возможность вести независимый от рабочего места образ жизни. Контент может располагаться где угодно в сети, причём независимо от локальности и глобальности соединений. Современный пользователь привык существовать в рамках Интернет и может быть независим от своего местоположения на планете. Облачные сервисы хороший пример не только для хранения контента, но и его синхронизации с устройствами, причём лучшие сервисы эту операцию проводят в момент доступности сети и простоя устройства, а также «мгновенно» по требованию владельца. Сеть хороший посредник для доставки контента «без проводов», чем не могли обладать первые в мире устройства для чтения, в корпус которых был встроен Ethernet, и это позволяло доставлять новый контент в устройство, а не комфортное дистанционное хранение.

Термин «прямое копирование» контента больше подходит для проводных соединений между компьютером и мобильным устройством. Но так как Интернет становится неотъемлемой частью жизни, то и сеть теперь является прямым подключением к целевому устройству, если на пути нет посредников в виде промежуточного копирования.

«Прямое физическое копирование» может осуществляться с помощью проводов, док-станций, через карту памяти и так далее. В любом случае контент должен быть скопирован между двумя физическими носителями информации напрямую.

«Логическое копирование» может осуществляться произвольно — автоматически или «по требованию». В этом способе главный акцент нужно делать на сохранности и управляемости копиями на сервере, если они там хранятся, иначе следует понимать, какая копия является конечной, то есть единственной, если необходимо что-то удалить из устройства. Если сервер является только передаточным звеном, то удаление контента в устройстве окажется невосполнимым.

При физическом копировании могут возникнуть проблемы с чтением защищённого контента. Использование Adobe DRM требует регистрации устройства в не очень удобной программе Adobe Digital Editions, и копирование контента происходит через этот, условно говоря, «каталогизатор». Копирование такого контента простым перетаскиванием файла, мышкой уже не работает.

Подобной проблемы при сетевой доставке контента практически не бывает, при условии, что источник контента и есть регистратор устройства. Пользователь просто получает контент на устройство и вообще не задумывается о его защищённости и формате данных. В данном случае надо понимать, что первичен контент, а не его свойства.

 

Использование внешнего носителя

Внешний носитель контента может быть различным — от физического диска или карты памяти до хранения контента на сервере или в облачном хранилище. В некоторых случаях книги можно никуда не копировать специально, кроме как в устройство непосредственно из источника. Книги в онлайн-магазине будут храниться до тех пор, пока он существует и всегда можно скачать их повторно.

Существует законный страх, что книги могут пропасть. В историческом плане все солидные магазины перед закрытием извещают клиентов, что все их покупки можно скачать по отдельности или единым архивом до определённой даты, или приобретённые книги передаются новому собственнику магазина, который был продан другому владельцу, он и будет осуществлять дальнейшую поддержку. И так далее. Вариантов и тонкостей достаточно много.

Использование внешнего носителя не означает хранение контента, как архива, подразумевается, что нечто внешнее является постоянно доступным местом для считывания данных. Например, карта памяти — это внешнее хранилище, но постоянно подключённое к устройству, иначе действительно следует подразумевать хранение, а не эксплуатацию информации. Аналогично нужно относиться к сетевым устройствам, при условии, что они максимально доступны в момент считывания контента.

Здесь есть достаточно большая разница между внешними носителями. Необходимо понимать, как работает устройство или программное обеспечение с удалёнными источниками.

Обычно узкоспециализированные устройства копируют или получают от сервера контент «на борт», (в состав устройства), то есть некий файл станет локальным источником контента, а не удалённым. Так работает большинство легальных магазинов.

В другом случае существует вполне законный метод чтения на экране без копирования. Например, чтение через браузер или в библиотеке «без права выноса книг» и так далее. В этом случае устройство постоянно получает только часть данных для отображения на экране. Объем получаемой информации может быть различным, от одной страницы до бесконечности. Чем больше информации переносится в устройство из удалённого источника, тем легче считать возможным чтение в режиме «offline», то есть «без подключения к сети» (или дословно: «отключённый от сети»). Этот вариант чаще используется легальными библиотеками или подписными службами. Они шифруют и защищают контент в локальном хранилище устройства, или изменяют его до «отсутствия привлекательности», чтобы предотвратить нелегальное распространение контента.

Нелегальные источники контента, которые принято называть или считать «пиратскими», могут поступать с контентом как угодно и предоставлять пользователю файлы в любом виде и на любых условиях. Здесь основная задача «раздавать» и «без посторонних мыслей о правомочности поступков». Комфорт доступа к такому внешнему носителю может быть различным и в том числе не уступающим по качеству коммерческим ресурсам.

В последнее время набирают популярность «облачные сервисы». Это «виртуальная флешка» при наличии доступа к сети. Кроме коммерчески успешных проектов, таких как Dropbox и корпоративных вариантов от известных компаний, например, Apple, Microsoft и других, относительная дешевизна устройств NAS позволяет создавать частные облачные сервисы. Они могут быть не только источником доступа к контенту, но и ещё одним вариантом обмена и синхронизации файлов.

И ещё один из самых простых вариантов сетевого доступа к контенту может быть внешний и автономный диск с сетевой функцией. Обычно они не имеют больших габаритов, обладают встроенным аккумулятором для длительной работы без зарядного устройства и поддерживают один или целый набор сетевых протоколов.

В любом случае, вероятность использования внешнего носителя показывает, что потребители в большинстве случаев выбирают самые простые варианты и это с точки зрения компактности и общей цены владения. Всегда гораздо проще использовать карту памяти, чем внешний диск, даже если подключение к нему осуществляется без проводов. Даже использование карты памяти не всегда оправдано, если устройство уже имеет достаточно много свободного места во внутренней памяти или если человек предпочитает только читать на устройстве, а не заниматься коллекционированием файлов. В большинстве вариантов достаточно иметь оптимальное количество книг внутри устройства, соответствующее ритму чтения, с учётом характерной продолжительности отсутствия доступа к источнику контента и ничего более.

Для каждого потребителя размер чтения является уникальной характеристикой. Кто-то предпочитает приобретать новую книгу, когда уже прочитана предыдущая. Кто-то заранее запасается целым набором книг. Кто-то хочет скачать все подряд, а выбирать уже в устройстве.

Стоимость и простота любого решения — довольно относительные характеристики, тем более, когда есть желание увеличить стоимость решения за счёт наличия внешнего носителя.

 

Получение контента через интернет

Интернет стал очень популярным техническим средством обмена и распространения информации. Но её роль гораздо шире, если учитывать влияние информации на качество жизни людей. Электронные книги не могут существовать и тем более конкурировать без глобальной сети. Это очень важное условие для развития категории.

Интернет можно использовать не только для распространения информации, но и для освобождения от привычной привязи к компьютеру. Ещё в начале XXI века все устройства, в обязательном порядке, заряжались от электрической сети. Со временем зарядные устройства и док-станции освободили своё место обычному кабелю USB, с помощью которого устройства не только заряжаются, но и получают контент от компьютера. Стало возможным заряжать устройства не только от сети, но и от слаботочных источников.

Сегодня Интернет позволяет взглянуть на привычные вещи несколько под другим углом, отменяя провода и привязь к компьютеру, как к локальному устройству. Удешевление мобильной связи и расширение сетевого покрытия даёт ещё большую свободу в обмене информацией, и доставке контента. Траффик от контента настолько ничтожен по объёму, что например, Amazon оснащает свои устройства для чтения бесплатным модулем 3G, который исправно работает в нескольких десятках странах. Конечно, «бесплатность» услуги довольно условна, так как продажа контента компенсирует затраты за щедрую попытку раздать Интернет всем страждущим. Тем не менее, встроенный модуль 3G в Kindle позволяет компенсировать отсутствие всего — компьютера, роутера, проводов и прочего, а главное желания все это иметь ради того, чтобы только читать. В этом случае бумажные книги гораздо привлекательнее хотя бы по конечной цене.

Такой вариант уже почти невозможен, но существует, поэтому будет интересно узнать об одном интересном способе доставки контента, который компенсирует не только отсутствие всего, но и желание разбираться с приобретением контента через устройство.

Достаточно представить пожилого, одинокого или оторванного от «цивилизации» человека. Каждое устройство Kindle имеет регистрацию и привязано к учётной записи. Устройство имеет уникальный почтовый адрес, причём он привязан не к географическому месту, а к устройству. Таким образом, дети, родственники и друзья могу посылать книги как электронное письмо с прикреплённым к нему контентом. Как только письмо добирается до сервера Amazon, контент помещается отдельными книгами в облачном сервисе, в выделенном пространстве, который закреплён к адресу получателя. Книги с сервера будут получены целевым устройством в любое время, когда устройство в режиме простоя, умышленно запрашивает новый контент или попросту включено и готово к работе.

Вариант отправки контента через электронную почту очень удобный сервис, но существуют варианты использования.

• Kindle получает контент всегда с сервера, поэтому письмо с контентом «вскрывается и проверяется» сервером и только после этой процедуры перемещается в личное пространство пользователя в облачном сервисе Amazon Cloud.

• PocketBook напротив, никуда не помещает присланный по почте контент, а переадресует его на целевое устройство. То есть, в этом случае контент не хранится и повторной загрузки книг в устройство не будет.

Технически оба варианта делают одно и то же, но по-разному. Amazon не делает разницы между тем, каким образом контент попадает в устройство и об этом чуть ниже.

Пересылка контента по электронной почте позволяет переадресовывать книги на различные устройства, в том числе расположенные в другом месте, подключать их к другим источникам контента и пользоваться функцией «послать книгу по email». Контент можно послать со смартфона, планшета или компьютера. Всё что нужно — это прикрепить файл к письму и отправить по электронному адресу устройства.

Пересылка по почте хоть и простая процедура, но требует каждый раз что-то делать вручную — создавать новое письмо, вводить адрес получателя и помнить его, нажимать кнопку «послать» и так далее. Если все сократить до минимума, то удобнее использовать «Send to Kindle», которая доступна в виде отдельного приложения для различных компьютерных платформ или в качестве расширения для сторонней программы. Достаточно один раз настроить программу и после этой простейшей процедуры контент можно перетаскивать на иконку программы для отправки в устройство Kindle.

Не только Amazon имеет облачный сервис. Развитие тренда привело к появлению популярных и независимых сервисов, которые предоставляют сторонним разработчикам свой API для внедрения облачного сервиса в их собственные программы. Одним из самых популярных является Dropbox, который удобен не только предоставлением свободного места, но и синхронизацией файлов между устройствами пользователя с минимальными ошибками.

Dropbox работает по-разному. Он синхронизирует компьютеры, когда доступна сеть, но к файлам пользователь имеет постоянный доступ, так как они хранятся локально. При переключении между рабочими местами первым делом нужно подключиться к сети, чтобы Dropbox синхронизировал изменившиеся и добавил новые файлы. Мобильные устройства работают с Dropbox иначе. Доступ к файлам осуществляется только при наличии сети.

Книги можно расположить в Dropbox и осуществлять к нему доступ по мере необходимости. Это удобно, потому что сортировкой и обновлением можно заниматься с помощью компьютера, поддерживая в полном порядке только актуальный для пользователя контент.

Доступ к Dropbox осуществляется на базе операционной системы и отдельных программ.

Немного более устаревшим способом получения контента через интернет можно считать дисковые сетевые протоколы, такие как FTP, которые фактически рассчитаны только на передачу файлов.

Контент можно получать через браузер. Это привычно с помощью компьютера, на большом экране, но не очень удобно на мобильном устройстве, у которого экран меньше и мощность не рассчитана на навигацию на сайте, уже не говоря о том, что, вероятно, понадобятся специальные расширения для браузера, например, Adobe Flash, чтобы видеть изображение сайта корректно. Чтобы облегчить эту задачу поставщики контента создают оболочки с упрощённым представлением контента на экране и некоторые из них содержат в себе встроенную программу для чтения.

Со временем появятся более новые способы получения и отправки книг в устройство для чтения, но уже сейчас понятно, что Интернет стал тем самым «сетевым кабелем» для доставки контента, который избавляет пользователя от физических подключений к чему либо.