Софт-Архив

Скачать Файл В Формате Djvu img-1

Скачать Файл В Формате Djvu

Рейтинг: 4.1/5.0 (1880 проголосовавших)

Категория: Windows: Просмотр

Описание

Чем открываются файлы с расширением

чем открываются файлы с расширением .djvu ?

ZZuma Мастер (1536), закрыт 7 лет назад

. Искусственный Интеллект (266402) 7 лет назад

WinDjView 0.5.0 - Программа для просмотра файлов формата DjVu. Поддерживает плавный скроллинг и расширенные опции печати. Работает без инсталляции.

Ссылка "скачать" - страница загрузки.

Примечание: DjVu (дежа-вю) - графический формат, изначально оптимизированный для хранения отсканированных документов. Кроме этого, он он идеально подходит для создания электронных книг, особенно технической литературы с обилием схем и формул, т. к. позволяет хорошо сжать электронный документ без потери его "читаемости".

Скачать DjVu Editor 6.0 Pro + русификатор (53,25 МБ).

DjVu Editor 6.0 Pro + Rus

Document Express with DjVu - группа приложений, позволяющих создавать, управлять, записывать и распространять файлы в формате DjVu. Document Express Editor - одна из наиболее распространенных программ для создания и просмотра DjVu-документов на локальном компьютере.

_http://letitbit.net/download/67a908764795/Document-Express-Editor-6.rar.html

Другие статьи, обзоры программ, новости

Помощь по чтению книг в файлах djvu, pdf, RAR

Как открыть книги в форматах djvu, pdf, RAR Ссылки на программы для чтения электронных книг

Если Вы не можете прочитать книгу в формате djvu. значит, у Вас на компьютере не установлена программа – просмотрщик DjVu Browser Plugin.

Скачать эту программу можно по ссылке DjVu Browser Plugin.

Если Вы скачали на нашем сайте техническую литературу – книги и журналы в виде файлов pdf. и такой файл не открывается на Вашем компьютере, значит, Вам нужно установить программу Acrobat Reader 7.

Чтобы скачать этот просмотрщик pdf-книг, перейдите по ссылке Acrobat Reader 7.

Книги на файлообменниках сжаты в архивах в формате RAR. Если Вы не можете прочитать архив RAR. скачайте разархиватор.

Проблемы со скачиванием книжек с депозит файлз?

Если Вы хотите получить купон на 10% скидку для приобретения Gold статуса на Depositfiles – перейдите на страницу с купоном .

Как скачать бесплатные книги с файлообменника depositfiles – читайте подробную инструкцию

Инструкция Работа в программе DjVu DjVu Small exe-программа по переводу сканированных файлов в формат DjVu

Инструкция Работа в программе DjVu DjVu Small exe-программа по переводу сканированных файлов в формат DjVu ГБУ «Центр информатизации бюджетного процесса при Министерстве финансов Республики Саха (Якутия)»

Инструкция

Работа в программе DjVu

DjVu Small.exe-программа по переводу сканированных файлов в формат DjVu.

DjVu - графический формат, оптимизированный для хранения отсканированных документов.

1. djvu_small_v0_3_4.rar- архивный файл программы сохранения сканированных файлов в один. Правой кнопкой мыши разархивируйте файл.

2. Открываем сформированную папку djvu_small_v0_3_4, далее копируем папку DjVu Small v0.3.4 и переносим в папку C:\Program Files.

3. Открываем скопированную папку DjVu Small v0.3.4.

4. Копируем ярлык программы на рабочий стол.

Для этого выбираем DjVu Small, нажимаем правую кнопку мыши и отправляем ярлык на Рабочий стол.

5. Запускаете программу

6. При сохранении файлов

1. Выбираете отсканированные документы.

2. Выбираете папку куда сохранится сформированный файл.

9. Выбираем Русский, Ок.

Выбираете пункт- Принимаю условия соглашения

Как открыть файл PDF? Как открыть формат DJVU?

Как открыть файл PDF. Как открыть формат DJVU ?

Если Вы или ваши близкие любят читать, то не удивительно что вы попали на эту страницу. Здесь я подробно отвечу на такие вопросы: как открыть файл PDF. а также формат DJVU. Что это такое спросят некоторые? Обычно в этих форматах в интернете можно скачать книги и журналы.

Я посвятил целую статью описав удобство чтения книг на компьютере. а сегодня расскажу какие программы для этого нужно установить, чтобы скачав журнал или какую-то книгу, они не валялись на диске "мёртвым" грузом.

Как открыть файл PDF ?

Итак, если вы уже пытались скачивать из интернета книги, то возможно заметили, что некоторые из них имеют формат PDF. Для открытия книг в данном формате нужна специальная программа, одна из самых популярных (и бесплатных), имеет название Adobe Reader. Официальная страница загрузки находится по адресу: http://get.adobe.com/ru/reader. Там есть кнопка « Установить сейчас », нажав на которую начнётся загрузка программы для открытия PDF файлов .

Установите её и после этого Вам можно будет спокойно открывать PDF книги просто двойным нажатием мыши.

Вот пример:

Как открыть файл формата DJVU ?

Следующий на очереди у нас формат DJVU, открыть который можно, например, с помощью программы WinDjView. Официальная страница загрузки находится по адресу: http://windjview.sourceforge.net/ru .

Устанавливаем WinDjView и после этого пробуем двойным кликом открыть файл DJVU .

P.S. Ещё один из распространенных форматов, книги в котором Вам могут встретится, имеет название FB2. Здесь я не вижу смысла повторяться, потому как соответсвующий урок: Чем открыть файл FB2. уже давно написан!

Скачать файл в формате djvu

DjVu ("дежавю" от фр. deja vu — «уже виденное») как графический формат хранения данных был разработан компанией AT&T в середине 90х.

Все права на использование были проданы Lizardtech.

Сейчас права на технологию DjVu у компании Caminova .

DjVu — технология сжатия изображений с потерями, разработанная специально для хранения сканированных документов — книг, журналов, рукописей и проч. где обилие формул, схем, рисунков и рукописных символов делает чрезвычайно трудоёмким их полноценное распознавание. Также является эффективным решением, если необходимо передать все нюансы оформления.

Формат оптимизирован для передачи по сети таким образом, что страницу можно просматривать ещё до завершения скачивания. DjVu-файл может содержать текстовый (OCR) слой (если при создании добавлен, но легко добавить и потом без перепаковки всех страниц), что позволяет осуществлять полнотекстовый поиск по файлу. Обладает почти уникальной для Интернет-графики особенностью - способностью к масштабированию. Кроме того, DjVu-файл может содержать встроенное интерактивное оглавление и активные области — ссылки, что позволяет реализовывать удобную навигацию в DjVu-книгах. Отличается малым размером результирующего файла в сравнении со всеми остальными графическими форматами.

Чем просматривать DjVu файлы?

WinDjView (воспроизводит всё что дополнительно "сделано" в файле),

X Djvu (iPhone/iPod Touch)

DjVu Shell Extension Pack (DjVu-плагин для проводника Windows),

djvureader (если не пошёл, то от имени админа. инфа ),

djvubookmark (+художественно перелистывает).

Для сжатия цветных изображений в DjVu применяется специальная технология, разделяющая исходное изображение на три слоя (в общем случае): передний план (foreground ), задний план (backgroung ) и чёрно-белую (однобитовую) маску (mask ). Маска сохраняется с разрешением исходного файла; именно она содержит изображение текста и прочие чёткие детали. Разрешение заднего плана, в котором остаются иллюстрации и текстура страницы, понижается для экономии места. Передний план содержит цветовую информацию о деталях, не попавших в задний план; его разрешение понижается ещё сильнее. Затем задний и передний планы сжимаются с помощью вейвлет-преобразования, а маска — алгоритмом JB2.

Особенностью алгоритма JB2 является то, что он ищет на странице повторяющиеся символы и сохраняет их изображение только один раз. В многостраничных документах каждые несколько подряд идущих страниц пользуются общим «словарём» изображений. При просмотре слои последовательно рендерятся и объединяются в конечной картинке.

Для сжатия большинства книг можно обойтись только двумя цветами. В этом случае используется всего один слой, что позволяет достичь рекордной степени сжатия. В типичной книге с чёрно-белыми иллюстрациями, отсканированной с разрешением 600 dpi, средний размер страницы составляет около 15 Кб, то есть приблизительно в 100 раз меньше, чем исходный файл. Однако, при этом не стоит забывать, что в DjVu используется сжатие данных с потерями. Для особо важных документов, возможно, будет разумнее использовать более «надёжные» форматы: PNG, JPEG 2000, TIFF и т. п. В общей сложности выигрыш объёма в этом случае составляет 4—10 раз.

алгоритм отделения текста от фона на отсканированном изображении;

вейвлетный алгоритм сжатия фона IW44;

алгоритм сжатия чёрно-белых изображений JB2;

универсальный алгоритм сжатия ZP;

алгоритм распаковки «по запросу»;

DjVu Imager - вставка иллюстраций в DjVu-книгу,

DjvuOCR 2 - внедрение OCR-информации из frf-файлов FineReader'а vv.8,9 в текстовый слой DjVu-файла,

DjVuToy - китайская DjVu-программа с англ. интерфейсом

P.S. О редактировании содержимого.

Файл .djvu своего рода контейнер для отдельных картинок (и/или слоев).

Поэтому, всё сводится к декодированию файла (*.djvu). пакетно (всех сразу) или несколько (нужных) страниц в форматы графических изображений (tiff, bmp) соответствующими программами

> изменению. в графическом редакторе, например, удобный в ScanKromsator(SK):

открыть tiff в SK, перейти в меню Result - Show source files и редактировать-чистить, включив Autosave mode, удобными способами

> возвращению всего на место и/или кодированию-собиранию заново соответствующими программами.

Pdf -> DjVu

Для прямой конвертации - пакет Pdftodjvu LE (составлен на базе DEE v5.1,

170Mb). Преимущество такой конвертации в том, что при этом из Pdf-файла в DjVu-файл переносится OCR-слой и гиперссылки (иногда проблемы с русскими кодировками).

Однако, далеко не всегда имеет смысл делать именно прямую конвертацию Pdf -> DjVu. В отличие от формата DjVu, формат Pdf не является графическим . Формат Pdf - это формат-контейнер . который может содержать любой тип данных - текст, картинки, таблицы, даже аудио- и видеоинформацию. Формат Pdf обычно делится на такие виды:

- Векторный. в таком Pdf-файле содержится только символьная информация - текст, таблицы, графики, формулы, чертежи. Такие Pdf-файлы (внешне они выглядят как текст, набранный типографским шрифтом. распознанные из отсканированных книжные страницы, сохранённые в Pdf-файл в виде текста, а не картинки. Такой текст можно выделять, копировать, изменять прямо в Pdf-файле) лучше всего конвертировать в формат DjVu напрямую - получите отличное качество и наименьший размер DjVu-файла.

- Растровый. в таком Pdf-файле содержится только неформализованная информация - растровые картинки. Такие Pdf-файлы (внешне они выглядят как сканированное изображение текста. картинки отсканированных книжных страниц, сохранённые в Pdf-файл) лучше всего конвертировать в формат DjVu НЕ напрямую - а по схеме "Pdf -> Tif -> DjVu" (просто: IrfanView с IrFanView Plugins и для Pdf -> Tif, Bmp, Jpg. к ней Ghostscript ). Всё дело в том, что прямой конвертер Pdftodjvu LE "заточен" именно на векторные Pdf-файлы, а растровые он плохо кодирует - получаются большие DjVu-файлы.

- Растрово-векторный. Такие Pdf-файлы, как правило, лучше конвертировать в формат DjVu НЕ напрямую - по схеме "Pdf -> Tif -> DjVu". И только в отдельных редких случаях можно применить прямое конвертирование "Pdf -> DjVu". Всё это зависит от конкретного Pdf-файла, от вида и соотношения растрового и векторного содержимого. Попробуйте оба варианта конвертирования и выберите наилучший.

Технические аспекты

Вся информация внутри DjVu представлена в виде чанков (chunks). Сам файл является большим чанком, внутри которого находятся чанки меньшего размера. Файл может быть одно- и многостраничным, в случае многостраничного файла в начало добавляется каталог страниц. Нужно отметить, что количество чанков внутри файла никак не соразмерно с количеством страниц, потому что для рендеринга страницы может использоваться несколько чанков.

Арифметический кодер/декодер который является основой всех преобразований в DjVu. Принцип действия похож на тот, что применяется в алгоритме BZIP2. Этот кодек применяется как фильтр - выходной при создании чанков и входной перед рендерингом слоёв.

JB2 encoder.

Применяется для упаковки bitonal данных, таких как текст, чёрно-белые рисунки и пр. Может хранить маску, т.е. информацию о том, что попадает в background, а что в foreground. Вся информация хранится в виде библиотеки (dictionary) форм (shape) плюс положение каждого объекта на плоскости страницы. Сами библиотеки могут быть общими для нескольких страниц. Легче всего это представить таким образом. К примеру есть отсканированный текст, кодировщик определяет похожие буковки, скажем все 'а', 'б' etc и создаёт библиотеку, в которой находится информация о каждой букве (форме), а потом просто информация, что 'a' находится в таком-то и таком-то месте, 'б' в таком-то и так далее. В дополнение к всему этому, может быть сохранена информация о цвете форм, т.е. если есть, скажем, красная 'а' и синяя 'a' в скане, то в библиотеку попадёт только одна 'а', будет записана информация о местоположении двух форм 'а' и о их цвете. Цвет хранится в индексированном виде, точно так же, как и в GIF файлах.

Сигнатура чанка для JB2 слоя - 'Sjbz', может ссылаться на внешнюю библиотеку форм - 'Djbz' чанк. Информация о цветах форм находится в чанках 'FGbz'.

Все такие чанки пожаты Z-coder'ом.

IW44 encoder.

Wavelet кодер. Применяется для упаковки фотографий, backgroung. Foreground цвета тоже могут быть упакованы таким же образом. Принцип упаковки такой же как, в формате JPEG 2000. Может быть упакована как цветная, так и b/w информация. Информация о background обычно сохраняется с меньшим (как правило в 3 раза) разрешении, чем JB2. Если foreground упакован таким способом, то 'Sjbz' маска определяет, что попадает в foreground, а что нет. Информация о цвете кодируется не в RGB, а YCbCr (яркость плюс разностные каналы, как в телевидении).

Сигнатура чанка для background слоя - 'BG44', foreground - 'FG44'.

Прочая информация.

Текстовый слой - 'TXTz'. Распознанный текст совместно с его расположением на странице. Информация о расположении может быть детализована до слов или до строчек. Этот слой позволяет использовать поиск с подсветкой найденного на странице и индексировать DjVu документы.

Аннотации - 'ANTz'. Ссылки и информация о том, какие слои выводить по умолчанию при открытии файла.

'TXTz' и 'ANTz' пропущены через Z-coder.

Кроме того может быть закодирована информация о кодере (чанк 'CIDa') и прочее. Чёткого стандарта нет.

Параметры компонентов изображения в формате DjVu.

Конвертеры PDF в DOC и DjVu в DOC формат Microsoft Word: обзор программ > Тест

PDF и DJVU – зачем нужны программы-конвертеры #

Итак, что же такое PDF. Так как с лета 2008 года данный формат стал открытым стандартом, то в сети есть достаточно точные определения, что из себя представляет наш предмет обсуждения – это кроссплатформенный формат файлов (P ortable D ocument F ormat), введенный компанией Adobe еще в далеком 1993 и позволяющий включать в состав документа как сам текст, так и используемые шрифты, растровые и даже векторные изображения. А в последнее время, используя инструмент Acrobat 3D. можно внедрять и трехмерную графику в форматах U3D. PRC и некоторых других.

Теперь – зачем это нужно: компания Adobe в результате этой нехитрой манипуляции – создания документа с использованием возможностей PostScript, поддерживаемого в любой ОС безотносительно к программной среде или "железу" – фактически удалось "подмять" часть полиграфической индустрии и распространения полностью оформленных электронных документов, например, журналов и иллюстрированных книг. Напомним, что формат PDF появился в 1993, а стал открытым лишь в 2008 году (в спецификации версии 1.7) – а до этого он был проприетарным (закрытым коммерческим) и с полными возможностями редактировался только продуктами компании Adobe. что позволило ей стать лидером в этой области. Разумеется, есть альтернативы, но их немного, возможности редко превышают удобство PDF и они намного менее популярны.

Теперь обратимся к другому формату распространения печатной продукции во всемирной сети – DjVu . По сути, это скорее файл, созданный при помощи технологий сжатия изображений с потерями, в основном с применением алгоритма JB2 – в нем используется словарь изображений, позволяющим заменять повторяющиеся символы на нескольких страницах одним изображением. Строго говоря, в спецификации используется три слоя изображения – передний слой, задний слой и маска, и именно маска сжимается по алгоритмы JB2. и для большего выигрыша в размере получаемого документа два других слоя исключают из получаемого файла.

Боле того, DjVu позволяет хранить специальный OCR-слой, иначе называемый текстовым слоем, который содержит дублирующий изображение текст. Он позволяет быстро копировать текстовые данные из документа в любом просмотрщике DjVu -файлов. Если же текстового слоя нет – то де-факто остается только путь распознавания изображений в стороннем ПО, но об этом далее в нашей статье.

Путешествие из PDF в DOC #

Исходя из сказанного выше, полноценные редакторы PDF – довольно редкое явление по причине того, что формат только недавно стал открытым и де-факто продукты компании Adobe заняли лидирующие позиции как в просмотре, так и редактировании PDF -файлов. К тому же большинство редакторов стоит более $200, и человеку, не работающему с такими документами часто, накладно покупать такое ПО ради одного-двух документов.

Тут на помощь приходят программы-конвертеры, позволяющие перенести содержимое PDF-документа в более распространенный и просто редактируемый формат – Microsoft Word или DOC. Почему именно DOC. Во-первых, Microsoft Office – достаточно популярный офисный пакет с широкими возможностями, очень распространенный как в России, так и за рубежом, а функционал его позволяет в широких пределах изменять оформление документа. Во-вторых, существует большое количество альтернативного свободного ПО, работающих с данным форматом, наиболее известным из которых является кроссплатформенный пакет OpenOffice .

Сегодня мы пройдем по данной цепочке и рассмотрим несколько программ-конвертеров. Однако вначале маленькое отступление – создавая PDF-файл, его можно защитить паролем от редактирования, и для открытия такого файла Вам скорее всего понадобится либо пароль, либо программа для снятия защиты – их великое множество в сети. Скачав первый попавшийся документ, мы обнаружили что он защищен именно таким образом – скачать тестовый PDF-файл .

Мы воспользовались trial-версией программы VeryPDF PDF Password Remover . Ограничения версии – всплывающее окошко при открытии получившегося документа и расшифровывается только половина страниц исходного документа.

Для наших целей этого было достаточно. Получившийся файл – скачать тестовый PDF-файл без пароля. как видно на снимке, изменений в структуре нет.

Также мы проверяли обработку программами и английского документа – с альбомным расположением страницы, рисунками и без защиты, скачать английский тестовый PDF .

Все представленные в тесте конвертеры были бесплатными или trial-версиями, скаченными с официальных сайтов разработчиков и предназначены для работы в операционной системе Windows (мы тестировали в Windows 7 ).

Free PDF to Word Doc Converter #

Для начала мы взяли бесплатный конвертер Free PDF to Word Doc Converter . который позиционируется как простое и быстрое решение для преобразования документов. Сразу можно сказать, что решение действительно простое – никаких особых дополнительных настроек, все в одном окошке программы, доступной только на английском языке.

Нам можно задать исходный документ, куда сохранить результат конвертирования, сколько страниц конвертировать, шрифт и пару опций, относящихся к форматированию, а также чем открыть получившийся документ. Free PDF to Word Doc Converter запросто открыл документ с защитой, а процесс прошел действительно быстро, и, полные надежд, мы открыли наш документ после конвертирования .

Что тут можно сказать – оформление он конечно сохранил, и даже попытался сделать формулы похожими на оригинал, но потеря всего русского текста непростительна – для конвертирования русскоязычных документов Free PDF to Word Doc Converter совершенно не годится. Посмотрим, как он справился с английским PDF .

Потеряны все изображения, сноски превратились в нечто невразумительное, словом, и тут Free PDF to Word Doc Converter не блещет. Что же, годится данная программа только для быстрого конвертирования английских текстовых PDF без графики и особого оформления, всего только и достоинств, что бесплатна и не требует для работы снятие защиты.

Solid Converter PDF #

Следующий участник – Solid Converter PDF . комммерческая программа от компании Solid Documents .

Сразу после запуска видно – простым конвертирование PDF в Word тут не обходится, набор функций весьма широк. Но в принципе интерфейс прост (благодаря хорошо оформленным иконкам) и нужную функцию нам найти не сложно.

Интерфейс на русском языке без видимых ошибок в переводе – словом, неплохая локализация. Правда, попытка скормить программе защищенный PDF успехом не увенчалась – потребовался пароль. Поэтому для тестов мы воспользовались разблокированный версией.

Строго говоря, несмотря на обширный набор опций, мы решили не останавливатся на подробностях.

Причина сего поступка проста – нас интересовал функционал сразу "из коробки", обычный пользователь коммерческих продуктов как правило не заинтересован в "допиливании напильником". Поэтому сразу после открытия мы перешли к конвертированию тестового файла. Ждать пришлось лишь чуть-чуть больше, чем в случае с Free PDF to Word Doc Converter .

А вот результат конвертирования получился очень неплох – практически все формулы, за исключением сложных дробей, сохранены в исходном виде, а текст полностью повторяет структуру такового в PDF. Одно печалит – пробная версия оставляет здоровенный штамп по диагонали каждой страницы получающегося документа. После результата с русским PDF мы нисколько не сомневались в положительном результате при конвертировании английского PDF. но тестирование есть тестирование, и все участники должны пройти одинаковый набор тестов. Итак, загрузили файл, кликнули, подождали пару секунд – и вот результат .

Практически 100% редактируемая копия исходного документа. Аплодисменты, занавес. Итого – отличный функционал, быстрая и качественная работа: пока что Solid Converter PDF является лидером в данном тесте.

VeryPDF PDF2WORD #

Третий участник нашего блиц-тестирования – VeryPDF PDF2WORD . продукт от компании VeryPDF. автора использованной при подготовке к тестированию программы для снятия защиты с PDF -файлов.

Главное окно программы довольно простое – из меню есть доступ к открытию файлов, а главное окно оказывает информацию о задании.

Есть и некоторый набор дополнительных опций.

Итак, первый мы загрузили нашу защищенную методичку и конвертер спокойно ее принял. Впрочем это неудивительно – была высока вероятность, что в свой конвертер VeryPDF PDF2Word компания также встроит механизм дешифровки. Немного ожидания, и сконвертированный файл готов.

Немного нарушено форматирование текста, сложные формулы нечитаемы, простые формулы несколько искажены, оценка – удовлетворительно. Посмотрим, что у нас получается при конвертировании английского PDF .

Оформление немного искажено, часть элементов "перескочила" на следующую страницу, но картинки сохранены. Однако размер получающегося файла – 3,28 Мбайта – все всякой критики, программа каждый рисунок разделила на отдельные элементы, что и привело к неоправданному росту объема. Оценка – удовлетворительно с минусом.

ABBYY PDF Transformer #

Программа ABBYY PDF Transformer является по сути урезанным ABBYY FineReader – из входных файлов оставлена только поддержка PDF. а вывод – в ограниченный объем форматов. Защищенные файлы PDF программа не открывает.

В пробной версии мы также имеем набор довольно жестких ограничений.

Негусто. Но тем не менее попробуем воспользоватся тем функционалом, что дают, к слову говоря, конвертация PDF в ABBYY PDF Transformer происходит путем простого распознавания – как и любого другого файла изображений в ABBYY FineReader .

Итак, мы распознали исходный русский PDF в автоматическом режиме и сохранили результат .

Драконовские ограничения пробной версии даже не дали выбрать страницы для сохранения и получаем мы в итоге лишь первые две страницы, качество неплохое, но на результат в сложных врядли можно рассчитывать более высокий, чем у самого ABBYY FineReader . Закинули в ABBYY PDF Transformer одностраничный английский тестовый PDF .

На выходе получили обычную картину для ABBYY FineReader – без ручного редактирования видимо невозможно обойтись, а форматирование получившегося документа похоже на содержимое блендера после первой секунды измельчения.

Adobe Acrobat X #

Ну и как же мы могли обойти вниманием "родной" для формата PDF редактор - Adobe Acrobat . Тестировали мы пробную версию Adobe Acrobat Х Pro. которая доступна после регистрации для свободного скачивания на официальном сайте компании Adobe .

Программа имеет английский интерфейс, при запуске сразу предлагает выбрать задачу, которой Вы намерены занятся.

Открыть защищенный файл нам не удалось, поэтому мы перешли к "беззащитному" варианту. Разумеется, файл открылся без каких-либо проблем – к слову сказать, в отличие от всех программ в этом обзоре Adobe Acrobat не является конвертером – это полноценный коммерческий продукт от разработчиков pdf-формата, предназначенный для создания и редактирования любых (естественно, кроме защищенных) PDF -файлов.

Но мы редактировать файл не стали – просто попробовали сохранить его в формате MS Word. И вот что из этого получилось в итоге .

Простые формулы и форматирование текста переданы с минимальными искажениями, а вот ситуация со сложными формулами хуже, чем в Solid Converter PDF . Посмотрим, что получится из английского PDF .

Недостатки лишь в мелких искажениях заметок, изображения и текст переданы практически без искажений, здесь Adobe Acrobat нисколько не уступает Solid Converter PDF .

Как DjVu в Word попал и что из этого получилось #

Файлы DjVu открываются любым, даже самым простым просмотрщиком – примеры приложений Вы можете найти в нашей статье "Что такое DjVu и как с ним работать? ", мы воспользовались WinDjView (самую новую версию Вы всегда можете скачать в нашем файловом архиве на странице программы ).

А вообще у содержимого любого DjVu -документа есть три пути стать файлом формата DOC:

  • Непосредственно перенестить из текстового слоя посредством буфера обмена в Microsoft Word – в этом случае какой либо намек на форматирование теряется, ровно как и изображения. Результат – мы получаем просто кучу обычного текста .
  • Быть распознанным специальным ПО сразу – примером этого случая станет наш эксперимент с ABBYY FineReader . который с версии 9 стал поддерживать такой тип входных изображений.
  • Посредством виртуального (программного) принтера стать PDF-файлом и далее отправится в вышеописанные программы-конвертеры или тот же самый ABBYY FineReader .

Но сначала тестовые условия: нашей лабораторной мышкой стал данный файл – 374-х страничный учебник по механике двухфазных систем размером 5,28 Мбайта (присутствует текстовый слой, чистый текст занимает 588 Кбайт). Конвертация документа производится без каких-либо изменений в тексте, все настройки используемых программ – изначальные.

ABBYY FineReader #

Итак, первым делом попробуем распознать документ в ABBYY FineReader . Ограничения пробной версии оказались еще более жесткие, чем в ABBYY PDF Transformer .

Одна радость – функционал намного больше.

Программа открыла документ как изображение, тестовый слой был проигнорирован – страница распознавалась с нуля. Мы ограничили тестовый объем одной страницей – все равно сохранить нельзя больше.

Результаты теста: пример №1 и пример №2 мало чем смогли порадовать – без ручной подстройки распознаваемых блоков ABBYY FineReader опознает не ахти.

В целом разница здесь между просто текстом и данными результатами невелика – сложные формулы выглядят кашей. Ручное же редактирование, в данном случае, 174 страниц – задача нетривиальная.

Экспорт в PDF при помощи Adobe Acrobat #

В задаче использования виртуального принтера мы решили обратится к Adobe Acrobat - кто может лучше всего подготовить PDF. как не редактор, созданный для этого? Открыв просмотрщик DjVu. мы в качестве принтера выбрали Adobe PDF .

Немного ожидания и в редакторе наконец открылся результат – однако его размер составил 26,43 Мбайта.

Очевидно, что все содержимое исходного документа было преобразовано в графику. Дальнейший путь файла – в наш раздел конвертеров и вышеуказанный ABBYY FineReader . В обоих случаях несложно догадаться, что 100% соотвествие исходному документу нас не ожидает.

В заключение мы можем отметить, что среди всех программ, протестированный нами и способных к конвертации PDF. наилучший результат дают Solid Converter PDF и Adobe Acrobat . остальные же программы способны удовлетворить нужды лишь непритязательных пользователей. Что касается DjVu. то путей превращения таких документов в 100%-похожую редактируемую копию пока нет – либо придется преобразовывать сложные места в изображения, либо оформлять утерянные участки до исходного состояния вручную.