Ocr Online Русский

Другие статьи, обзоры программ, новости

Мгновенное извлечение текста из изображений - Компьютерра: Терралаб – гаджеты, тесты, обзоры устройств, рейтинг

Мгновенное извлечение текста из изображений

Руководствуясь нехитрыми приёмами, можно быстро выдергивать тексты из найденных в Интернете картинок или отсканированных страниц бумажных изданий. Иногда это бывает нужно.

Работая с размещенными в Сети материалами, иногда возникает необходимость на скорую руку выдернуть из найденной картинки или отсканированной страницы бумажного издания текст для дальнейшего редактирования в Microsoft Office или OpenOffice, либо для отправки по электронной почте или публикации в Интернете. Нижеследующие практические приёмы помогут справиться с данной задачей за считанные минуты.

Способ первый - использование систем распознавания текста (OCR). Раньше они были жутко дорогими, а сейчас их стоимость снизилась до приемлемого уровня, и многие из OCR-систем переехали в онлайн, освободив тем самым пользователя от необходимости устанавливать дополнительное программное обеспечение на компьютер. Ярким примером мигрировавшего в Сеть продукта является сервис ABBYY FineReader Online. позволяющий быстро и легко конвертировать отсканированные документы и цифровые фотографии в редактируемые форматы. Система умеет распознавать документы размером не более 10 Мб любого из форматов BMP, PCX, DCX, JPEG/JPEG 2000, PNG, TIFF/TIF, GIF, DjVu на русском, английском, немецком и французском языках. При этом результат распознавания может быть сохранен в виде DOC, XLS, RTF, TXT или PDF-файла. В настоящий момент FineReader Online работает в тестовом режиме и после регистрации позволяет пользователю бесплатно распознавать до 50 страниц в день. О стоимости услуг пока нет никакой информации.

Вместо FineReader Online можно воспользоваться другим коммерческим сервисом Online OCR. Его особенностями являются возможность выбора из 28-ми языков распознавания и функция извлечения текста с определенных листов многостраничного документа. Системе можно скармливать файлы форматов TIFF, JPEG/JPG, BMP, PCX, PNG, GIF и PDF размером не более 7 Мб. Для получения качественного результата распознавания разрешение картинок должно быть не меньше 200 dpi. Выходные форматы файлов - DOC, XLS, RTF, TXT, PDF и HTML. Услуги Online OCR платные, и стоимость их варьируется от 80 копеек до 2,5 рублей за страницу распознанного текста. Для проверки настроек и качества распознавания в системе предусмотрен демонстрационный режим, функционирующий бесплатно и сканирующий только часть страниц.

На крайний случай можно воспользоваться ещё одной онлайновой службой img2txt.ru. Судя по представленным на сайте сведениям, она тоже позволяет распознать многоязыковой текст из сканированного документа или фотографии и преобразовать результат в редактируемый формат. К сожалению, в нашем случае сервис почему-то толком не работал: он загружал файлы на сервер и после этого впадал в спячку. Остается надеяться, что это временное явление.

При наличии на компьютере офисного пакета Microsoft Office для извлечения текста из картинок можно прибегнуть к использованию инструмента Microsoft Office Document Imaging. При работе с ним потребуется предварительно преобразовать изображение в формат TIFF средствами любого имеющегося под рукой графического редактора, после чего останется только открыть файл в программе, щёлкнуть по расположенной на панели инструментов клавише "Распознать текст" и дождаться завершения процесса конвертации изображений символов и букв в доступный для копирования текст. Вместо Microsoft Office Document Imaging можно воспользоваться приложением OneNote для создания быстрых заметок и организации личной информации. Оно входит в состав некоторых редакций Microsoft Office и позволяет выдергивать текстовые данные из любых помещённых в окно программы изображений простым выбором в контекстном меню пункта "Копировать текст из рисунка".

Наконец, ещё один метод мгновенного извлечения текста из изображений - использование сервиса scanR, о котором мы подробно рассказывали на страницах нашего издания. Реализованная в scanR система оптического распознавания текста поддерживает 17 языков, включая русский, и позволяет сохранять результаты работы в PDF или обычный текстовый файл. Бесплатно средствами онлайновой службы можно обработать только один документ. Стоимость ежемесячной подписки на услуги scanR составляет 5 долларов США, а годовой - 30 американских президентов. Вполне демократично, учитывая тот факт, что работать с системой распознавания можно не только через браузер, но и посредством электронной почты, а также и мобильных устройств, оснащённых как минимум мегапиксельной камерой (чем больше разрешение, тем лучше) и подключенных к Интернету.

Программное обеспечение, упомянутое в этом материале, протестировано на мобильном компьютере Packard Bell EasyNote TN65 .

Portable CuneiForm v12 Русская альтернатива FINEREADER

Portable CuneiForm v12 [Русская альтернатива FINEREADER]

Portable CuneiForm v12 [Альтернатива FINEREADER]

Год выпуска. 2007

Версия. v12

Платформа. Windows

Совместимость с Vista. неизвестно

Системные требования. Просто компьютер

Язык интерфейса. только русский

Таблэтка. Не требуется

Описание. До настоящего времени,считалось что,реальной альтернативы ABBYY FineReader нет.

Но недавно Российская компания Cognitive Technologies выпустила бесплатную версию своей программы CuneiForm v12,для распознования текста.

Ее возможности не уступают ABBYY FineReader

OCR CuneiForm может распознавать любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий факсов и машинописи.

OCR CuneiForm это:

* высокое качество распознавания;

* высокая скорость работы;

* распознавание текстов на русском, английском, смешанном русско-английском, украинском, немецком, французском, испанском, итальянском, шведском и других (всего более 20);

* работа в режиме автофрагментации для поиска текстовых блоков, таблиц и изображений, а также мощное средство ручной и полуавтоматической фрагментации;

* распознавание таблиц любой структуры и сложности, в том числе и без отображения линий табличной сетки;

* автоматическое сохранение иллюстраций (черно-белых и цветных) и таблиц в получаемом на выходе документе;

* полное сохранение топологии страницы;

* поддержка пакетного режима сканирования и распознавания;

* простота использования и интуитивный интерфейс, встроенные помощники по работе с программой;

* встроенный текстовый редактор для работы с распознанным текстом;

* совмещенный показ изображений и результатов распознавания.

В системе используется целый ряд уникальных технологий, среди которых адаптивное распознавание, нейронные сети, когнитивный анализ альтернатив распознавания и другие.

Это система оптического распознавания ведущего российского разработчика программного обеспечения Cognitive Technologies. OCR CuneiForm обеспечивает быстрое и высококачественное преобразование бумажных документов и электронных графических файлов в редактируемый текст для последующей работы с ним.

Основные возможности OCR CuneiForm

1. ИНТЕРФЕЙС

Интерфейс программы содержит выпадающие контекстные меню, панели быстрого доступа, контекстную помощь.

2. СКАНИРОВАНИЕ

Автоматический подбор оптимальных параметров сканирования.

Возможность импортирования отсканированных или полученных через факс-модем графических файлов во многих форматах.

Обработка изображений: печать образа, инвертирование, поворот.

3. ФРАГМЕНТАЦИЯ

Автоматический и полуавтоматический режимы поиска блоков текста, таблиц и графики, который обеспечивает большую гибкость при работе с многоколоночными текстами и текстами сложной структуры и с графическими элементами.

Режим ручной фрагментации для работы с текстами особо сложной структуры.

4. РАСПОЗНАВАНИЕ

CuneiForm распознает любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, печатной машинки, плохих ксерокопий и факсов.

Самообучающиеся адаптивные алгоритмы распознавания повышают вероятность распознавания низкокачественных документов.

5. ЯЗЫКОВАЯ ПОДДЕРЖКА

Система распознает русский, английский, смешанный русско-английский, украинский, немецкий, французский, испанский, португальский, итальянский, голландский, датский, шведский, финский, сербский, хорватский, польский, казахский, узбекский и другие языки.

6. СЛОВАРНЫЙ КОНТРОЛЬ

Словарь общеупотребительной лексики каждого поддерживаемого языка для контекстной проверки и повышения качества результатов распознавания.

Возможность создания и пополнения пользовательского словаря, а также возможность экспорта/импорта словаря в/из текстовых файлов.

7. РЕАЛИЗАЦИЯ ПРИНЦИПА "What You Scan Is What You Get" ("Что Вы сканируете, то и получаете").

CuneiForm позволяет получить полную копию вводимого документа, включая:

Шрифтовое оформление и форматирование.

Расположение текста, иллюстраций и таблиц.

Колонки, абзацы, отступы, стили и размеры шрифтов.

Черно-белые, 256-градационные серые и цветные 24-битные иллюстрации в выходном RTF-файле.

8. РАБОТА С ТАБЛИЦАМИ

Распознавание таблиц различной структуры, в том числе и без линий разграфки.

Редактирование таблиц (уменьшение/увеличение, удаление/создание колонок и т.д.)

Сохранение результатов в распространенных табличных форматах.

9. РЕДАКТИРОВАНИЕ

В программу встроен многофункциональный редактор, не уступающий по своим возможностям популярным текстовым процессорам.

Одновременная подсветка распознанного текста и исходного изображения, снабженная функцией "следующий/предыдущий сомнительно распознанный".

Поддержка иллюстраций, таблиц, колонок, колонтитулов, сложного форматирования и различных шрифтов.

Возможность редактирования текстовых документов популярных форматов.

10. ИНТЕГРАЦИЯ С ДРУГИМИ ПРИЛОЖЕНИЯМИ

Опции командной строки и поддержка Drag&Drop для вызова из внешних приложений, сканирования, распознавания и сохранения результатов в автоматическом режиме

ИЗОБРАЖЕНИЕ ТЕКСТА и ТЕКСТ

Письменный текст представляет собой последовательность знаков (букв, знаков пунктуации, специальных символов).

Для представления текста в компьютере его символы кодируются двоичными числами. Каждому символу ставится в соответствие. двоичное число. определенное конкретной кодировкой.

При сканировании, в памяти компьютера создается файл с графическим изображением, которое кодируется двоичны ми код ами цвето-яркостных характеристик пикселов. составляющий растр изображения.

Это может быть графическое изображение рисунка, текста, таблицы и т.п. Редактируется данное изображение в помощью инструментов графического редактора (кисти, ластика, заливок и т.п.).

Графическое изображение документа, поступившее в компьютер через сканер, нельзя редактировать в текстовом процессоре, пока оно не будет преобразовано в текст с помощью OCR.

Кроме того, графическое изображение текста является значительно более емким информационно (графическое изображение страницы текста занимает приблизительно около 1,5 МВ, распознанный текст без форматирования 2 КВ).

Soda PDF Professional ключ (crack) OCR Plugin На русском - Софт-Варез

Soda PDF Professional 5.0.133.9133 + ключ (crack) + OCR Plugin [На русском]

Soda PDF 5 - это мощный PDF-инструмент, с помощью которого вы сможете читать, создавать, конвертировать, редактировать, рецензировать и защищать PDF-файлы. Его интуитивно понятный интерфейс позволяет работать легко и эффективно.

В состав продукта Soda PDF включены мощные и простые в использовании инструменты для просмотра файлов PDF, их редактирования и вывода на печать. Пользователи смогут создавать файлы PDF на основе существующих документов (Word, Excel и еще три сотни поддерживаемых форматов), а также преобразовывать готовые PDF-документы в текст, страницы HTML и изображения. А профессионалы смогут приобрести специальную версию продукта с поддержкой технологий оптического распознавания символов.

Данное приложение позволяет:

Открытие, сохранение, печать и рецензирование PDF документов;

Редактирование текста и изображений в электронном документе;

Добавление, удаление, перемещение, изменение размера и вращение любого графического элемента в PDF документе;

Защита PDF документов паролем;

Преобразование PDF документов в Word, HTML, TXT и файлы изображений;

Заполнение и создание PDF форм

Soda PDF 5 представлена в трех версиях:

Soda PDF 5 Standard предоставляет основные функции, такие как чтение, создание и базовые функции редактирования PDF файлов;

Soda PDF 5 Professional включает все функции Soda PDF 5 Standard, а также позволяет использование профессиональных шаблонов, создание форм, автоматическое сравнение документов, шифрование PDF файлов, добавление и редактирование электронных подписей, сотрудничество при помощи инструментов рецензирования, извлечение страниц из PDF документа, разделение PDF документов на несколько PDF документов, и т.д.;

Soda PDF 5 Professional + OCR содержит все функции Soda PDF 5 Professional, а также позволяет преобразовывать отсканированные документы в редактируемые, доступные для поиска PDF документы, изменять структуру и формат PDF документа, распознавать текст изображения.

Основные возможности Soda PDF PRO + OCR :

Встроенные профессиональные шаблоны и формы;

Создание PDF из 300+ форматов;

Шифрование PDF файлов в 256bits системе и возможность управления цифровой подписью;

Легкое управление инструментами комментирования;

Готовность к OCR технологии;

100% совместимость с любым PDF файлом;

Возможность создания PDF файлов с помощью всего одного клика в Microsoft Office приложениях.

Распознавание текста - это инструмент Soda PDF 5, который позволяет распознавать текст изображения при помощи оптического распознавания символов (OCR). Инструмент OCR распознает текст и создает доступные для редактирования и поиска файлы из отсканированных документов, PDF файлов и файлов изображений

Поддерживаемые ОС: Windows XP / Vista / 7 / 8

Скачать бесплатно Soda PDF Professional 5.0.133.9133 + crack + OCR Plugin (Русская версия) - [117.23 Mb]

Где можно скачать программу OCR для скайнера?

где можно скачать программу OCR для скайнера?

Silver-P Искусственный Интеллект (126693) 5 лет назад

Для распознавания текста:

=======================

OCR CuneiForm - Бесплатный, Российский аналог ABBYY FineReader.

1) Высокое качество распознавания;

2) Высокая скорость работы;

3) Распознавание текстов на русском, английском, смешанном русско-английском, украинском, немецком, французском, испанском, итальянском, шведском и других (всего более 20 языков) ;

4) Работа в режиме автофрагментации для поиска текстовых блоков, таблиц и изображений, а также мощное средство ручной

и полуавтоматической фрагментации;

5) Распознавание таблиц любой структуры и сложности, в том числе и без отображения линий табличной сетки;

6) Автоматическое сохранение иллюстраций (черно-белых и цветных) и таблиц в получаемом на выходе документе;

7) Полное сохранение топологии страницы;

8) Поддержка пакетного режима сканирования и распознавания;

9) Простота использования и интуитивный интерфейс, встроенные помощники по работе с программой;

10) Встроенный текстовый редактор для работы с распознанным текстом;

11) Совмещенный показ изображений и результатов распознавания.

Если ссылку не откроют - стукни мне в агент или письмом.

Софт-Архив

Поиск

Новые файлы