Софт-Архив

Cuneiform Онлайн img-1

Cuneiform Онлайн

Рейтинг: 5.0/5.0 (1851 проголосовавших)

Описание

Cognitive OpenOCR (CuneiForm) - скачать бесплатно Cognitive OpenOCR (CuneiForm)

Cognitive OpenOCR (CuneiForm)

Cognitive OpenOCR (CuneiForm) - Описание разработчика: "OCR CuneiForm может распознавать любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий факсов и машинописи.

OCR CuneiForm это:

высокое качество распознавания;

высокая скорость работы;

распознавание текстов на русском, английском, смешанном русско-английском, украинском, немецком, французском, испанском, итальянском, шведском и других (всего более 20);

работа в режиме автофрагментации для поиска текстовых блоков, таблиц и изображений, а также мощное средство ручной и полуавтоматической фрагментации;

распознавание таблиц любой структуры и сложности, в том числе и без отображения линий табличной сетки;

автоматическое сохранение иллюстраций (черно-белых и цветных) и таблиц в получаемом на выходе документе;

полное сохранение топологии страницы;

поддержка пакетного режима сканирования и распознавания;

простота использования и интуитивный интерфейс, встроенные помощники по работе с программой;

встроенный текстовый редактор для работы с распознанным текстом;

совмещенный показ изображений и результатов распознавания.

В системе используется целый ряд уникальных технологий, среди которых адаптивное распознавание, нейронные сети, когнитивный анализ альтернатив распознавания и другие."

Доступна сборка для Windows, а также исходные коды.

Другие статьи, обзоры программ, новости

Распознавание текста

Распознавание текста. Бесплатная программа — аналог FineReader

Рано или поздно, все кто часто работает с офисными программами,  сталкиваются с типичной задачей - отсканировать текст с книги, журнала, газеты, просто листочков, а затем перевести эти картинки в текстовый формат, например, в документ Word.

Чтобы это сделать необходим сканер и специальная программа для распознавания текста. В этой статье пойдет речь о бесплатном аналоге FineReader - CuneiForm (о распознавании в FineReader - см. в этой статье ).

1. Особенности программы CuneiForm, возможности

Программа для распознавания текста с открытым исходным кодом. К тому же, работает во всех версиях Windows: XP, Vista, 7, 8, что радует. Плюс к этому добавьте полный русский перевод программы!

- распознавание текста на 20 самых популярных языках мира (английский и русский само собой входит в это число);

- проверка по словарю распознанного текста;

- возможность сохранения результаты работы в нескольких вариантах;

- сохранение структуры документа;

- отличная поддержка и распознавание таблиц.

- не поддерживает слишком большие документы и файлы (более 400 dpi);

- не поддерживает на прямую некоторые типы сканеров (ну это не страшно, в комплект к драйверам сканера идет и спец. программа для сканирования);

- дизайн не блещет (но кому он нужен, если программа в полной мере решит задачу).

2. Пример распознавания текста

Будем считать что необходимые картинки для распознавания вы уже получили (отсканировали там, или скачали в интернете книгу в формате pdf/djvu и достали из них нужные картинки. Как это сделать - см. в этой статье ).

1) Открываем требуемую картинку в программе CuineForm ( файл/открыть или " Cntrl+O ").

2) Чтобы  приступить к распознаванию - нужно сначала выделить различные области: текста, картинок, таблиц и пр. В программе Cuneiform это можно сделать не только в ручную, но и автоматически. Для этого щелкните по кнопке " разметка " в верхней панели окна.

3) Спустя 10-15 сек. программа автоматически подсветит все области различными цветами. Например, область текста выделяется синим цветом. Кстати, подсветила она все области правильно и довольно быстро. Честно говоря, не ожидал от нее такой быстрой и правильной реакции.

4) Для тех, кто не доверяет автоматической разметке, можно воспользоваться и ручной. Для этого есть панелька инструментов (см. картинку ниже), благодаря которой можно выделить: текст, таблицу, картинку. Передвинуть, увеличить/уменьшить начальное изображение, подрезать края. В общем, неплохой набор.

5) После того, как все области были размечены, можно приступить к распознаванию. Для этого просто щелкните по одноименной кнопке, как на картинке ниже.

6) Буквально через 10-20 сек. перед вами откроется документ в Microsoft Word с распознанным текстом. Что интересно, в тексте для этого примера, ошибки, конечно были, но их крайне не много! Тем более, учитывая в каком невзрачном качестве был исходный материал - картинка.

По скорости и качеству вполне сравнимо с FineReader!

3. Пакетное распознавание текста

Эта функция программы может пригодится, когда вам нужно распознать не одну картинку, а сразу несколько. Ярлык для запуска пакетного распознавания, обычно, спрятан в меню " пуск ".

1) После открытия программы, вам нужно создать новый пакет, либо открыть ранее сохраненный. В нашем примере - создадим новый.

2) В следующем шаге даем ему название, желательно такое, чтобы и через полгода вспомнить что в нем сохранено.

3) Далее выбираете язык документа (русско-английский), указываете, есть ли в вашем отсканированном материале картинки и таблицы.

4) Теперь нужно указать папку, в которой расположены файлы для распознавания. Кстати, что интересно, программа сама найдет все картинки и другие графические файлы, которые она сможет распознать и добавить их в проект. Вам же останется удалить лишние.

5) Следующий шаг не важен- выбираете что делать с исходными файлами, после распознавания. Рекомендую выбрать галочку "ничего не делать".

6) Осталось лишь выбрать формат, в котором будет сохранен распознанный документ. Есть несколько вариантов:

- rtf - файл из документа word, открывается всеми популярными офисами (в том числе и бесплатными, ссылка на программы );

- txt - текстовый формат, в нем можно сохранить только текст, картинки и таблицы нельзя;

- htm - гипертекстовая страничка, удобно, если вы сканируете и распознаете файлы для сайта. Его и выберем в нашем примере.

7) После нажатия кнопки " готово " запустится процесс обработки вашего проекта.

8) Программа работает довольно таки быстро. После распознания перед вами появится вкладка с файлами htm. Если щелкнуть по такому файлу запуститься браузер, где вы сможете увидеть результаты. Кстати, пакет можно сохранить для дальнейшей работы с ним.

9) Как видно, результаты работы весьма впечатляющие. Картинку программа легко распознала, а под ней легко распознала текст. При том что программа и бесплатна - то вообще супер!

Если вы часто не занимаетесь сканированием и распознаванием документов, то покупать программу FineReader, наверное, не имеет смысла. С большинством задач легко справляется CuneiForm.

С другой стороны, есть у нее и минусы.

Во-первых, слишком мало инструментов для редактирования и проверки получившегося результата. Во-вторых, когда приходится распознавать много картинок - то в FineReader удобнее сразу видеть в колонке справа всё, что добавлено в проект: быстро удалять лишнее, вносить правки пр. И третье, на документах совсем уж плохого качества, CuneiForm проигрывает в качестве распознавания: приходится документ доводить до ума - править шибки, проставлять знаки препинания, кавычки и т.д.

На этом все. А вы знаете какую-нибудь еще достойную бесплатную программу для распознавания текста?

Распознавание текста - OCR CuneiForm

Новые информационные технологии

Что такое CuneiForm?

CuneiForm - это система оптического распознавания крупнейшего российского разработчика программного обеспечения Cognitive Technologies, которая обеспечивает быстрое и высококачественное преобразование бумажных документов и электронных графических файлов, получаемых, например, со сканера или факса, в редактируемый текст для последующей работы с ним в текстовых редакторах .

Для кого предназначена OCR CuneiForm?

Система распознавания текстов CuneiForm предназначена для всех, кому приходится вводить в компьютер факсы, книги, газеты, машинописные страницы, тексты договоров и т.д. Для работы с системой достаточно положить страницу с текстом в сканер, нажать кнопку, и через несколько секунд Вы получите готовый результат в многофункциональном текстовом редакторе.

Какие шрифты распознает OCR CuneiForm, требуется ли обучение?

CuneiForm - шрифтонезависимая (OmniFont) система. Алгоритмы, заложенные в CuneiForm, исходят из правил написания букв, из их топологии, и не требуют задания каких-либо эталонов, или обучения.

В системе используется технология интеллектуального самообучения на базе адаптивного распознавания символов.

Распознаются любые печатные шрифты - книги, газеты, журналы, распечатки с лазерных и матричных принтеров, тексты с пишущих машинок и т.п.

Не распознается рукописный текст и декоративные шрифты (готический, стилизованный под рукописный).

В CuneiForm существуют специальные настройки для распознавания текстов с матричного принтера и факсов 200x100 dpi.

Чем OCR CuneiForm отличается от других подобных программ?

  • качеством распознавания;
  • высокой скоростью работы;
  • использованием уникальных технологий, таких как адаптивное распознавание, нейронные сети, когнитивный анализ альтернатив распознавания и других;
  • простой использования и интуитивным интерфейсом;
  • функциональным наполнением, наличием многих дополнительных возможностей.

Поддерживает ли OCR CuneiForm работу с таблицами?

Да. Программа автоматически находит в тексте таблицы различной структуры, в том числе без линий разграфки. Встроенный редактор поддерживает редактирование таблиц (можно уменьшать/увеличивать, удалять/создавать колонки и т.д.)

CuneiForm - скачать бесплатно CuneiForm

Скриншоты программы CuneiForm: Видео о программе:

Основные особенности и ключевой функционал программы Cunei Form 12:

Если есть сканированные документы и вам необходимо отредактировать их, вам поможет  CuneiForm, она распознает и сохранит текст, чтоб его весь не набирать вручную. Этой программой поддерживается 24 языка для распознавания, включая английский, немецкий, русский и украинский.  CuneiForm работает в качестве системы преобразования электронной копии бумажного документа и графического файла в редактируемую форму при возможности сохранить структуру и гарнитуру шрифта оригинала в автоматических либо полуавтоматических режимах.

Система в себя включает две программы для пакетной и одиночной обработки электронного документа. CuneiForm – обладает возможностью экспортировать тексты в MSexcel, MSword, либо в текстовый файл.

  • приемлемые скорости работы;
  • распознавание текстов более чем на 24 языках
  • авто сохранения иллюстраций (цветных и черно-белых), таблиц;
  • сохраняет топологию страницы;
  • поддерживает пакетный режим сканирований и распознаваний;
  • встроен помощник работы с программой;
  • совмещенные показы изображения и результата распознаваний
  • авто-фрагментный режим работы позволяет искать блоки текста, таблиц и изображений, полуавтоматические и ручной режим фрагментации;
  • распознаёт таблицы любой сложности и структуры, в т. ч. без отображения линии табличных сеток;
  • текстовый собственный редактор при работе с распознанными текстами;
Сuneiform скачать с нашего сервера бесплатно и без регистрации:

Последняя версия программы: 12

CuneiForm скачать бесплатно русская версия

CuneiForm скачать бесплатно

Бесплатная программа для распознавания текста с электронных документов

CuneiForm – это программа для распознания и перевода в редактируемый вид бумажных и электронных графических документов. Использование уникальных технологий распознания отличает это программное обеспечение высоким уровнем преобразования даже ксерокопий плохого качества, текста, распечатанного на матричном принтере и машинописи.

Она поддерживает обработку не только одного, но и целого пакета электронных документов. При распознавании сохраняется структура и гарнитура шрифтов оригиналов. Программа работает с любыми печатными шрифтами, кроме декоративных и рукописных. Преобразованный документ можно редактировать в любых текстовых редакторах, экспортировать в офисные программы Word или Excel, а также осуществлять в нем полнотекстовый поиск.

Чтобы качество распознавания текстов всегда было на высоком уровне CuneiForm проводит словарный контроль. При необходимости пользователь может дополнять интегрированный словарь новыми словами. В процессе работы с документом программа анализирует его на наличие картинок и таблиц любой структуры, при чем, даже не имеющих сетки.

CuneiForm скачать бесплатно русскую версию можно для распознования документов примерно с 23 языков, а также смешанного русско-английского текста. Интерфейс приложения выделяется доступностью и информативностью, каждый пользователь может настроить его исходя из личных потребностей.

Основные особенности программы CuneiForm :

  • Распознавание печатных документов любого качества;
  • Пакетная обработка документов;
  • Распознавание таблиц любой сложности;
  • Сохранение структуры оригинального текста;
  • Экспорт текстов в Word или Excel;
  • Словарный контроль распознанных документов;
  • Поддержка 23 языков.
CuneiForm скачать бесплатно!

OCR CuneiForm скачать бесплатно русская версия

CuneiForm — это программа, которая может оптически распознавать любые текстовые документы. Система преобразует электронные копии бумажных носителей и графических файлов в удобный для редактуры вид.

При этом существует возможность сохранить структуру и гарнитуру шрифтов, такую же, как в оригинальном документе. Система CuneiForm имеет две программы, которые обеспечивают удобную пакетную и одиночную обработку документов.

?Электронные документы, обработанные с помощью CuneiForm, можно редактировать и в стандартных офисных программах, и даже в текстовых редакторах. Также их можно сохранять в наиболее популярных форматах и проводить полноценный поиск по ним. CuneiForm способен анализировать распознаваемый документ, находить в нем текстовые блоки, графические изображения, а также различные виды таблиц.

Можно программу CuneiForm скачать бесплатно на русском языке без регистрации и смс. Скачай CuneiForm бесплатно и попробуй возможности программы, которые позволяют распознавать таблицы с любой структурой, не зависимо от уровня сложности, в том числе и таблицы, лишенные сетки. Программа распознает большинство печатных шрифтов, книжные, журнальные, газетные, а также документы, распечатанные с матричных и лазерных принтеров и даже пишущих машинок. Встроенные в программу алгоритмы распознавания, такие как OCR и Optical Character Recognition, позволяют удачно распознавать текст с плохих факсов и ксерокопий. Документы могут быть распознаны на двадцати языках. Среди них имеется русский, немецкий, французский, английский языки.

CuneiForm заботится о том, чтобы качество распознавание всегда оставалось на высоком уровне. С этой целью программа использует словарную проверку. К тому же, имеющийся словарь можно значительно расширить за счет введения новых слов из распознаваемых файлов.

Скачать OCR CuneiForm бесплатно для Windows 7, XP, Vista

OCR CuneiForm Обзор программы

OCR CuneiForm – одна из лучших программ на мировом рынке, созданная компанией Cognitive Technologies для быстрого, а также качественного сканирования и распознавания отсканированных документов (распечатка, ксерокопия) в текст. Для наиболее качественного распознания текстов с распечаток и отсканированных листов, программа использует специальные алгоритмы OCR (Optical Character Recognition), которые способны легко и быстро определить язык, шрифты и т.д.

ПРИМЕЧАНИЕ! Для распознавания "сложных" документов, содержащих (таблицы, текст, рисунки или изображения плохого качества) лучше использовать ручную фрагментацию, а не мастер распознавания. Чтобы воспользоваться данной возможностью нужно выполнить следующие действия: "Получить изображение" -> "Разметка" -> Отредактируйте изображения и нажать "Распознавание".

  • Операционная система: Windows 7, XP, Vista.
  • Частота: 800 МГц.
  • Оперативная память: 256 Мб.
  • Свободного места на диске: 58.4 Мб.

Распознавание текста

Распознавание текста Содержание:

Оптическое распознавание текста англ. optical character recognition (сокр. OCR) — перевод последовательности изображений символа в последовательность кодов, использующихся для представления в текстовом редакторе. Перевод осуществляется с помощью различных алгоритмов, после преобразования изображения в набор элементарных точек.

CuneiForm 12

Бесплатная программа для автоматического распознавания отсканированного текста. Вид у программы не карамельный, но дело своё она знает.

Компьютер уже уверенно вошел в жизнь рядового гражданина. Когда надо получить сравнительно небольшой объем печатной информации, проще всего набрать этот текст вручную при помощи текстового редактора.

Однако иногда надо «переписать» целую книгу. В таких случаях рациональнее всего использовать сканер. Но сам по себе сканер делает только фотокопию текста, которую никак нельзя редактировать. Для того, чтобы изменить информацию на полученном изображении следует провести распознавание документа.

Бесспорным лидером в этом деле является система OCR (англ. optical character recognition — оптическое распознавание текста) от Abbyy — FineReader. Но стоит она довольно дорого и не каждый может позволить себе иметь в своем арсенале такой инструмент. Сегодня мы познакомимся с бесплатной альтернативой Файн Ридера — программой CuneiForm. Приведу сравнительную таблицу возможностей обеих пакетов:

Сравнение распознавалки текста CuneiForm с платным аналогом FineReader