Главная Блог Статьи Конференции Портфолио Flash-point RSS  RU EN

Владимир Бондаренко

Специалист по web-технологиям
ПОСЛЕДНИЕ ЗАПИСИ
  •  Тьма за спиной – мобильный квест написанный Виталием Зыковым
  •  Автоматизация процессов в компании: объединение всей информационной среды в одной системе Mauris CRM (CMS + SalesForce + MailChimp + мобильное приложение)
  •  10 советов по созданию страницы своей компании в «Википедии»
  •  Сравниваем форматы для документирования RESTful API: WADL, Swagger, I/O Docs, API BluePrint, RAML, Google API Discovery, Apimatic

  • ОБЛАКО ТЕГОВ
    Ajax Apple Chrome cloud CMS ECM Flash-point Folium iPad iPhone Java Script jQuery mobile development MVC PHP Python RESTful API SDK SEO StarCraft Swagger Twitter блоги видео кодирование конференция обучение SEO оцифровка информации плагины презентация программирование развлечение скрипт советы сравнение технологии хостинг ЧПУ
    КОНТАКТЫ

    Skype: coolweb_ua

    twitter

    СЧЕТЧИК


    Возможно ли распознать рукописный текст off-line?

    Я почти два года работаю в компании, которая занимается оцифровкой архивных и библиотечных фондов. Сканирование информации у нас поставлено на поток  и в сутки мы получаем десятки тысяч графических образов, которые необходимо распознать и выгрузить заказчику. Моя задача состоит в создании конвейерной  технологии для распознавания информации с графических образов.

    В этой посте я хочу поделиться полученным опытом и ответить на вопрос о реальности распознавания рукописного текста. Надеюсь, это избавит вас от потерь времени на изучение форумов и многочасовое тестирование различных программ.

     

    Система тестирования

    На протяжении всего существования компании мы тестируем различные технологии для достижения максимальной скорости обработки информации. От успешной автоматизации этапов оцифровки напрямую зависят трудозатраты компании и стоимость единицы информации. У нас есть квалифицированные сотрудники, которые тестируют все, что можно найти на сегодняшний день в Интернете.

     

    Печатный текст

    Он не представляет больших проблем.   ABBYY FineReader является безоговорочным лидером в данном сегменте. Сейчас существует много систем документооборота, где функция распознавания от ABBYY встроена в софт.

    Программы распознавания разрабатываются с уклоном на стандартную документацию компаний, которые является основными потребителями софта. Они не рассчитаны на нестандартные форматы, поэтому программы не могут дать уровень достоверности выше 80%.

    Возможно ли распознать рукописный текст off-line?

    При работе с библиотеками, например, приходится сканировать библиотечные карточки (указатели на книги), которые постоянно пополняются. Таким образом, печатная карточка десяти-двадцати летней давности может быть в очень плачевном состоянии, с исправлениями и карандашными пометками.  С такими графическими образами даже ABBYY FineReader не может справиться с результатом достоверности выше 60%. После полученного результата необходимо вручную исправлять текст.

    Вывод: свежая документация может быть распознана программой почти на 100%, нестандартные форматы данных, плохое состояние документа дадут результат с достоверностью  в 60%-80%.

     

    Рукописный текст

    На хабре есть пост, где автор рассказывает о своей программе распознавания рукописного текста. В описании продукта он указывает, что программу нужно обучить. Это и есть главный камень преткновения. У ABBYY FineReader тоже есть версии программы, где после обучения, она должна распознавать текст. Суть проста – продукт представляет собой пустую нейронную сеть.  Пользователю необходимо ее наполнить вручную. Если пользователь пытается распознать несколько почерков, программа не сможет выдать результат. Чаще всего нужно распознавать почерки разных людей. Потратив неделю времени на обучение такого программного решения, в итоге, мы не получили положительного результата. И это при том, что я рассматриваю только варианты, когда все написано ровно и аккуратно, в других вариантах софт бессилен.

    В случае потокового распознавания результат получается плачевный. Достоверность нулевая. Наглядно показан результат на скриншоте.

    Возможно ли распознать рукописный текст off-line?

    Вывод:  применение автоматизированных программ для распознавания рукописного текста на сегодняшний день почти невозможно. Ввод оператором информации с графического образа является единственным способом получения оцифрованной информации.

     

    Точность данных

    В обоих случаях распознавание тестировалось на 10000 электронных образов различных форматов с 300 DPI и больше.

     

    Напоследок

    О самом  большом проекте моей компании (ЭЛАУ) по оцифровке библиотечных фондов (550 000 карточек) можно почитать по ссылке и посмотреть пример еще не распознанного каталога.

    Если этот пост будет воспринят положительно, я опубликую продолжение и расскажу о том, как построена технология автоматизации библиотек в странах СНГ. Особое внимание я уделить модулю,  с интересными особенностями, который отвечает за отображение информации в интернете. 


    Теги:  оцифровка информации, технологии, советы

    Читать по теме:

     Автоматизация процессов в компании: объединение всей информационной среды в одной системе Mauris CRM (CMS + SalesForce + MailChimp + мобильное приложение)
     Сравниваем форматы для документирования RESTful API: WADL, Swagger, I/O Docs, API BluePrint, RAML, Google API Discovery, Apimatic
     Автоматическая генерация SDK для RESTful API
     Пишем свою программу для чистки переполненного диска C: на Python

    loading

    Написать комментарий

    Имя:
    Почта (скрыта):
    Сайт:
    Текст: :) :( 0_o =-0 =-D 8-) :-(( TT >:o ]:->

    Использование любых материалов сайта возможно только при размещении активной и прямой ссылки на VBond.Kiev.ua.

    Главная | Блог | Статьи | Конференции | Портфолио | Flash-point | RSS

    developed by Bondarenko Volodymyr