Система Orphus
Рассылка
 Вы подписаны на
Новости  
Статьи и материалы  


Главная Продукты Система "eDocLib:Актив Бизнес" Система "Поточное сканирование"

Система "Поточное сканирование"

Описание системы

Решение «Поточное сканирование» компании «ЭОС» помогает  легко и быстро перевести в электронный вид большой объем бумажных документов. Эффективная организация поточного сканирования позволяет значительно сократить время массового перевода документов в электронный вид. «Поточное сканирование»  это коробочное решение. В том чисое продукт может использоваться совместно с системой eDocLib: Актив Бизнес.

Распознавание отсканированного документа и его сохранение в текстовом виде существенно расширяет возможности по его дальнейшей обработке. К примеру, становится доступным быстрый поиск по содержанию документов. Механизм распознавания текста в «Поточном сканировании» базируется на возможностях продукта ABBYY FineReader Engine 9.0, по праву считающегося лучшим решением для распознавания.

При традиционном подходе, обработка текста при распознавании  может занимать достаточно много времени. В решении «Поточное сканирование» предусмотрена возможность  параллельной обработки текста на нескольких серверах одновременно, что позволяет добиться любой необходимой скорости  обработки.

Описание технологического процесса обработки документов

Принцип  поточного сканирования основан на том, что при регистрации на документ наносится штрих-код. После этого помеченные штрих-кодом документы сканируются и автоматически (по штрих-коду) связываются с регистрационной карточкой соответствующего документа. Если  на сканируемые документы уже нанесен  штрих-код стандартного формата, то он также может  быть использован для идентификации. Структурная схема работы системы представлена на рисунке.

ps2

Структурная схема работы системы

В процессе сканирования предусмотрены как опция сохранения  непосредственно графического образа документа, так и  возможность последующего распознавания и сохранения в текстовом формате, что существенно облегчает дальнейшую работу с документом  и расширяет возможности использования поиска. Распознавание и перевод в текстовый формат реализуется с помощью ABBYY FineReader Engine 9.0.

Предусмотрено создание нескольких профилей для различных размеров и расположения штрих-кода на документе. Сохранение отсканированного образа возможно в любом из распространенных текстовых или графических форматов:

ps1

Меню настроек «Поточного сканирования».

Решение  «Поточное сканирование» позволяет  обрабатывать документы на всех языках, поддерживаемых ABBYY FineReader, включающих к настоящему моменту: русский, английский, немецкий, французский, испанский, итальянский, шведский, финский, болгарский, венгерский, словацкий, чешский, башкирский, белорусский, казахский, украинский.

Регистрация и сканирование документов

Регистрация документа, т.е. создание регистрационной карточки, выполняется по обычным правилам используемой системы электронного документооборота. Далее, при обращении к системе «Поточное сканирование» происходит регистрация заявки на сканирование, генерация штрих кода и  указание параметров заявки (расположение штрих-кода, требуемые форматы, необходимость распознавания). После записи регистрационной карточки документа в базу данных на первую страницу документа или на отдельный лист бумаги с помощью принтера наносится штрих-код, содержащий уникальный идентификационный номер документа и устанавливающий правила его обработки (печать полученного изображения штрих-кода осуществляется средствами системы документооборота). Далее пакет зарегистрированных документов помещается в устройство подачи бумаги сканера, после чего вся обработка документов производится автоматически.

ps3

Назначение штрих-кода в системе eDocLib.

Применение штрих-кода

В процессе сканирования, нанесенный штрих-код используется как признак окончания текущего документа и начала следующего, а содержащаяся в штрих-коде дополнительная информация применяется для дальнейшей идентификации обрабатываемого документа.

Графические документы

При сохранении графического образа документов система обеспечивает возможность конвертации изображений сканируемых документов в следующие форматы:

  • BMP (Windows or OS/2 bitmap);
  • PNG (Portable Network Graphics);
  • TIFF (Tagged Image Format);
  • JPEG (Joint Photographic Experts Group);
  • PDF (Portable Document Format).

Для каждого формата предусмотрена возможность указания размеров изображения и дополнительных атрибутов (глубина цвета, тип сжатия и т.п.). Если размер требуемого формата отличается от текущего графического представления, то может быть выполнена конвертация с применением заданных параметров.

ps4

Рабочее окно системы eDocLib c интегрированной опцией «Поточное сканирование». Отсканированный документ прикреплен к регистрационной карточке.

Текстовые документы*

В случае применения технологии распознавания текста, предусмотрена возможность сохранения в большинстве наиболее  распространенных форматах файлов:

  • Текстовый файл (.txt);
  • Rich Text Format (.rtf);
  • Microsoft Excel, Microsoft Excel 2007 (.xls, .xlsx);
  • Microsoft Word 2007 (.docx);
  • HTML (.html);
  • XML (.xml);
  • PDF (Portable Document Format).

Для каждого из форматов записи  предусмотрена возможность указания дополнительных атрибутов (размер страницы, кодировка и т.п.). Режим сохранения в виде PDF-файла поддерживает все четыре основных режима записи в PDF - только текст и изображение; только изображение; текст поверх изображения страницы; текст под изображением страницы.

Таким образом, система  «Поточное сканирование» реализует эффективную технологию  преобразования бумажных документов в электронный вид и позволяет в сжатые сроки осуществить переход к работе с электронными образами документов.  Продуманные настройки, гибкие механизмы управления и подробная документация для разработчиков делают работу с системой удобной и результативной.

*Список поддерживаемых текстовых форматов зависит от возможностей используемой системы распознавания и может изменяться.

 

Баннер
Баннер
Баннер
Баннер
Баннер