Распознавание бухгалтерских документов. Распознавание форм

Интеллектуальное распознавание документов (I ntelligent D ocument R ecognition) — новая технология, которая обещает изменить способ обработки документов и направлена на извлечение важной информации из деловых и административных документов.

Решение существенно отличается от типовых программ распознавания текста и позволяет обрабатывать сложные документы любого типа и содержания. Ключевые особенности:

  • Компоновка формы бумажного документа и предопределение полей

    Готовые компоненты для распознавания данных любого типа: печатный текст (OCR), рукопечатный текст (ICR), естественный рукописный текст (Parascript ICR), метки (OMR), штрихкоды.

  • Инструменты для настройки

    Устранение углового перекоса, очистка изображение от мелкого мусора, удаление фоновой текстуры, возможность регулирования ошибок и отказов, настройка формата выходных данных.

  • Встроенная среда разработки

    Помимо штатных инструментов можно задействовать дополнительную логику при обработке документов используя языки программирования (C#, VB.Net). Все работы по созданию, тестированию, компиляции кода можно выполнять в пределах Form Xtra Capture.

Распознавание анкет и бланков

Обилие рукопечатных цифр и слов, наличие меток и подчеркиваний — все это присутствует в анкетах и бланках. Точно также в них присутствуют исправления, шум, рукописный текст (вписывая каждую букву в отдельную размеченную позицию, большинство людей невольно соединяют буквы и начинают писать их слишком близко друг к другу). В итоге, вместо рукопечатного текста анкета может содержать и рукописный. Form Xtra Capture - одно из немногих решений, которое позволяет справиться даже с распознаванием естественного рукописного текста. .

Распознавание опросных листов

Подобные формы содержат большое количество меток различных вариаций (одиночные метки или размеченные зоны). Кроме задач распознавания и последующего экспорта, необходимо контролировать корректность заполнения опросного листа. В зависимости от требований, документ можно признать недействительным, если респондент ставил несколько меток, где требовалась одна (или не ставил вовсе). Решение позволяет встраивать любую логику при обработке опросных листов, задавая различные правила и исключения. .

Распознавание инвентаризационных ведомостей

Как правило, инвентаризационная ведомость состоит из десятка страниц. На каждой странице присутствует размеченная таблица с большим количеством ячеек, некоторые из них заполняют рукописными цифрами. Однопроходное распознавание не даст приемлемый уровень точности. Решение позволяет задействовать алгоритмы голосования, где одна и та же ячейка распознается несколько раз, после чего их ответы сравниваются. Такой подход значительно повышает точность извлекаемых данных. .

Распознавание первичных бухгалтерских документов

Отличительной чертой первичных документов (накладных, платежных документов, чеков) являются их визуальные отличия. Накладные отличаются размерами, содержанием, компоновкой таблиц. Соответственно, местоположение полей, которые нужно распознать заранее неизвестно. В таких случаях можно прибегнуть к логическому исследованию документа и последующему динамическому распознаванию. Например, требуется найти и распознать содержимое поля «Сумма». Как правило, это поле расположено в нижней части формы, строкой выше присутствует поле «НДС», а зона для распознавания находится справа от текста «Сумма». Опираясь на подобное описание, можно распознать все объекты такого рода.

Сегодня система распознавания форм Form Xtra Capture является уникальным интеллектуальным решением с усовершенствованными механизмами обработки и распознавания данных. Это готовый инструмент для офисного использования больших корпораций и маленьких компаний.

С наступлением роскошного летнего сезона хочется закончить свою работу пораньше, не засиживаясь в офисе. Счастлив тот, кому удается потратить отпуск на запланированное оздоровление или провести время вместе с родными. К сожалению, работы у бухгалтера много в любое время года - и зимой, и летом. А перед уходом в отпуск нередко приходится работать вдвое больше, чтобы решить все вопросы заранее и не подвести своих коллег по ремеслу.

Что можно посоветовать бухгалтеру, для того, чтобы рутинной работы стало меньше и сезонные перепады (например, отчеты, проверки) не выбивали из колеи? Прежде всего — нужно сэкономить время на часто повторяющихся операциях, замедляющих выполнение самой важной работы.

По статистике, обработка первичных документов (актов, счетов-фактур и накладных) и занесение информации в базу «1С:Предприятие» отнимают чуть ли не все рабочее время у специалистов учетных служб торговых предприятий. Можно ли автоматизировать такую работу? На первый взгляд — это очень сложно, ведь множество операций выполнять нужно только самостоятельно, контролируя каждый шаг. Ввести все номенклатурные единицы после поступления или отгрузки товаров — это лишь половина дела, поскольку еще нужно выполнить проверку всех данных и устранить появление ошибок. Существует ли инструмент, который бы вводил информацию вместо бухгалтера, проверяя достоверность и точность информации?

С учетом указанной специфики и сложности выполняемой работы такие программы действительно разработаны, и позволяют сделать труд бухгалтера по вводу данных в системы 1С легким и простым.

Рассмотрим принцип быстрой обработки данных на примере использования программы (до 2009 года программа называлась «Цифровая Россия: Загрузка документов»).

Разработчики предлагают следующий путь решения - чтобы обработать информацию, предоставленную на бумаге, ее вначале нужно отсканировать. После сканирования производится извлечение информации, находящейся в таблицах счетов-фактур, актов и ТОРГ-12. Причем, обрабатываются бумажные и электронные форматы документов (Excel, PDF, JPEG).

Следующий шаг - этап автоматического ввода информации. Информация, полученная в результате распознавания, передается в базу 1С, упорядочивается по ячейкам в зависимости от контрагента, номенклатуры и т.д. По необходимости самостоятельно обновляется справочник 1С - новая информация вносится автоматически. При вводе документов можно создавать правила - программа запомнит их и разнесет номенклатуру в соответствии с утвержденным стандартом (таким образом устраняется и проблема сдваивания, дублирования данных). Пользователь программы делает предварительную проверку качества обработки информации, если всё устраивает, то нажимает кнопку «провести документы в 1С».

Рассмотрим один из примеров использования программы «Эффективные решения: Загрузка документов».

Документооборот торговой сети. Допустим, торговое предприятие имеет распределенную структуру, состоящую из склада, офиса, торгового дома или сети магазинов. При поступлении новых товаров менеджер склада сканирует документы с помощью специального потокового сканера (со скоростью от 20 до 100 листов в минуту), далее полученные скан-образы обрабатываются программой (информация распознается и передается в готовом виде в 1С), полученные данные останется только провести. Таким образом, один пользователь сможет за 1 день обработать более 1000 документов. Если база учетной системы 1С доступна через Интернет (например, установлена на сервере в головном офисе), то сканирование и распознавание данных можно производить в любом месте компании. Главное условие - иметь подключение к учетной системе 1С. Лучше всего, если вся информация будет обрабатываться в пункте поступления документов - в торговом подразделении или центральном офисе.

Какие преимущества получит торговой компании при использовании программы «Эффективные решения: Загрузка документов»? Назовем лишь несколько основных:

  • работу может делать один оператор по вводу, находясь в пункте поступления документов, в результате получает готовую информацию о поступлениях в оперативном режиме;
  • бухгалтерские и налоговые отчеты формируются в срок, поскольку исключается задержка на вводе информации;
  • отсканированную информацию можно одновременно сохранять в электронном архиве бухгалтерских документов, во многих случаях отсканированные счета-фактуры приравниваются контролирующими органами к оригиналам.

Всё больше и больше торговых компаний сосредоточивают свое внимание на централизации торгового учета и создании интернет-магазинов для продажи своей продукции. Использование электронной коммерции дает хороший импульс для увеличения продаж компании, но вместе с тем создает видимые сложности для работников бухгалтерии.

Рассмотрим эту проблему на конкретном примере. Возьмем случай из реальной практики (о внедрении программы в ЗАО «аиМЕД Технологии»).

Ситуация до внедрения программы «Эффективные решения: Загрузка документов».

Генеральный директор ЗАО «аиМЕД Технологии», Подгребельный А. Н.:

«Так сложилось, что разработка интернет-магазина нашей компании велась от интернета к учету, т.е. был сделан удобный веб-магазин как для покупателей, так и для менеджеров, где велись все действия по обслуживанию клиентов — от получения и обработки заказа, ведения клиента на всех этапах выполнения заказа, автоматического оповещения курьеров и склада, до формирования всех необходимых документов первичной отчетности (счетов-фактур, накладных). Однако нашим бухгалтерам приходилось заново вводить все операции по этим бумагам в «1С:Бухгалтерию». Естественно, всем хотелось минимизировать этот «мартышкин труд». Нами долго искалась возможные средства для синхронизации данных с бухгалтерией, и после долгих розысков мы нашли этот вариант: «Эффективные решения: Загрузка документов».

Ситуация после внедрения:

«Вариант оказался идеальным: наш магазин генерирует все документы в MS Excel, а потом с помощью программы «Эффективные решения: Загрузка документов» они практически автоматически оказываются в «1С:Бухгалтерии», автоматически создаются все проводки, новые контрагенты, и новые товарные позиции. К примеру, загрузка 200 документов занимает всего 3 минуты!!!

Когда я рассказывал нашим бухгалтерам о подобной возможности, они в один голос говорили что такое не возможно, но когда они увидели все в действии, их восторгу не было предела. Теперь работа бухгалтеров занимает гораздо меньше времени, а нам это позволило наращивать объемы продаж без риска задержки формирования отчетности и с минимальным ручным трудом по вводу первичных документов .»

Программа «Эффективные решения: Загрузка документов» установлена и успешно используется уже более чем в 1000 компаний различных сфер и направлений - строительных холдингах, аптечных сетях, образовательных учреждениях, финансовых и аудиторских службах, лесных хозяйствах и пищевых комбинатах, предприятиях сервиса и телекоммуникаций… Высокое качество, надежность работы и востребованность программы объясняется следующими факторами:

  • функционал программы базируется на основе решений ABBYY (напр., Fine Reader Engine), бесспорного мирового лидера среди систем распознавания информации;
  • программа имеет статус «1С:Совместимо», функционирует на базе известных программ линейки «1С:Предприятие» («1С:Бухгалтерия», «1С:Управление торговлей», «1С:Управление производственным предприятием» и др.);
  • для использования программы достаточно иметь обычный офисный сканер;
  • автоматически распознаются файлы большинства электронных форматов (Excel, PDF, TIFF, JPEG, и т.д.).

Чтобы убедиться в функциональности программы «Эффективные решения: Загрузка документов», разработчики предлагают будущим клиентам бесплатную онлайн-демонстрацию.

Все желающие могут и в удобное для себя время ознакомиться со всеми возможностями программы, а также оценить ее преимущества.

Одним из наиболее актуальных вопросов в работе любого предприятия можно считать ввод первичной документации в учетные системы. При некоторой пороговой цифре количества контрагентов, и, как следствие, при большом количестве первичной документации сотрудники просто физически не успевают переводить все данные с бумажных носителей на цифровые. А это, кстати, чревато последствиями в виде ошибок и упущений, что может сказаться в период подготовки отчетности, или во время формирования актов сверки взаиморасчётов. Выход есть, и одним из лучших представляется программным продуктом: «EFSOL: Загрузка документов».
Программный продукт «EFSOL: Загрузка документов» предназначен для автоматизации ввода первичных документов с бумажных носителей в программы «1С:Предприятие». Насколько это облегчает труд сотрудников по вводу документов даже трудно представить. По мере обновления программного продукта увеличиваются и его функциональные возможности. Так к настоящему времени программа позволяет с более высокой степенью точности распознавать данные и вводить все элементы документа в базу данных «1С:Предприятие». В последней версии программы добавлены многие возможности и улучшены функциональность и быстродействие. Среди новинок стоит отметить возможность определения группы справочника, в которую будут записываться создаваемые элементы, и возможности принудительного объединения многостраничных документов, если программа их разобьет на разные. Добавлен также механизм распознавания реквизитов на базе регулярных выражений (а это весьма значительный шаг). С полным перечнем нововведений в последнем релизе программы вы можете ознакомиться .

«Стоит ли игра свеч?» ответить несложно. Несомненно, стоит. Для того чтобы это увидеть воочию разберём основные цели и преимущества использования программы, что прольёт свет на вопрос актуальности использования. Итак, цели.

Использование программы можно сформировать одним предложением - оперативный ввод первичных документов в одну из программ 1С, с максимальной точностью (без ошибок), с минимальными трудовыми и временными затратами. Обозначив цель использования программы, перейдём к преимуществу использования. Теперь по каждому пункту.

1. Ввод первичных документов - да. Это основное назначение программы, с которым она, успешно справляется. Активные поддержка и развитие продукта позволяют с каждым новым релизом добиваться всё более продуктивных результатов. Кстати, во многом благодаря пожеланиям и отзывам пользователей программного продукта, которые ощутили преимущества и заинтересованы в дальнейшем развитии.

2. Оперативность автоматизированной загрузки первичных документов. Скорость сканирования можно оценить ориентировочно в 15-25 секунд, а при наличии сканера или МФУ с автоподатчиком документов ещё быстрее. При надлежащем качестве исходного документа и заполненной базе наименований, номенклатур, контрагентов и прочих справочников процесс распознавания и создания электронного документа можно оценить в 30-60 секунд. Программа распознаёт информацию на бумажном носителе и вносит в базу данных программы «1С:Предприятие» готовый документ. Если совпадение элементов в вашей базе не будет найдено, то программа создаст новые записи в справочниках (номенклатура, контрагенты и прочее), и выдаст вам нужный результат - готовый документ в электронном виде. Подобной скорости вряд ли смогут добиться даже несколько исполнителей.

3. Точность ввода. Об этом пункте можно сказать кратко. Компьютер не допускает опечаток, в отличие от человека, на которого может действовать фактор усталости, который может случайно нажать соседнюю клавишу с цифрой или буквой. Сканирование с распознаванием и автоматический ввод, который совершенствуется, раз за разом и дают прогрессирующий, в плане качества, результат.

4. Минимальные трудовые и временные затраты при использовании программного комплекса были достаточно аргументировано расписаны во втором пункте. Кстати экономия труда и времени будет расти в арифметической прогрессии по мере освоения программы «EFSOL: Загрузка документов», а также по мере увеличения количества первичных документов, требующих ввода в 1С.

«Есть ли альтернатива?». Пожалуй, если альтернативой можно назвать ручной труд сотрудников, обладающих чрезвычайно высокими показателями скорости печати и в совершенстве знающими "горячие клавиши" в «1С:Предприятие». При этом от оператора требуется высокая самодисциплина и самоконтроль во избежание ошибок, практически всегда возникающих при ручном вводе.

Альтернатива ли это именно для вашей фирмы? Решайте сами. Но если вас все же заинтересовало данное решение, рекомендуем ознакомиться с демо-версией, для чего необходимо заполнить заявку .

EFSOL - официальный партнер фирмы 1С. Компания оказывает услуги от поставок программ до комплексной автоматизации предприятий. Одна из ключевых компетенций компании - это разработка и внедрение решений потокового ввода документов в программы «1С:Предприятие».

Для использования обработки на вашем компьютере должен быть установлен сканер (обработка его найдет сама).

После добавления внешней обработки к информационной базе в тех справочниках и документах системы, которые позволяют делать прикрепление файлов, появится такая кнопка:

При нажатии на нее появляется окно настроек сканирования. Старайтесь без необходимости не выставлять максимальные настройки (цветное сканирование, большое разрешение), т.к. в этом случае размер файлов будет значительным, и если такихфайлов будет много, то размер базы очень сильно увеличится.

Для того, чтобы данное окно не появлялось каждый раз при начале сканирования, установите признак Запомнить :


После заполнения настроек нажмите Загрузить скан , далее вы услышите характерные звуки работы сканера - процесс сканирования начался.

После окончания сканирования и прикрепления файла к объекту системы в нижнем углу рабочего экрана появится такое сообщение:

Перейдем по ссылке Файлы и убедимся, что процесс завершен успешно:

В качестве имени файла используется текущая дата. Если необходимо прикрепить к объекту конфигурации несколько сканов, повторяем процедуру нужное число раз.

Напоминаю , что данная обработка универсальна - подходит для всех типовых конфигураций 1С:Предприятие 8.3 и автоматически подключается ко всем объектам конфигурации, позволяющим делать прикрепление файлов.

Внимание! Обработка работает только в файловых базах.

Доброго времени суток, уважаемые форумчане. Расскажу немного о своем опыте реализации сканирования в нетиповой самописной базе 1С.

Итак, имеем следующее:

1. Нетиповую конфигурацию 1С.

2. Жгучее и местами непреодолимое желание пользователей сканировать документы

В итоге изучения нескольких обработок и разных компонент, предоставленных нашими форумчанами, появились 2 обработки, на которых я и тестировал работу в разных режимах По итогам тестирования я лично выбрал сканирование через типовую компоненту TWAIN. Потому как она оказалась самой работоспособной и еще стабильно работает через Citrix, что являлось основным критерием выбора.

Немного резюмируя итоги всего процесса хотелось бы заметить, что:

Если у Вас файловая или база, которая использует стандартный интерфейс 1С, без всяких цитриксов, я бы рекомендовал использовать WIA, с ним работать легко и просто, меньше вероятность ошибки

Если же у Вас Citrix, то WIA у Вас работать не будет,(такое вот ограничение накладывает Citrix и с ним придется считаться), поэтому я бы рекомендовал использовать стандартную компоненту 1С из последнего релиза какой-нибудь типовой конфигурации(на данный момент я использовал TWAIN компоненту из UT_11.1.10.180) и играться уже с ней.

Минусы второго подхода заключаются в следующем:

1. Если у Вас в списке драйверов отражаются несколько устройств, то TWAIN драйвер не проверяет, работают они или нет. Они благополучно попадают в список доступных устройств. А далее, если вы случайно выбрали устройство, которое уже не работает или недоступно, то начинаются чудеса... Вы выбираете некорректный сканер, пытаетесь на нем отсканировать и попадаете в ошибку. Все вроде хорошо, но если вы настолько упорны, что пытаетесь отсканировать еще раз, то компонента просто "ложит" вам сеанс и вам придется заходить ещзе раз. Частично решается конечно путем запоминания последнего корректно устройства для сканирования, но определенную долю неудобства все же доставляет(Кстати в 1С я так же писал обращение по этому поводу и вроде даже что-то исправлялось, но вот как-то не до конца).

2. Так же через компоненту нельзя понять работает сканер или нет, ну вот нет такой функции,... Функция работоспособности просто возвращает вам весь список установленных драйверов. Найти же устройства через PowerShell или всякие функции Windows так же не получается, потому как большинство устройств в офисе являютс МФУ и даже названия в драйверах принтера и сканера отличаются, а лазить в реестр времени не было, да и толку наверное тоже.