Формализованный вид документа. Электронные документы - факты, законы и важные нюансы

02.10.2012

Электронное декларирование (ЭД2). Альта-Софт.

14 сентября 2012 в Digital October (г. Москва, Берсеневская набережная, 6, стр. 3) состоялся Круглый стол на тему: «Информационные таможенные технологии и актуальные аспекты таможенного оформления товаров».

На семинаре выступил Станислав Сергеевич Искендеров, заместитель генерального директора ООО "Альта-Софт". Тема выступления: "Перспективные IT-решения в сфере таможенного оформления".

Организатор мероприятия: компания «Альта-Софт» .

Видеозапись выступления Станислава Искендерова.

В первую очередь хотелось бы посвятить пару слов программным продуктам нашей компании, с которыми наверняка большинство из вас и начали наше знакомство и сотрудничество.

Наше основное направление деятельности это программы для декларирования. Это в первую очередь всем известная программа «Альта-ГТД», на которой многие из вас осуществляли бумажное декларирование. Сейчас большинство наших пользователей уже перешло на её ПРО версию, которая называется «ГТД-PRO» и имеет весь функционал, связанный с электронным декларированием.

И так же сравнительно молодой наш продукт, которому всего несколько месяцев – это система «Альта-ПИ». Система «Альта-ПИ» - это ограниченная до функционала предварительного информирования версия программы ГТД, которая необходима тем, кто занимается исключительно предварительным информированием. Данный продукт распространяется для абонентов нашей компании как информационного оператора свободно.

Помимо этого, достаточно большой интерес вызывает наша справочно-информационная система. Здесь стоит отметить, прежде всего, программу «Такса» – это калькулятор таможенных платежей. Удобная система, которая предоставляется как в виде полнофункционального программного продукта, так и в виде онлайн-сервиса, о котором я расскажу несколько позже.

Программа «Таможенные документы» («ТамДок»), которая позволяет работать полноценно со всей нормативно-правовой базой документов по таможенной тематике, искать нужные документы по ключевым словам.

Система «Товары и коды», которая пользуется все большей и большей популярностью у тех, кому необходимо классифицировать товар по кодам товарной номенклатуры, и связанное с ней приложение «Пояснения по товарной номенклатуре» («Пояснения к ТНВЭД»).

Также очень большой интерес вызывают средства автоматизации таможенного оформления.

Это, прежде всего, система «Заполнитель», которая позволяет автоматически преобразовывать данные из любых текстовых форматов в программу «ГТД», «Альта-ГТД», «ГТД-PRO» или «Альта-ПИ».

Система «Артикул», которая незаменима для участников ВЭД работающих с большой повторяющейся номенклатурой, артикульной базой. И средство автоматизации в масштабах предприятия – «ГТД-Сервер».

Также у нас есть специальные и вспомогательные программы, такие как «Альта СВХ-PRO» – новая версия программы «Альта-СВХ», которая поддерживает сдачу отчетности через интернет, аналогично системе электронного декларирования, которое сейчас как раз набирает обороты, начинается работа по электронной сдаче отчетности СВХ таможенным органам. Система «ЖД Тариф», предназначенная для расчета оптимальных маршрутов и провозной платы при железнодорожных перевозках. И программа «Отчет брокера», необходимая для сдачи брокерской отчетности.

Это линейка основных наших программных продуктов, которые решают практически полный перечень задач необходимых участникам ВЭД.

Большой популярностью пользуются онлайн-сервисы на базе этих программных продуктов.

Это конечно несколько ограниченные по функционалу по сравнению с настольными версиями, но в то же время весьма полезные инструменты, размещенные на нашем сайте. К ним относится прежде всего онлайн-версия программы «Такса», «Товарная номенклатура», онлайн-версия «Жд Тариф», сервис по поиску жд вагонов («Поиск вагонов») и классификатор адресов («КЛАДР»). Это топ-5 сервисов которые в онлайне пользуются у нас наибольшей популярностью, поэтому пару слов о них поподробнее.

Онлайн-версия «ТНВЭД» позволяет посмотреть максимально детализованную справку по тому или иному коду товара, посмотреть его классификацию, как видно на рисунке. Посмотреть какими он будет облагаться пошлинами, акцизами, НДС, какие требуются разрешительные документы и так далее.

Также на базе этого сервиса существует онлайн-система «Такса», которая позволяет в режиме реального времени с любого компьютера или смартфона подключенного к интернету рассчитать режим импорта товара, ставки пошлин, акцизы, НДС, посмотреть какие будут запреты и ограничения, рассчитать контракт по импорту этого. Данный сервис интересен тем, что он доступен одновременно на русском и английском языках.

Существует еще такой интересный онлайн-сервис, как «ЖД Тариф». Это аналог нашей программы, который позволяет рассчитать стоимость перевозки груза. Мы задаем параметры, станцию отправления, назначения, какой у нас груз и какие есть параметры у данной отправки, и после этого система строит нам детальный отчет, какой маршрут оптимальный для следования этого груза, какие есть варианты, сколько это будет стоить. То есть в режиме онлайн можно получить полную финансовую составляющую.

Ещё один онлайн-сервис для тех, кто пользуется железнодорожным транспортом - «Поиск вагонов». Сервис работает как в бесплатной, так и в платной расширенной версии. Мы можем ввести прямо на сайте www.alta.ru номер интересующего нас вагона или контейнера, получим уникальный пароль, вводим его и получаем отчет, где находится данный вагон или контейнер. Вот вы видите станция назначения, дорога и так далее, полная отчетность по данной системе.

Вы все знаете, что наша компания является ведущим информационным оператором по передаче электронных документов в таможенные органы.

Ключевое направление деятельности компании – электронное декларирование, в последующем к этому присоединилась и отправка предварительной информации, а также самая молодая и актуальная на данный момент тема - передача отчетности СВХ.

Для наших абонентов электронного декларирования мы оказываем дополнительные услуги, спектр которых постоянно расширяется, интерес к ним неуклонно растет.

Срочный выпуск электронной подписи. Наверное, многие из вас сталкивались что, когда подпись требуется получить быстрее, чем это предлагает ГНИВЦ, ныне правильно называется ЦТУ ФТС. Там сроки составляют порядка двух недель, поэтому для них у нас есть срочный выпуск. Есть сервис по формализации документов. Сервис по sms- и е-мейл уведомлению о тех или иных событиях. Многие из вас, возможно, видели наш мониторинг и биллинг, его функционал тоже значительно расширился за последнее время.

Для максимального удобства наших абонентов мы производим удаленную настройку всех рабочих мест по электронному декларированию, делается это совершенно бесплатно и не требует временных и финансовых затрат на вызов специалиста. Все наши абоненты, которые хотят настроить новое рабочее место или переустановить старое обращаются в нашу службу технической поддержки, наш специалист удаленно подключается к компьютеру и прямо в присутствии пользователя проводит все необходимые настройки.

Немного о срочном выпуске ЭЦП.

Срочный выпуск был запущен в феврале этого года. У нас в московском офисе мы начали прямо в присутствии клиентов, в день предоставления оригиналов документов выпускать сертификаты электронной цифровой подписи. То есть абоненты, которые обращаются к нам за этой услугой, не ожидают две недели обычного выпуска, а уходят из нашего офиса уже с готовым рабочим сертификатом ЭЦП. Эта услуга сейчас активно внедряется и запускается во всех наших филиалах. На данный момент она оказывается в Санкт-Петербурге, Набережных Челнах и во Владивостоке, срок выпуска в этих филиалах сейчас составляет 2-3 дня, но в ближайшее время станет возможным получить ЭЦП в день обращения. Этот список будет расширяться, так что услуга будет доступна для всей России.

Отдельно хочется сказать по новому, вызывающему большой интерес у наших абонентов, сервису по формализации документов. Что такое формализация документов?

Все мы знаем, что для подачи документа в таможенные органы по системе электронного декларирования или предварительного информирования нужно его формализовать, то есть потратить некоторое время на то чтобы бумажный документ перевести в электронный вид: отсканировать, распознать, потом исправить ошибки или просто напечатать этот документ. У наших абонентов иногда складываются ситуации, когда они не хотят этим заниматься, не хотят тратить на это время, или просто им не располагают, по причине высокой загрузки. Мы рады прийти им на помощь с помощью этого сервиса. Здесь на слайде представлен пример в виде инвойса, хотя естественно там может быть любой документ предусмотренный альбомом форматов. Наш клиент закачивает этот документ к нам на сервер, после чего операторы формализуют этот документ и отправляют обратно уже готовый xml файл. К нам приходит либо текст в виде exel, pdf, либо скан в jpg или в любом общепринятом формате. В ответ через полчаса-час, в зависимости от объема работы, количества страниц, приходит готовый формализованный документ. У нас работает целая группа операторов по этому направлению. Стоит эта услуга сравнительно рынка недорого – 149 и 185 рублей за текстовый и сканированный документ соответственно. Полученный ответ можно сразу же загрузить в программу ГТД-PRO, он уже формализован по текущему альбому формату определенному ЦТУ ФТС и готов к отправке в таможенные органы.

Помимо этого многие из вас видели, что мы всем нашим абонентам системы электронного декларирования представляем отчет по пересылкам.

Что такое пересылки? Это информационный обмен в рамках одной процедуры декларирования. Сервис пользуется достаточно большим интересом, потому что часто возникают спорные моменты, где задержалась декларация, была ли она отправлена в срок, не была, когда таможенный орган на нее ответил. И нашим пользователям удобно отслеживать все это дело в режиме реального времени.

На базе этого сервиса недавно был запущен его расширенный вариант, который называется «Монитор ЭД».

Он позволяет не только получить детальную информацию по каждой пересылке. Здесь мы видим, когда был документ сформирован, какой тип документа, в каком альбоме он представлен, когда и на какой пост был отправлен, за чьей подписью и соответственно какой инспектор его обрабатывал. Также можно посмотреть и в целом состояние по предприятию.

Вот эта система называется «Монитор ЭД», она доступна по персональному логину/паролю каждому абоненту и позволяет комплексно увидеть какие декларации находятся в данный момент в каком статусе таможенного оформления. Этот инструмент пользуется интересом не только у декларантов, но и у руководителей, которым интересно отслеживать обработку грузов, как в офисе, так и возможно во всех филиалах компании, потому что мы рекомендуем нашим абонентам в рамках одного договора работать со всеми своими подразделениями.

Помимо этого сейчас запущен дополнительный сервис sms и е-мейл уведомлений. Очень часто, у небольших компаний в особенности, возникает ситуация когда декларант отправил декларацию в таможенный орган и хочет получить информацию, когда по ней будут запрошены документы или принято какое-то решение инспектором. Но при этом не сидеть за компьютером и не ждать, когда этот ответ поступит. Именно для этого есть услуга е-мейл и sms уведомлений. Здесь, на примере отдельно взятой процедуры декларирования, в качестве примера выбран режим импорт 40, мы видим, какие могут наступить статусы по этой процедуре. Галочками можно отметить, какие из них нас интересуют. Указать, кого их контактов подписать на эти уведомления и как только из таможни придет соответствующее сообщение, несмотря на то, что компьютер декларанта может быть вообще выключен, он получит себе на телефон или на е-мейл, или туда и туда соответствующее уведомление. Например, о том, что принято решение по товарам или декларация отозвана или переведена на бумагу. Эта система позволяет, даже не находясь за компьютером, полностью отслеживать статус по интересующим нашего абонента декларациям.

Развитием этого сервиса стало построение полноценной отчетности в режиме онлайн.

Ранее, для того чтобы таможенный представитель мог сдать отчетность, ему необходимо было со всех филиалов своих реплицировать базы данных в единое хранилище и уже на базе данных этой центральной базы строить те или иные отчеты. Для того чтобы не требовать от наших абонентов такой сложной инфраструктуры, мы разработали аналогичный продукт работающий в онлайне. Так как все данные и так передаются через наш сервер, по заказу абонента мы можем собирать заказанную им статистику по любым полям этой декларации. Данный сервис, хоть и называется отчет таможенного представителя («Отчет ТП»), но он интересен не только таможенным представителям, но и участникам ВЭД которые хотят иметь в режиме реального времени полную статистику, полную картину оформления товаров.


Теги: Альта-Софт, программа, предварительное информирование, декларирование, онлайн-сервис, программный продукт, СВХ, ТНВЭД, декларант, таможенный орган, ЭЦП
Автор(ы):

В отличие от бумажных документов, электронные могут обрабатываться более эффективно (тиражироваться, рассылаться, храниться и т.п.). В настоящее время активно развиваются технологии перевода бумажных документов в электронную форму с целью реализации электронного документооборота . Остановимся подробнее на применяемых технологиях и используемой терминологии.

На первом этапе перевода документа в электронную форму производится его сканирование и создается электронная копия документа в виде изображения. Изображение, полученное в результате сканирования, также называют образом документа. Сканирование является начальным этапом любой системы автоматизированного ввода документов.

В процессе сканирования может выполняться программная обработка изображения, а также производится визуальный контроль качества (рис. 3.6).


Рис. 3.6.

Если речь идет о промышленном вводе документов, то сканеры обычно предоставляют ряд дополнительных функций, например возможность подачи разноформатных документов.

Обычно процесс сканирования - это промежуточная стадия получения электронного документа. Очевидно, что с электронным изображением документа гораздо удобнее работать, чем с бумажным (его можно копировать, отправлять по сети и т.д.).

Однако в большинстве случаев само по себе изображение (образ документа) дает мало преимуществ. Для того чтобы можно было редактировать документ, осуществлять поиск по нему или использовать его фрагменты при подготовке новых документов и т.д., необходимо перевести полученный образ в текстовый документ, понятный офисным программам. Поэтому следующая задача заключается в распознавании отсканированных документов.

Для этого необходим специальный инструмент, способный перевести изображение в текстовый редактируемый электронный документ. Такие инструменты существуют, их общее название - программы оптического распознавания символов (optical character recognition, OCR). C помощью OCR-программы компьютер сможет "прочесть" на отсканированной странице текст, отделив его от иллюстраций и прочих элементов оформления, найти таблицы и "разобраться" в их содержимом. А затем скомпоновать все это заново, воссоздав внешний вид страницы.

С точки зрения перевода документов в электронный вид (ввода документов в компьютер) их условно делят на формализованные, неформализованные и специальные (рис. 3.7).


Рис. 3.7.

Формализованные документы - это документы, в которых заранее определена форма: расположение обязательных полей, в которые заносятся данные. Например, бланки, накладные, анкеты, картотеки и т.д. Неформализованные документы - это документы произвольной формы: договоры, письма и т.д. К специализированным относятся такие документы как, например, карты и отпечатки пальцев.

Перевод каждого из перечисленных видов документов имеет свою специфику. Если вводятся фотографии, то достаточно электронного изображения, если документ содержит текст, его необходимо распознать, если это форматированный текст с рисунками, то нужно не только распознать текст, но и восстановить формат документа, а если это анкета, то, скорее всего, сам документ вообще не нужен, важна только содержащаяся в нем информация. Например, при обработке листов для голосования обычно не требуется изображения самого документа, достаточно информации о том, за кого отдан голос.

Ввод формализованных документов

Чтобы пояснить, какие задачи возникают при вводе формализованных документов, рассмотрим конкретный пример.

Предположим, в офисе отеля проводится анкетирование проживающих для оценки уровня обслуживания на разных этажах. Каждому жителю отеля в его номере оставляется анкета, которую он должен заполнить (рис. 3.8).


Рис. 3.8.

Если за месяц накапливается несколько тысяч таких анкет, то их обработка представляет собой непростую задачу. Очевидно, что получение образов (электронных изображений) этих анкет хоть и облегчает задачу их хранения, однако не позволяет использовать компьютер для обработки информации.

Чаще всего задача ввода форм (в данном случае анкеты) состоит в превращении образа документа в строчку базы данных, содержащую соответствующую информацию. Когда все анкеты будут введены в базу данных, можно будет их обработать и, например, выяснить, на каком этаже обслуживание ведется лучше.

При заполнении анкеты требуется ответить на вопросы и внести информацию в определенные служебные поля, а задача программы при вводе форм - определять эти специальные поля, распознавать информацию в них и ввести ее в базу данных. При этом особенностью ввода форм в компьютер является необходимость распознавания текстов, заполненных от руки.

Обычно в том случае, если форма должна распознаваться компьютером, заполняющего просят ввести текст раздельными буквами, и такой текст называют рукопечатным. Технологии распознавания рукопечатных символов обозначаются термином ICR (Intelligent Character Recognition). Распознавание рукопечатных символов представляет собой более сложную задачу по сравнению с распознаванием печатных, поскольку требуется распознать символ, вписанный в форму от руки с учетом возможных его отклонений, обусловленных индивидуальными особенностями почерка.


Рис. 3.9.

Задачи распознавания при вводе форм не обязательно связаны с распознаванием текста. При вводе форм может потребоваться распознавание различных меток и знаков, для которого тоже существует свой термин: OMR (Optical Mark Recognition). Например, в бюллетенях для голосования голосующего просят поставить крестик (или другой знак) напротив фамилии кандидата, и задача компьютера - распознать, есть в определенном поле какой-нибудь знак или нет.

Имиджинг

а первом этапе перевода документа в электронную форму производится его сканирование, которое позволяет получить электронную копию документа в виде изображения. Данный процесс называют имиджингом (imaging). Таким образом, имиджинг - это процесс получения аутентичных изображений бумажных документов. Термин пришел из микрофильмирования, однако сегодня применяется именно к электронным изображениям. Имиджинг является начальным этапом любой системы ввода документов. На этом этапе выполняются задачи сканирования, обработки изображения и контроля качества (рис. 1).

Сканеры позволяют оцифровывать изображения, а также предоставляют ряд дополнительных возможностей, таких как аппаратная поддержка качества изображения и выравнивание страниц.

Выравнивание страниц может производиться как аппаратно, так и программно (рис. 2).

Если речь идет о промышленном вводе документов, то сканеры обычно предоставляют ряд дополнительных функций, например возможность подачи разноформатных документов в одной пачке, а также позволяют использовать большие пачки документов и т.д.

Обработка изображений

Как уже было отмечено, часть функций обработки изображений может быть реализована аппаратно в сканере, а может производиться на станции сканирования. Улучшение изображения включает программное выравнивание, конвертирование с улучшением качества, удаление шумовых и фоновых элементов, улучшение качества передачи текста и т.д.

Наиболее важной технологией на стадии распознавания документов является технология OCR, о которой следует рассказать более подробно.

Технологии OCR/ICR

Традиционный подход к проблеме распознавания заключается в сведении задачи распознавания к задаче классификации некоторого набора признаков. Идея проста: по изображению определяется некоторый набор признаков, который сравнивается с каждым из имеющихся образцов, так называемых эталонов. По результатам сравнения находится эталон, с которым этот набор признаков совпадает лучше всего, и изображение относится к соответствующему классу. Таким образом, все решение заключается в сравнении предлагаемого изображения с образцами и выборе наиболее подходящего; иначе говоря, производится некий перебор возможных вариантов. Проблема имела бы простое решение, если бы не существовало сотен шрифтов, полученных по факсу текстов с плохо читаемыми символами и т.д.

В качестве основных алгоритмов решения данной задачи выделяют multifont (шрифтовые) и omnifont (шрифтонезависимые) алгоритмы. В случае multifont растровое изображение накладывается на шаблон, и соответственно наиболее подходящим шаблоном считается тот, у которого наименьшее количество точек отличается от исследуемого изображения. Omnifont-алгоритмы идентифицируют символ по правилам его написания. В этом случае эталон, с которым производится сравнение, содержит в себе информацию о правилах написания символа. Оба алгоритма имеют вероятностную природу и позволяют сделать предположение о принадлежности данного символа. Основная задача при распознавании текстов - это повышение вероятности принятия правильного решения, то есть уменьшение доли ошибок. Существует несколько подходов к повышению качества распознавания. Например, алгоритм может содержать комбинацию шрифтового и шрифтонезависимого подхода. Существенное увеличение точности распознавания достигается за счет использования самообучения системы. Это позволяет, например, распознавать плохо пропечатанные символы с помощью шрифта, созданного на основе достаточно хорошо пропечатанных символов. Следует отметить, что на текстах хорошего качества лучше работают одни алгоритмы, на текстах плохого качества - другие, а для распознавания табличных форм удобнее использовать третьи и т.д. Существуют подходы, при которых экспертная система, встроенная внутрь ядра распознавания, сама выбирает оптимальный для данного текста алгоритм.

Альтернативой традиционному шаблонному методу распознавания стало распознавание на основе принципов целостности, целенаправленности и адаптивности, так называемая IPA-технология, на которой основана система распознавания компании ABBYY - FineReader.

Согласно принципу целостности, распознаваемый объект рассматривается как целое, состоящее из частей, связанных между собой пространственными отношениями. Изображение интерпретируется как определенный объект, только если на нем присутствуют все структурные части этого объекта и эти части находятся в соответствующих отношениях. Указанные части получают интерпретацию только в составе гипотезы о предполагаемом объекте.

По принципу целенаправленности распознавание строится как процесс выдвижения и целенаправленной проверки гипотез о целом объекте. Источниками гипотез являются признаковые классификаторы и контекстная информация. Части картинки анализируются не априори, а только в рамках выдвинутой гипотезы о целом. Традиционный подход, состоящий в интерпретации того, что наблюдается на изображении, заменяется подходом, состоящим в целенаправленном поиске того, что ожидается на изображении.

Принцип адаптивности подразумевает способность системы к самообучению.

Именно использование этих основополагающих принципов помогло добиться высочайшего качества распознавания, которое демонстрирует система ABBYY FineReader.

Отдельной задачей является распознавание рукопечатных символов, заключающееся в необходимости распознать символ, несмотря на особенности почерка человека.

Классификатор рынка систем ввода документов

Начале статьи мы упомянули о некоторой терминологической путанице и до сих пор не привели примеров. Дело в том, что упоминаемые выше термины, которые мы ввели при описании технологических процессов, используются также для определения соответствующих секторов рынка и здесь часто имеет место неоднозначность.

Для того чтобы разобраться в терминологии применительно к описанию рынка систем ввода документов, следует отметить, что помимо технологических аспектов, о которых мы говорили выше, существует также специфика, связанная с масштабом использования технологии. Действительно, когда говорят о домашних или о персональных системах ввода документов, то обычно подразумевают именно распознавание неформализованных документов, при незначительном количестве ввода документов за единицу времени. В данном случае на первое место выходит именно технология OCR. Поэтому когда речь идет о рынке OCR, то обычно имеют в виду рынок коробочных программ распознавания неформализованных документов для персонального применения. Напротив, ввод формализованных документов - это технология, которая обычно используется в организациях и имеет массовый характер. В данном случае наряду с распознаванием текстов встает масса технологических проблем - организация поточного сканирования, распределенной обработки, встраивание решения в корпоративные системы документооборота и т.д. Этот сектор обычно называют Document Capture.

В технологическом смысле Document Capture - это комплекс мероприятий по переводу бумажных документов в электронный архив для хранения и обеспечения доступа к ним. А в отношении доли рынка под этим понимают проектный рынок ввода документов, а не коробочные решения. Согласно вышеописанной классификации объем мирового рынка OCR составляет порядка 80 млн. долл. При этом лидером этого рынка является компания ScanSoft, имеющая оборот около 60 млн. долл. Рынок Data Capturing в несколько раз больше - порядка 300 млн. долл. Поскольку рынок Data Capturing является более проектным бизнесом, здесь нет столь явного лидера, как на рынке OCR. Около 50% серьезных контрактов получают четыре крупные компании: Cardiff Software, ReadSoft, Kofax, TIS. Поскольку в проектном бизнесе географическая близость к заказчику имеет чрезвычайно важное значение, выйти на западный рынок российским компаниям весьма сложно. Напротив, говоря о мировом рынке OCR, необходимо отметить выдающиеся успехи отечественной компании ABBYY: доля ее на мировом рынке в последние пять лет постоянно растет. На сегодняшний день компания имеет лучшие по качеству распознавания системы в мире. В 2001 году компания ABBYY оценивала свою долю на мировом рынке OCR в размере 10-12%, а в 2002 году она намеревается выйти на уровень 15 млн., что составит порядка 15-20% мирового рынка. Также ABBYY сейчас активно продвигает свои технологии на мировом рынке ICR - продукт ABBYY FormReader позволяет эффективно обрабатывать большие объемы различных форм: анкет, опросных листов, бланков, заявлений клиентов и т.д. На рынке OCR также активно работает компания Cognitive Technologies, которая в меньшей степени делает упор на рынок коробочного продукта и больше ориентирована на рынок OEM и на проектный отечественный рынок.

Руководство Cognitive Technologies максимальное внимание уделяет вопросам встраивания технологии OCR в интеграционные решения с элементами архивного хранения и обеспечения документооборота. Системами распознавания Cognitive Technologies комплектуется продукция ведущих мировых производителей офисной техники: Hewlett-Packard, Seiko Epson, Canon, Oki, Olivetti. Cognitive Technologies активно развивает направление, связанное с распознаванием форм.

Классификатор International Data Corp (IDC)

Как мы уже отмечали, при оценках объема рынка систем ввода документов встречаются различные подходы. Выше мы привели оценку компании ABBYY, согласно которой объем рынка Document Capture составляет примерно 300 млн. долл. При этом следует иметь в виду, что данная цифра относится к стоимости программного обеспечения. Существуют и другие подходы. В частности, в подходах оценки рынка IDC нет разделения на программную и аппаратную часть, а рассматривается стоимость решения, куда включаются все элементы. Видимо, именно по этой причине оценки мирового рынка имиджинга, по данным IDC, имеют на порядок большие значения (рис. 9).

По методике IDC системы имиджинга и ввода документов рассматриваются как составляющие рынка систем управления документами и бизнес-процессами (рис. 9). Согласно исследованию IDC, эти рынки в год растут примерно на 30% и к концу 2002 года в сумме достигнут 32 млрд. долл.

Cognitive Forms также может обрабатывать различные типы форм в одном потоке и осуществлять автоматическую проверку корректности данных.

В системе реализована уникальная функция Drag&Recog, которая существенно упрощает процедуру распознавания для пользователя. Для этого пользователю нужно лишь с помощью мыши выделить требуемый фрагмент отсканированного документа и перетащить его в поле распознавания.

В программный комплект Cognitive Forms входит отдельный модуль «Дизайнер форм», с помощью которого пользователь сам может создавать формы документов, задавать описания полей и варианты контекстных проверок. Таким образом система позволяет не только обрабатывать формы, но и создавать их.

В новой версии системы, вышедшей в апреле текущего года, реализована возможность единовременной обработки не только бумажных, но и электронных форм документов в форматах HTML и PDF. На сегодняшний день это единственная российская система, позволяющая осуществлять подобную операцию. Это значительно расширяет функциональные возможности системы, разрешая осуществлять сбор и обработку документов как посредством сканирования бумажных копий, так и через Интернет. В настоящее время большая часть корпоративных участников российского рынка перешла на одновременное использование как бумажных, так и электронных форм документов, и поэтому появление подобной системы крайне актуально.

Корпоративная система Cognitive Forms установлена более чем в 400 российских организациях, в числе которых Пенсионный фонд РФ, Газпром, Сбербанк РФ, Газпромбанк. К настоящему моменту с помощью системы было обработано более 100 млн. различных документов.

Продукты для промышленного ввода форм

В этом секторе также можно указать решения на базе вышеописанных технологий CuneiForm и ABBYY FormReader, которые адаптированы для промышленного использования, а также для систем потокового сканирования и распределенной обработки.

Например, система Cognitive Forms, установленная в Пенсионном фонде, ежедневно обрабатывает около 50 тыс. различных документов. При необходимости возможности системы позволяют обрабатывать до миллиона документов в день.

Работа системы включает потоковое сканирование, сортировку и контроль качества изображения, автоматическое распознавание, верификацию, экспорт в базу данных.

Гибридные комплексные решения

В данном секторе можно выделить решение InputAccel компании ActionPoint. Приобретя компанию Captiva, компания ActionPoint получила мощное комплексное решение, включая развитые средства ввода форм. Решение фирмы ActionPoint достаточно широко применяется в мире, однако мало распространено в России. Поэтому охарактеризуем его очень кратко: мощная система для проектов среднего и крупного масштаба, которая обладает соответствующими встроенными средствами разработки, а также средствами поддержки распределенной работы и кластеризации на серверах.

КомпьютерПресс 9"2002

Когда компания переходит на электронный обмен документами, это означает, что безбумажную коммуникацию ей теперь предстоит выстраивать с тремя сторонами: контрагентами, партнерами и ФНС. После того как организация подключается к оператору ЭДО, местная налоговая инспекция получает уведомление о появлении нового налогоплательщика, присоединившегося к электронному обмену. С этого момента вместо привычного бумажного скана компания может отправить электронный документ в налоговую.

Какие форматы принимает ФНС?

Перед загрузкой документов в специализированного оператора связи нужно проверить форматы. ФНС принимает только три формата. Поэтому проследите, чтобы электронные подлинники имели расширение XML, а отсканированные экземпляры – TIFF или JPG.

Пробелы законодательного характера

Электронные документы (далее – ЭД) бывают формализованными и неформализованными. К формализованным относятся те, чьи форма и формат соответствуют нормам налогового законодательства. На данный момент известны три вида формализованных ЭД – это счет-фактура, акт выполненных работ, товарная накладная (форма №ТОРГ-12). Остальные – неформализованные.

По закону формализованные документы должны соответствовать формату XML. При этом счета-фактуры обязаны удовлетворять данному требованию, а вот в отношении первички это условие носит рекомендательный характер. Но имейте в виду, если вы отправляете акт или накладную не в XML, в автоматическом порядке они будут причислены к неформализованным.

При отправке формализованных электронных документов в налоговую трудностей не возникает. Другое дело – как быть с документами, созданными или полученными в DOC, PDF, XLS? Эта тема под большим вопросом.

Решение есть

В законодательстве РФ процедура представления неформализованных ЭД по требованию никак не расписывается. Приведем пример. Представьте, что у вашей компании истребуют документ, который вы создали в DOC и подписали в том же формате. Каковы будут ваши действия? Вы произведете его выгрузку из сервиса обмена, параллельно с этим выгрузив файлы ЭП. Таким образом, на выходе у вас получается три файла: сам договор, файл ЭП и файл подписи вашего контрагента. Отправить электронный документ в налоговую через спецоператора в таком виде вы не сможете, так как формат не XML. Как же поступить?

  1. Использовать программу-конвертор и преобразовать DOC, например, в JPG, TIFF или XML. Но здесь снова возникает вопрос: что получится в итоге такого переформатирования? Скорее всего, только копия электронного документа. Примет ли ее налоговая? В Приказе ФНС РФ N ММВ-7-6/465@ при упоминании TIFF и JPG говорится об отсканированных копиях бумажных подлинников. А так как договор не имеет утвержденного формата XML, инспекция его проверить точно не сможет. Кроме того, непонятно, как поступить с файлами ЭП. Данный способ явно не годится.
  2. Переформатировать, используя сканер. Документ распечатывают, отдают руководителю на подпись, ставят печать и сканируют, сохраняя скан в TIFF или JPG. Правда, и здесь есть свои темные пятна. Во-первых, получается копия с копии. Во-вторых, остается непонятно, как поступить с файлами ЭП.

С технической точки зрения оба представленных способа позволяют отправить электронный документ в налоговую, но на практике они пока не реализованы.

Универсальный формат

В сентябре 2014-го вышла новость о том, что эксперты Минкомсвязи для обмена между ведомствами определили такой унифицированный формат, как PDF/A. Не исключено, что и в B2B-секторе обмен неформализованными документами будет осуществляться с помощью подобного формата.

  1. Если форматы разработаны, значит, их нужно использовать и отправлять электронные документы в налоговую в установленных форматах. Причем использовать смело, так как ФНС без проблем принимает формализованные документы. А следить за тем, как развивается ситуация с форматами, поможет наша рубрика «Новости законодательства» .
  2. Неформализованные документы продолжайте представлять на бумажных носителях. Поступать так рекомендуют и в самом Министерстве финансов. Данная информация отражена в письмах Минфина от 11.01.2012 N 03-02-07/1-1 и от 11.01.2012 N 03-02-07/1-2. Как изменится форма представления в дальнейшем, что в конечно итоге выберет ФНС, пока неизвестно.
  3. Все возникающие вопросы компаниям лучше решать непосредственно со своим оператором и налоговой инспекцией. Как правило, оператор ЭДО охотно идет на контакт. Налоговые также лояльно настроены к организациям, переходящим на обмен ЭД. Компании-первопроходцы вместе с представителями контролирующих органов могли бы оказать должное влияние на процесс законотворчества и на уровне нормативно-правовых актов закрепить лучшие практики обмена первичной документацией.

Формализованные документы

документы, исполненные на основе формализации. Применяются для передачи типовых распоряжений, сводок, данных об обеспеченности войск (сил флота), а иногда об их действиях.

  • - Разработанный нацистами в 1931 в местечке Боксхейм, неподалеку от Вормса, план захвата местных органов власти. Документы были подписаны Вернером Бестом, будущим рейхскомиссаром оккупированной Дании...

    Энциклопедия Третьего рейха

  • - 1) переводы, меморандумы, копии писем и телеграмм и другие оперативные документы, составленные службой ПК по отобранным почтово-телеграфным отправлениям...

    Контрразведывательный словарь

  • - документы, в которых совокупность реквизитов, установленная в соответствии с решаемыми задачами, зафиксировано в определенном порядке...

    Словарь терминов черезвычайных ситуаций

  • - счет бухгалтерского учета, предназначенный для обобщения информации о наличии и движении денежных документов, находящихся в кассе предприятия. Денежные документы учитываются на счете по номинальной стоимости...

    Большой бухгалтерский словарь

  • - документы, под которые товарный груз сдан железной дороге и без которых этот груз не может быть выдан. Под такие документы банками предоставляются ссуды...

    Справочный коммерческий словарь

  • - документы, отражающие доходы бюджета и ассигнования из него; подразделяются на плановые, оперативные и отчетные...
  • Большой юридический словарь

  • Большой юридический словарь

  • - документы, содержащие необходимую и достаточную информацию для осуществления банковских операций; подтверждают их законность и являются основанием для отражения операций в бухгалтерском учете...

    Словарь юридических терминов

  • - отражают доходы бюджета и ассигнования из него. Подразделяются на плановые, оперативные и отчетные...

    Словарь юридических терминов

  • - документы, выдаваемые предприятием с целью сбора статистических и других данных о производстве товаров на экспорт.См. также: Документы по обеспечению производства экспортного товара  ...

    Финансовый словарь

  • - расчета, принятия решения - способы действий, основанные на строгом соблюдении заранее заданных правил, алгоритмов, расчеты по формулам, математическим зависимостям...

    Экономический словарь

  • - документы, которые содержат необходимую и достоверную информацию для осуществления банковских операций, подтверждают их законность и являются основанием для отражения операций в бухгалтерском учете Б.д....

    Энциклопедический словарь экономики и права

  • - см. Архив; Архивный фонд РФ; Использование архивных документов...

    Большой юридический словарь

  • - документы, относящиеся к организации, подготовке и ведению боевых действий, а также к передвижению и расположению войск на месте. К Б. д. относятся: документы по управлению войсками...

    Большая Советская энциклопедия

  • - являются результатом справочно-библиографической обработки зарубежных материалов. К ним относятся библиографические описания публикаций, аннотации, рефераты, обзоры и другие материалы...

    Толковый переводоведческий словарь

"Формализованные документы" в книгах

Документы

Из книги Трагедия на Неве. Шокирующая правда о блокаде Ленинграда. 1941-1944 автора Стахов Хассо Г.

Документы Полевые письма, которые в то время направлялись из зоны боевых действий на родину, относятся, если не принимать в расчет исключений шокирующего или сенсационного характера, скорее к исторически недостоверным документам. Они подходят, поскольку

Документы

Из книги История власовской армии автора Хоффманн Йоахим

Документы 1.Обращение Русского Комитета к бойцам и командирам Красной армии, ко всему Русскому народу и другим народам Советского СоюзаДрузья и братья!БОЛЬШЕВИЗМ - ВРАГ РУССКОГО НАРОДА. Неисчислимые бедствия принес он нашей Родине и, наконец, вовлек Русский народ в

Документы

Из книги Персидский фронт (1909) Незаслуженно забытые победы автора Шишов Алексей Васильевич

Документы Туркманчайский мирный договор между Россией и Персией (Ираном)1828 год февраля 10Во имя Бога Всемогущего.Его императорское величество всепресветлейший, державнейший великий государь император и самодержец всероссийский и е. в. падишах персидский, равно движимые

Документы

Из книги Мы из сорок первого… Воспоминания автора Левинский Дмитрий Константинович

Документы Справка Международной службы розыска Т/Д - 1 454 634 от 21 июля 1993 года (Арользен,

Документы

Из книги Генерал из трясины. Судьба и история Андрея Власова. Анатомия предательства автора Коняев Николай Михайлович

Документы Справка о положении 2-й Ударной армии Волховского фронта за период январь - июль 1942 года Командующий армией - генерал-майор ВЛАСОВ Член Военного Совета - дивизионный комиссар ЗУЕВ Начальник штаба армии - полковник ВИНОГРАДОВ Нач. Особого отдела армии -

Из чего должна состоять родословная книга: документы и материалы генеалогического поиска, поколенная роспись рода, родословное древо, реконструкция истории рода, архивные документы, фотографии мест проживания предков

Из книги Создай свою родословную. Как самому без больших затрат времени и средств найти своих предков и написать историю собственного рода автора Андреев Александр Радьевич

Из чего должна состоять родословная книга: документы и материалы генеалогического поиска, поколенная роспись рода, родословное древо, реконструкция истории рода, архивные документы, фотографии мест проживания предков В первую очередь исследователям обязательно нужно

автора Тиссен Рене

Технология и формализованные знания Корни многих компаний уходят в индустриальную экономику, в которой особое место занимало развитие машинной технологии. По мере того как мы переходим к экономике знаний, внимание все более переключается на развитие цифровой

Технология и формализованные знания

Из книги Невесомое богатство. Определите стоимость вашей компании в экономике нематериальных активов автора Тиссен Рене

Технология и формализованные знания Технология печатания. Она всегда была ключевым фактором успешной работы компании. И все же именно умение перестроиться с учетом новых задач (сначала печатая на дереве, потом – на пластмассе, а позже – на других материалах) и

Раздел 4 Документы – управленческие решения. документы планирования и отчетности

Из книги Делопроизводство. Подготовка служебных документов автора Демин Юрий

Раздел 4 Документы – управленческие решения. документы планирования и

Ж. Фальшивые документы и документы сомнительной подлинности

Из книги Миф о Холокосте автора Граф Юрген

Ж. Фальшивые документы и документы сомнительной подлинности Ванзейские протоколы.Десятилетиями утверждается, что на берлинской Ванзейской конференции 20 января 1942 г. было принято решение уничтожить евреев. При чтении ее протоколов обнаруживается, что в них ни о каком

Советские и немецкие документы, документы УПА о деятельности Украинской Повстанческой Армии 1944–1952 годы

автора Андреев Александр Радьевич

Советские и немецкие документы, документы УПА о деятельности Украинской Повстанческой Армии 1944–1952

Советские документы, немецкие документы, документы УПА о деятельности Украинской Повстанческой Армии. 1942–1945 годы

Из книги Степан Бандера, лидер ОУН-УПА в документах и материалах автора Андреев Александр Радьевич

Советские документы, немецкие документы, документы УПА о деятельности Украинской Повстанческой Армии. 1942–1945

Советские документы, документы УПА о деятельности Украинской Повстанческой Армии. 1944–1952 годы

Из книги Степан Бандера, лидер ОУН-УПА в документах и материалах автора Андреев Александр Радьевич

Советские документы, документы УПА о деятельности Украинской Повстанческой Армии. 1944–1952 годы 1. Черновик Плана ликвидации вооруженных банд украинских националистов, действующих в Житомирской и Ровенской областях и северных районах Тарнопольской и Каменец-Подольской

Из книги Федеральный закон «О государственной регистрации юридических лиц и индивидуальных предпринимателей». Текст с изменениями и дополнениями на 2009 год автора Автор неизвестен

Статья 17. Документы, представляемые для государственной регистрации изменений, вносимых в учредительные документы юридического лица, и внесения изменений в сведения о юридическом лице, содержащиеся в едином государственном реестре юридических лиц 1. Для

Из книги Новый Закон «Об образовании в Российской Федерации». Текст с изменениями и дополнениями на 2013 г. автора Автор неизвестен

Статья 60. Документы об образовании и (или) о квалификации. Документы об обучении 1. В Российской Федерации выдаются:1) документы об образовании и (или) о квалификации, к которым относятся документы об образовании, документы об образовании и о квалификации, документы о