контакты
Телефон: +7 495 369-20-29
Email: info@kt-team.de
офис
Тольятти: ул. Офицерская, д. 12А, корп. 1 (ТЦ «Рим»)
Подпишитесь на нашу рассылку!
Будьте в курсе новостей мира разработки и менеджмента, узнайте первыми о наших новых кейсах, событиях и личном опыте!
Заполните форму — и мы свяжемся с вами

Сложная разработка на Python по автоматизации распознавания и обработки бумажных документов

Python
(основной язык)
Tesseract
(распознавание текста)
Машинное обучение
(machine learning)
Компьютерное зрение (computer vision)
Векторный анализ (определение типа документов)

Задача

Один из клиентов kt.team, крупная логистическая компания, ежедневно обрабатывает тысячи отгрузок. Это сложный бизнес-процесс, который включает работу с многостраничными пакетами бумажных документов, их оцифровку и отправку в несколько информационных систем, используемых компанией.

Нам нужно было разработать такое решение, которое позволит автоматизировать обработку бумажной документации и будет интегрировано во все бизнес-процессы клиента и избавит от ручных операций в работе.

Решение

Систему автоматизированной проверки пакетов документов было решено разработать на Python, с возможностью реализации технологий машинного обучения и компьютерного зрения.
У наших клиентов был целый отдел (около 50 человек), который вручную обрабатывал пакеты документов.

Главная задача — автоматизировать процессы и снять с персонала более половины нагрузки по обработке бумажных и оцифрованных документов.

В рамках проекта была разработана iCdocs — интеллектуальная система автоматизированной проверки и сортировки пакетов документов, разработанная на Python.
Интеграция с PIM-системой

На что смотрит iCdocs

Возможности iCdocs

Оцифровка бумажных документов

Оператор загружает пакет документов в сканирующее устройство. iCdocs запускает цикл сканирования.

Перевод изображений в текст

Переводит отсканированные изображения в текст, определяет тип документов и количество страниц.

Верификация документов

У оператора есть возможность оценить правильность распознавания данных на документах и отметить поля, которые не соответствуют действительности.

Формирование пакета документов

Считывает название юридического лица, распознает номер заказа, отгрузки. Получает информацию о контрагентах, сделках, поставках из бухгалтерских программ. Проверяет наличие нумерации страниц и количество страниц в документе, объединяет все страницы документа. Объединяет документы с единым признаком (номер накладной, номер поездки, контрагент) в один пакет.

Отправка во внешние программы

При желании iCdocs можно интегрировать в любую систему документооборота компании и отправлять пакеты документов в бухгалтерские программы и хранилища как российские, так и международные.

Хранение документов

iCdocs хранит в себе резервные копии документов, которые обрабатывались в нём, с возможностью просмотреть историю изменений и кто их вносил.

Результаты разработки

Система автоматизированной проверки пакетов документов может работать над несколькими пакетами документов одновременно. В начале разработки мы смогли приблизиться к 80% распознаванию.

Работы над проектом ещё продолжаются и мы планируем усовершенствовать алгоритмы распознавания максимально приблизившись к 100%.
Интеграция с PIM-системой

iCdocs будет полезен, если у вас:

Много бумажных документов
Много заказов ежедневно
Несколько юрлиц
Несколько договоров
Много поставщиков
Вы работаете с сотнями, тысячами контрагентов. По каждому контрагенту нужно проверять большой пакет документов.
Много поставщиков
Каждый заказ сопровождается пакетом документов. Необходимо оперативно проверять входящие пакеты на корректность и проверять, сортировать их и передавать в дальнейшую работу.
Много заказов ежедневно
С партнёрами заключено несколько договоров на разные юрлица, нужно проверять комплектность пакетов по каждому договору и корректность заполнения по каждому документу (юрлицо, печать, подпись соответствуют указанным в договоре).
Несколько юрлиц
С каждым из партнёров заключено несколько договоров, в которых варьируются особенности сотрудничества (разные доставщики, разные способы или подходы к оплате и пр.)
Несколько договоров
С разными контрагентами практикуется ЭДО и бумажный документооборот. Нужно свести всё в единую систему, чтобы легче контролировать.
Много бумажных документов

Проконсультируем по вашему проекту

Есть вопросы? Оставьте свои контактные данные — и мы свяжемся с вами и ответим
на ваши вопросы
Нажимая кнопку «Отправить», вы даёте согласие на обработку персональных данных

iCdocs разработан на Python

Интеграция с PIM-системой
Преимущество проектов, разработанных на Python в возможности реализации машинного обучения (machine learning) и компьютерного зрения (computer vision).

Python — универсальный, объектно-ориентированный язык программирования.

Ваш персональный менеджер

Антон Белов
Телефон: +7 495 369-20-29 (доб. 108)
Email: a.belov@kt-team.de
Антон руководит подготовкой, запуском и дальнейшим сопровождением высоконагруженных проектов со сложным архитектурным решением. Он может вас проконсультировать по вашему проекту.
Исполнительный директор, партнёр, технический эксперт
Получить консультацию