Скачать презентацию Извлечение данных при обработке архивов документов Doc Flow Скачать презентацию Извлечение данных при обработке архивов документов Doc Flow

e62a753c76055073aa7b9cadbd43e78b.ppt

  • Количество слайдов: 18

Извлечение данных при обработке архивов документов Doc. Flow 2009 Извлечение данных при обработке архивов документов Doc. Flow 2009

Цели обработки архивов документов n Сохранение изображений – Для удаленного принятия решений – Для Цели обработки архивов документов n Сохранение изображений – Для удаленного принятия решений – Для повторного использования (кросс продажи) – Для аудита решений n Проверка изображений документов в процессе наполнения – Проверка полноты документа или дела – Проверка корректности данных в документе n Повышение качества информации в корпоративных системах – Извлечение данных из документа для более гибкого поиска

Наиболее актуально для: n Финансовые учреждения - Кредитные дела - Пакет документов на открытие Наиболее актуально для: n Финансовые учреждения - Кредитные дела - Пакет документов на открытие счета - Страховые дела n Телекоммуникационные и «билинговые» компании - Договора на подключение - Квитанции об оплате n Государственные архивы, библиотеки Наиболее трудоемкий процесс – наполнение электронного архива накопившимися и текущими бумажными документами

Типы бумажных документов n Структурированные – Типовые договора – Заявления на стандартном бланке заполненные Типы бумажных документов n Структурированные – Типовые договора – Заявления на стандартном бланке заполненные от руки – Персональные государственные документы n Неструктурированные – Нестандартные договора – Нестандартные заявления, письма – Документы связанные с имуществом

Этапы ввода бумажных документов n Сканирование или фотографирование n Разделение на документы и классификация Этапы ввода бумажных документов n Сканирование или фотографирование n Разделение на документы и классификация n Атрибутирование и извлечение данных Ø Автоматическое извлечение нужных атрибутов Ø Ввод нужных атрибутов вручную Ø Полнотекстовое распознавание неструктурированных документов с последующим индексированием n Проверка корректности данных n Экспорт документов в систему хранения

Сканирование Требования к сканеру «Обычные» документы – автоподатчик n Сшитые документы – планшет n Сканирование Требования к сканеру «Обычные» документы – автоподатчик n Сшитые документы – планшет n ü Рекомендуемая нагрузочная способность ü Скорость сканирования ü Специальные функции (отсечения цвета, автоподбор яркости, удаление пустых страниц).

Разделение на документы и классификация Автоматически на основании атрибута документа n Разделение на документы и классификация Автоматически на основании атрибута документа n

Разделение на документы и классификация • Полуавтоматически Формирование документов по разделительным листам с штрих-кодами Разделение на документы и классификация • Полуавтоматически Формирование документов по разделительным листам с штрих-кодами Договор № 1 Договор № 2 Сканирование ABBYY Recognition Server 2. 0 Распознавание

Проверка структуры дела § Необходима возможность визуальной проверки отсканированного § Перемещения/удаления страниц Проверка структуры дела § Необходима возможность визуальной проверки отсканированного § Перемещения/удаления страниц

Атрибутирование и извлечение данных n Автоматическое извлечение нужных атрибутов – структурированные документы Атрибутирование и извлечение данных n Автоматическое извлечение нужных атрибутов – структурированные документы

Атрибутирование и извлечение данных n Ввод нужных атрибутов вручную – для «нераспознаваемых» полей Атрибутирование и извлечение данных n Ввод нужных атрибутов вручную – для «нераспознаваемых» полей

Атрибутирование и извлечение данных n Полнотекстовое распознавание – для неструктурированных документов Атрибутирование и извлечение данных n Полнотекстовое распознавание – для неструктурированных документов

Проверка корректности данных Проверка формата распознанных данных n Проверка данных по справочникам и базам Проверка корректности данных Проверка формата распознанных данных n Проверка данных по справочникам и базам n Перекрестная проверка данных на разных страницах n

Экспорт изображений и данных во внешнюю систему хранения n Экспорт изображений - В файл, Экспорт изображений и данных во внешнюю систему хранения n Экспорт изображений - В файл, любой графический формат - В файл pdf-searchable - В базу данных в бинарном формате - Экспорт участка изображения документа n Экспорт данных - Через промежуточный файл - В ODBC совместимую базу данных - Вызов хранимой процедуры 14

Автоматизированная обработка, что необходимо? n Программное обеспечение для потоковой обработки документов n Скоростной сканер Автоматизированная обработка, что необходимо? n Программное обеспечение для потоковой обработки документов n Скоростной сканер n Разработка конфигурации ПО для обработки документов заказчика, обучение специалистов заказчика

Архитектура n Архитектура системы обработки бумажных документов зависит от: – «Распределенния» хранения и обработки Архитектура n Архитектура системы обработки бумажных документов зависит от: – «Распределенния» хранения и обработки документов в организации – Количества документов – Доступности каналов связи – Требований безопасности – Необходимой скорости обработки n В построении системы помогут системные интеграторы и ABBYY Украина

ABBYY Group ABBYY Europe UK Fremont ABBYY USA ABBYY Europe Gmb. H Munich, Germany ABBYY Group ABBYY Europe UK Fremont ABBYY USA ABBYY Europe Gmb. H Munich, Germany Headquarters ABBYY Software House (Russia, Moscow) ABBYY USA (USA, Fremont, CA) ABBYY Europe (Germany, Munich) ABBYY Headquarters/ ABBYY Russia Moscow ABBYY Ukraine Kiev ABBYY Japan Tokyo ABBYY Europe UK (UK, Bishops Stortford) ABBYY Ukraine (Ukraine, Kiev) ABBYY Russia (Moscow) ABBYY Japan (Tokyo) 17

Спасибо за внимание! Презентацию для Вас подготовил Доможиров Илья менеджер отдела корпоративных проектов ABBYY Спасибо за внимание! Презентацию для Вас подготовил Доможиров Илья менеджер отдела корпоративных проектов ABBYY Украина + 38 044 490 -9999 e-mail: [email protected] ua