Tecnología para la digitalización de procesos (X): Data Capture

Data Capture

En este post vamos a mencionar, siquiera brevemente, un conjunto de tecnologías que se conocen como Data Capture o, en sus versiones más avanzadas Intelligent Data Capture, un tipo de soluciones orientadas a capturar información y datos de todo tipo de fuentes, digitales o no, y estructuradas o no, e integrarlas en un procesamiento informático.

 

¿Qué es Data Capture?

 

Sin pretender una definición académica, podemos decir que Data Capture es la obtención de información apta para su procesamiento digital a partir de todo tipo de fuentes, sean éstas digitales o no.

 

De lo que se trata es de incorporar a nuestros sistemas, la información procedente de fuentes diversas tal y como correos electrónicos, documentos en papel, documentos ofimáticos, social media, etc

 

Esta información, una vez digitalizada, analizada y convertida a datos estructurados, puede ser ya procesada normalmente por los sistemas de información habituales entre los que se encuentran muchos de los usados en automatización de procesos de negocio y que hemos comentado en este mismo blog como, por ejemplo, los sistemas de gestión empresarial (ERP o CRM), los sistemas de gestión documental, los sistemas de gestión de procesos de negocio (BPMS), o los sistemas de gestión de casos.

 

Tecnologías en Data Capture

 

En realidad, Data Capture no es una tecnología sino un conjunto variado de tecnologías que se suelen incorporar en productos o soluciones que las integran. Algunas de estas tecnologías son:

 

  • Escaneado: Simplemente, el ya conocido y ampliamente utilizado mecanismo de escaneado y digitalización de documentos.
  • Bar Code Recognition: Lectura de códigos de barras, donde podríamos incluir tambiñen, y como extensión natural, la lectura de códigos QR.
  • OCR (Optical Character Recognition): Es decir, el reconocimiento de caracteres producidos por una máquina.
  • ICR (Intelligent Character Recognition): Reconocimiento de caracteres escritos manualmente por humanos.
  • OMR (Optical Mark Recognition): Reconocimiento de marcas como, en su caso más típico, tendríamos en el caso de los exámenes tipo test automatizados.
  • IDR (Intelligent Document Recognition): Un tipo de soluciones de más alto nivel capaz de reconocer y clasificar tipos de documentos con base a información como metadatos, logos, etc.
  • etc

 

Intelligent Data Capture: ¿Qué aporta la Inteligencia Artificial?

 

Algunas de las tecnologías incluidas en data Capture ya llevan muchos años entre nosotros, como por ejemplo el OCR, la lectura de códigos de barras o el procesamiento de marcas..

 

Sin embargo, en los últimos años, con el desarrollo y la aplicación de técnicas procedentes de la inteligencia artificial y el machine learning, han aumentado sus capacidades para el tratamiento y entendimiento del lenguaje natural (contenido, por ejemplo, en correos electrónicos), para la obtención de información a partir de imágenes y, en general, para el tratamiento de información en fuentes desestructuradas o débilmente estructuradas.

 

Data Capture y Automatización Robótica de Procesos

 

Las tecnologías de captura de datos colaboran especialmente bien dentro de las soluciones de automatización robótica de procesos (RPA), dado que el trabajo más frecuente de los robots tiene que ver con el trabajo con pantallas de aplicaciones por un lado y con documentos por otro. En esta segunda parte, documentos, las soluciones de Data Capture juegan un papel esencial.

 

Como ejemplo de esta colaboración, la plataforma de UiPath, el líder en RPA y del cual Reingeniería Digital es partner, incorpora la solución de Data Capture de ABBYY (Abbyy Flexicapture).

 

Conclusiones

 

Data Capture es un conjunto variado de tecnologías orientadas a digitalizar, analizar, y reconocer información procedente de fuentes diversas, en formato estructurado o no estructurado, e incorporarla al tratamiento informático.

 

Este tipo de soluciones, aunque también se ofrecen por separado, pueden venir incrustadas como parte de otros productos como, por ejemplo, plataformas de RPA.

 

Artículos anteriores relacionados