LAD

Lecture automatique de document

La lecture automatique de documents (LAD) est un ensemble de technologies qui permet de segmenter et d'extraire, par Reconnaissance Optique de Caractères (ROC/OCR), des informations textuelles sur des documents numérisés de type formulaires structurés ou semi-structurés. Les informations ainsi extraites peuvent alors être utilisées comme métadonnées dans un système de Gestion Électronique des Documents (GED).

La LAD intègre également la reconnaissance de cases à cocher. Par exemple, un coupon réponse qui comportait plusieurs cases à cocher pourra être traité par un mécanisme de LAD. Le coupon réponse sera numérisé et le moteur de LAD sera capable de détecter les cases qui ont été cochées de celles qui ne l'ont pas été. Le Sigle anglais pour la reconnaissance de case à cocher est OMR qui signifie: Optical Mark Recognition.

De façon plus générale, le document numérisé peut provenir de différents supports, tels l'image d'une plaque minéralogique capturée par un radar routier.

Ne pas confondre Reconnaissance Automatique de Documents (RAD) ou de type de documents et Lecture Automatique de Documents (LAD). En effet, si la reconnaissance de caractères ou de formes et autres cases à cocher permet de distinguer un document d’un autre ainsi que certains mots contenus de manière à alimenter une bases d’index destinée à une Gestion Électronique de Documents, l’appellation LAD, pour lecture automatique de documents, concerne les processus évolués de capture de données sur des documents structurés et désormais aussi non structurés.

Voir