Vous avez une Question ? Nous pouvons vous aider !

Nous sommes à votre disposition. Saïd EL MORABITI partagera avec vous notre expérience et vous présentera les possibilités offertes par nos solutions.

Saïd EL Morabiti

Responsable Commercial

+33 (0) 1 43 97 69 66

Optical Character Recognition (OCR)

Reconnaissance optique de caractères dans des documents numérisés

Optical Character Recognition (OCR)

OCR – Qu’est-ce que c’est ?

La reconnaissance optique de caractères permet d’identifier des textes dans des documents numérisés. Le module OCR de SEAL Systems fonctionne pour les données tramées et vectorielles et peut être intégré dans des processus automatisés. Les techniques OCR permettent de rechercher des textes dans une application de lecture du fichier. De grandes quantités de fichiers sont en outre examinées au préalable par des moteurs de recherche de texte, de manière à accélérer le processus OCR sur un ensemble des fichiers.

 

OCR

 

Vous souhaitez intégrer des fonctions OCR dans le traitement de vos documents ?

Nous recommandons d’intégrer un processus OCR dans les étapes suivantes :

  • À la validation de documents
  • Au moment de la conversion d’un fichier
  • Avant l’archivage dans un système de GED
  • À la conversion de fichiers au format PDF/A

Le processus OCR n’est par forcément utile pour tous les fichiers. Le système évalue lui-même si le processus OCR est utile. Le processus OCR est alors uniquement déclenché, lorsque des fichiers sont tramés.

 

PDF_doppeltVous avez des fichiers PDF dont le texte est visible, mais sa recherche est impossible ?

Les causes sont multiples. Les fichiers PDF générés par numérisation se composent de pixels. L’homme peut lire le texte, mais l’ordinateur n’est pas capable de les interpréter. Les scanners ont souvent des processus OCR intégrés. Mais, ils se révèlent inadaptés dans certaines circonstances. De même, les systèmes de CFAO représentent à l’écran des textes sous la forme de lignes. C’est le cas quand le système CAO emploie des polices de caractères spéciales qui ne sont pas disponibles sur le système d’exploitation.

 

Avantages des fichiers dont le texte est disponible sous forme de police de caractères

Les informations peuvent être identifiées plus rapidement dans des fichiers, lorsque la recherche de texte est possible directement dans les fichiers. Pour ce faire, le texte visible doit être consultable. Lors d’un échange de données avec vos fournisseurs il est également très utile de facilement identifier des mots clés dans les fichiers échangés.

 

Vous souhaitez convertir vos anciens fichiers TIFF en PDF/A ?lupe

L’OCR est ici aussi utile ! Le PDF/A remplace de plus en plus le format tramé TIFF comme format d’archivage. La conversion en format PDF de fichiers TIFF et documents modèles numérisés est particulièrement simple. Mais sans traitement OCR supplémentaire, cette conversion n’apporte aucune valeur ajoutée. Le PDF généré ne dispose d’aucune autre donnée utile excepté une image tramée. L’apport d’éléments textuels apporte donc des gains supplémentaires.