Utiliser une source de valeur OCR

Pour les fichiers importés depuis une source externe, vous pouvez définir une propriété ajoutée automatiquement qui utilise la source de valeur OCR. La source de valeur OCR est une zone définie sur la page. Avec l'OCR, la zone affecte une valeur à la propriété sélectionnée. Dans la boîte de dialogue Définir la propriété, vous pouvez sélectionner Utiliser une source de valeur OCR. Pour davantage d'informations sur la définition des différentes propriétés, veuillez-vous reporter à la section Métadonnées.

L'utilisation de la source de valeur OCR est uniquement possible dans le cas de l'utilisation d'une source externe. La source de valeur OCR ne peut pas être définie dans M-Files Desktop.

Remarque : Le module OCR M-Files est un module complémentaire à M-Files disponible pour un supplément de prix. Il peut être activé avec un code de licence. L'ancien code de licence doit être remplacé par le code de licence permettant l'utilisation du module OCR. Pour davantage d'informations, veuillez-vous reporter à la section Gestion des Licences. Pour pouvoir activer le module OCR, vous devez également télécharger et installer certains fichiers supplémentaires dans votre serveur M-Files (pour davantage d'informations, veuillez contacter notre service client). Les fonctions associées à OCR sont alors désormais disponibles dans M-Files Admin et M-Files Desktop.

M-Files utilise un moteur OCR fourni par I.R.I.S. OCR M-Files propose aussi la reconnaissance des codes-barres. Pour toute question concernant l'achat du module OCR M-Files, veuillez contacter notre équipe des ventes à l'adresse suivante : [email protected].

Définir une source de valeur OCR

Commencez par définir une source de valeur OCR en ajoutant une nouvelle propriété via l'onglet Métadonnées de la boîte de dialogue Nouvelle connexion à une source externe et en sélectionnant ensuite Utiliser une source de valeur OCR et Définir...



La boîte de dialogue "Définition d'une source de valeur OCR".

Type de zone

Spécifiez si la reconnaissance doit se faire par code-barres ou par texte.

Position de la zone

Définissez une zone dans laquelle certains caractères sont reconnus comme des valeurs d'une propriété définie. Les caractères peuvent inclure de nombreuses lettres, chiffres ou caractères de ponctuation. Par exemple, un numéro de facture affiché sur une page peut être ajouté comme la valeur de la propriété Numéro de facture du document numérisé. Ceci vous permet d'automatiser la numérisation et le stockage des documents spécifiés dans M-Files avec des métadonnées toujours correctes.

Dans la plupart des cas, pour vous assurer que la zone définie est correctement placée, le document à numériser doit être placé sur la vitre du scanner manuellement plutôt qu'avec un chargeur automatique.

Dans certains cas, l'OCR peut donner un résultat de reconnaissance de texte incorrect : par exemple, en fonction du type ou de la taille de police, le numéro 1 peut être interprété comme la lettre I. Pour s'assurer que les caractères sont correctement ajoutés aux métadonnées du document, vous pouvez vérifier les valeurs de propriété à l'aide de gestionnaires d'évènements et de VBScript. Vous pouvez ensuite utiliser VBScript pour vérifier, par exemple, que tous les caractères ajoutés sont des nombres. Pour davantage d'informations, veuillez-vous reporter à Gestionnaires d'événements.



Un exemple de définition de zone.

Reconnaissance de code-barres

M-Files reconnaît la plupart des codes-barres 1D utilisés et deux types de code-barres 2D : PDF417 et QR.

S'il y a seulement un code-barres à reconnaître dans la page, vous pouvez spécifier toute la page en tant que zone. Si plusieurs codes-barres sont présents, limitez la zone de telle sorte qu'elle contienne seulement le code-barres souhaité. S'il s'agit de codes de type QR, vous devez spécifier une zone plus grande que le code-barres.

Si la zone spécifiée contient plusieurs codes-barres, tous sont considérés comme une valeur de propriété.

Si vous utilisez un code licence compatible avec le module OCR et ayant été fourni avant la version 9.0, veuillez demander à notre service client de vous fournir un nouveau code licence si vous souhaitez utiliser la reconnaissance de codes-barres.

Paramètres de reconnaissance de texte (OCR)

Bien que le moteur OCR reconnaisse automatiquement toutes les langues occidentales et les caractères cyrilliques, le choix d'une langue améliore souvent la qualité des résultats de la reconnaissance de texte.

Dans les cas ambigus, un problème de reconnaissance peut être résolu par un facteur spécifique de la langue, comme la reconnaissance de la lettre 'Ä' en finnois. La liste des langues secondaires ne contient que les langues qui peuvent être utilisées avec la langue principale sélectionnée.

La position de la zone détermine les deux coins (supérieur gauche et inférieur droit) de la zone par rapport à l'origine du système de coordonnées (coin supérieur gauche de la page). Dans l'exemple ci-dessus, les valeurs suivantes sont utilisées : gauche 144 mm, haute 59 mm, droite 170 mm et bas 68 mm.

Remarque : Vous pouvez utiliser la source de valeur OCR sans sélectionner la commande Utiliser l'OCR pour activer la recherche de texte plein dans les documents numérisés dans l'onglet PDF avec fonction de recherche.