Définir une source de valeur OCR
Vous pouvez extraire du texte ou des codes-barres à partir d’un document numérisé à l’aide de la reconnaissance optique de caractères (OCR) et vous en servir en tant que valeurs de propriétés automatiques pour les fichiers importés à partir d’une source externe, un scanner dans le cas présent. La source de valeur OCR est une zone définie sur une page numérisée. Pour de plus amples renseignements sur la façon de définir les différentes propriétés pour les objets importés à partir de sources de fichiers externes, consultez Définition des métadonnées pour une source de fichier externe.
- TIF
- TIFF
- JPG
- JPEG
- BMP
- PNG
L'utilisation de la source de valeur OCR est uniquement possible dans le cas de l'utilisation d'une source externe. La source de valeur OCR ne peut pas être définie dans M-Files Desktop.
Effectuez les étapes suivantes pour définir une source de valeur OCR :
Pour vous assurer que la zone définie est correctement placée, le document à numériser doit être placé dans la plupart des cas sur la vitre du scanner manuellement plutôt qu'avec un chargeur automatique.
Dans certains cas, l’OCR peut proposer un résultat de reconnaissance du texte incorrect : par exemple, en fonction du type et de la taille de la police, le chiffre 1 peut être interprété comme la lettre I. Pour s'assurer que les caractères sont correctement ajoutés aux métadonnées du document, vous pouvez vérifier les valeurs de propriété à l'aide de gestionnaires d'évènements et de VBScript. Vous pouvez ensuite utiliser VBScript pour vérifier, par exemple, que tous les caractères ajoutés sont des nombres. Pour davantage d'informations, veuillez vous reporter à Gestionnaires d'événements.
Types de codes-barres compatibles
Le module OCR M-Files est compatible avec les types de codes-barres suivants :
- Code QR
- EAN-13
- EAN-8
- EAN-5
- EAN-2
- MSI Plessley
- MSI Pharma
- UPC-A
- UPC-E
- Codabar
- Interleaved 2 of 5
- Discrete 2 of 5
- Code 39
- Code 39 Extended
- Code 39 HIBC
- Code 93
- Code 128
- PDF 417
- Postnet
- Postnet 32
- Postnet 52
- Postnet 62
- Patchcode
- UCC-128
- UPCE Extended
- IATA 2 of 5
- Datalogic 2 of 5
- Reverse 2 of 5
- Code 39 (out-of-spec)
- Code 128 (out-of-spec)
- Codabar (out-of-spec)