Numérisation et reconnaissance de texte (OCR)

Vous pouvez ajouter des documents papier à M-Files à l'aide d'un scanner. Pour utiliser les fonctions de numérisation, dans le M-Files Desktop classique, appuyez sur Alt et sélectionnez Opérations > Numérisation et Reconnaissance de Texte (OCR). Lorsque la numérisation est terminée, M-Files propose de convertir le fichier numérisé en un PDF avec fonction de recherche (fichier indexé) par reconnaissance optique de caractères.

M-Files propose automatiquement la reconnaissance de caractères si vous faites glisser et déposez une image dans M-Files. Vous pouvez également convertir manuellement les images et les PDF non indexés en PDF indexés à l’aide du menu contextuel du fichier.

Vous pouvez utiliser la reconnaissance optique de caractères avec les formats de fichier suivants :

TIF
TIFF
JPG
JPEG
BMP
PNG
PDF

Les fichiers TIFF utilisant un canal alpha ou une compression JPEG ne sont pas pris en charge.

Fonctions importantes pour les administrateurs

Remarque : Lorsque vous utilisez la fonction de reconnaissance optique de caractères dans M-Files sur un PDF signé, l’ensemble du document est réécrit. Comme les signatures numériques valident le contenu, toute modification effectuée par la reconnaissance optique de caractères invalidera la signature existante. Cela peut avoir pour résultat la suppression de la signature.

Les fonctions de reconnaissance optique de caractères dans M-Files ne prennent pas en charge les opérations de masse. Elles sont conçues pour la conversion d'un petit nombre de fichiers à la fois.
Pour obtenir des informations sur la numérisation en réseau, reportez-vous à Sources de scanner.
L'intégration du scanner utilise les technologies TWAIN et WIA. Seuls les scanners équipés d'un pilote TWAIN ou WIA sont pris en charge.
Les administrateurs système peuvent modifier les paramètres de numérisation et de reconnaissance optique de caractères dans Advanced Vault Settings. Les paramètres se trouvent dans la section Configuration > Scanning & OCR.
Si la reconnaissance de texte est effectuée sur une image non enregistrée dans M-Files, le fichier est enregistré au format PDF. Sinon, vous trouverez le fichier image d'origine dans l'historique des versions de l'objet.

Importation de fichiers image en tant que PDF indexés

Pour importer un fichier image dans le coffre en tant que PDF indexé :

Faites glisser et déposez une image dans le M-Files Desktop classique.
Optionnelle : Dans la boîte de dialogue Conversion en PDF indexé, cochez la case Utiliser la détection de langue automatique pour faire en sorte que M-Files détecte automatiquement la langue du document.
Optionnelle : Dans la boîte de dialogue Conversion en PDF indexé, cliquez sur Avancé pour améliorer la qualité de la reconnaissance de texte en sélectionnant les options de langue primaire et de langue secondaire afin d’être en adéquation avec la langue utilisée sur l’image.
L’ouverture des options avancées désactive l’option permettant d’utiliser la détection automatique de la langue.
Cliquez sur Convertir pour lancer la conversion.
Une fois la conversion terminée, la fenêtre Nouveau Document apparaît. Terminez l’importation de l’image en remplissant les métadonnées et en cliquant sur Créer.

Le fichier image est importé dans le coffre en tant que PDF indexé, ce qui vous permet de le localiser à l’aide des fonctions de recherche de M-Files.

Convertir un fichier image stocké dans M-Files en PDF indexé

Dans M-Files, localisez le fichier image que vous souhaitez convertir en PDF indexé.
Cliquez, à l’aide du menu bouton droit, sur le fichier et sélectionnez Numérisation et Reconnaissance de Texte (OCR) > Convertir en PDF indexé dans le menu contextuel.
Optionnelle : Dans la boîte de dialogue Conversion en PDF indexé, cochez la case Utiliser la détection de langue automatique pour faire en sorte que M-Files détecte automatiquement la langue du document.
Optionnelle : Dans la boîte de dialogue Conversion en PDF indexé, cliquez sur Avancé pour améliorer la qualité de la reconnaissance de texte en sélectionnant les options de langue primaire et de langue secondaire afin d’être en adéquation avec la langue utilisée sur l’image.
L’ouverture des options avancées désactive l’option permettant d’utiliser la détection automatique de la langue.
Cliquez sur Convertir pour lancer la conversion.

Le fichier image est converti en un PDF indexé et tout contenu textuel de l’image peut être retrouvé en utilisant les fonctions de recherche de M-Files.