Numérisation et reconnaissance de texte (OCR)

Des documents papier peuvent être ajoutés à M-Files à l'aide d’un scanner. Pour plus d'informations sur le scanner de réseau, consultez Sources de scanner. Pour accéder aux commandes de numérisation, appuyez sur la touche Alt, puis ouvrez le menu Opérations.

Remarque : L'intégration du scanner dans M-Files Desktop exploite les technologies TWAIN et WIA. Seuls les scanners pouvant être équipés d'un pilote TWAIN ou WIA sont pris en charge.

Lorsque la numérisation est terminée, M-Files propose de convertir le fichier numérisé en PDF avec fonction de recherche (fichier indexé) par reconnaissance optique de caractères. Vous pouvez également définir des paramètres avancés pour la reconnaissance de caractères.

Vous pouvez aussi convertir un fichier image en PDF indexé. La reconnaissance optique de caractères est exécutée sur le fichier image afin de permettre une recherche plein texte dans tout le fichier. Après la conversion, vous pouvez, par exemple, trouver un document de contrat converti à partir d’une image en effectuant une recherche à l'aide du nom des parties contractantes ou tout autre texte inclus dans le fichier image d’origine.

M-Files suggère également automatiquement la reconnaissance de caractères si vous déposez un fichier image dans M-Files. M-Files ne suggère pas la reconnaissance de caractères pour les fichiers PDF. En effet, le fait de réaliser la reconnaissance optique de caractères sur un PDF déjà indexé en réduit la qualité tout en augmentant la taille du fichier PDF. Vous pouvez convertir les PDF non indexés en PDF indexés manuellement à l’aide du menu contextuel du fichier PDF.

La reconnaissance optique de caractères peut être exécutée sur les formats de fichier suivants :
  • TIF
  • TIFF
  • JPG
  • JPEG
  • BMP
  • PNG
  • PDF
Les fichiers TIFF utilisant un canal alpha ou une compression JPEG ne sont pas supportés.
Remarque : Si la reconnaissance de texte est exécutée sur un fichier image qui n'a pas été enregistré et stocké dans M-Files, le fichier est uniquement enregistré comme PDF. Sinon, le fichier image d'origine se trouve dans l'historique des versions du document.

Importation de fichiers image en tant que PDF indexés

Pour importer un fichier image dans le coffre en tant que PDF indexé :

  1. Glissez et déposez une image dans M-Files.
  2. Optionnelle : Dans la boîte de dialogue Conversion en PDF indexé, cochez la case Utiliser la détection de langue automatique pour faire en sorte que M-Files détecte automatiquement la langue du document.
  3. Optionnelle : Dans la boîte de dialogue Conversion en PDF indexé, cliquez sur Avancé pour améliorer la qualité de la reconnaissance de texte en sélectionnant les options de langue primaire et de langue secondaire afin d’être en adéquation avec la langue utilisée sur l’image.
    L’ouverture des options avancées désactive l’option permettant d’utiliser la détection automatique de la langue.
  4. Cliquez sur Convertir pour lancer la conversion.
  5. Une fois la conversion terminée, la fenêtre Nouveau Document apparaît. Terminez l’importation de l’image en remplissant les métadonnées et en cliquant sur Créer.
Le fichier image est importé dans le coffre en tant que PDF indexé, ce qui vous permet de le localiser à l’aide des fonctions de recherche de M-Files.

Convertir un fichier image stocké dans M-Files en PDF indexé

  1. Dans M-Files, localisez le fichier image que vous souhaitez convertir en PDF indexé.
  2. Cliquez, à l’aide du menu bouton droit, sur le fichier et sélectionnez Numérisation et Reconnaissance de Texte (OCR) > Convertir en PDF indexé dans le menu contextuel.
  3. Optionnelle : Dans la boîte de dialogue Conversion en PDF indexé, cochez la case Utiliser la détection de langue automatique pour faire en sorte que M-Files détecte automatiquement la langue du document.
  4. Optionnelle : Dans la boîte de dialogue Conversion en PDF indexé, cliquez sur Avancé pour améliorer la qualité de la reconnaissance de texte en sélectionnant les options de langue primaire et de langue secondaire afin d’être en adéquation avec la langue utilisée sur l’image.
    L’ouverture des options avancées désactive l’option permettant d’utiliser la détection automatique de la langue.
  5. Cliquez sur Convertir pour lancer la conversion.
Le fichier image est converti en un PDF indexé et tout contenu textuel de l’image peut être retrouvé en utilisant les fonctions de recherche de M-Files.