PDF indexé

M-Files peut convertir des images importées à partir de sources de fichiers externes dans des PDF indexés à l’aide de la reconnaissance optique de caractères (OCR). Cela rend possible la recherche plein texte de documents numérisés. Après conversion vous pouvez retrouver le document PDF en recherchant le contenu du document actuel.

Vous pouvez utiliser la reconnaissance optique de caractères avec les formats de fichier suivants :

TIF
TIFF
JPG
JPEG
BMP
PNG
PDF

Les fichiers TIFF utilisant un canal alpha ou une compression JPEG ne sont pas pris en charge.

Remarque : La conversion du fichier en PDF indexé n'affecte pas l'apparence extérieure du document lors de son affichage. Les utilisateurs voient toujours l'image numérisée d'origine. M-Files stocke les résultats de reconnaissance de texte automatique dans le fichier PDF sous forme de texte invisible, utilisable ensuite pour la recherche du fichier. Les éventuelles inexactitudes de la reconnaissance de texte n'affectent pas l'apparence du document numérisé lorsqu'il est affiché à l'écran ou imprimé.

Remarque : Lorsque vous utilisez la fonction de reconnaissance optique de caractères dans M-Files sur un PDF signé, l’ensemble du document est réécrit. Comme les signatures numériques valident le contenu, toute modification effectuée par la reconnaissance optique de caractères invalidera la signature existante. Cela peut avoir pour résultat la suppression de la signature.

Réalisez les étapes suivantes pour convertir les images d’une source de fichiers externe en PDF indexés :

Ouvrez M-Files Admin.
Dans l'arborescence de gauche, déployez une connexion au serveur M-Files.
Déployez Coffres.
Déployez un coffre.
Déployez Connexions aux Sources Externes.
Cliquez sur Fichiers.
Dans la liste Fichiers, double-cliquez sur le fichier que vous souhaitez modifier.
Résultat :La boîte de dialogue Propriétés de Connexion s’ouvre.
Cliquez sur l’onglet PDF indexé.
Résultat :L’onglet PDF indexé s’ouvre.
Cochez la case Utiliser l'OCR pour la recherche plein texte dans les documents numérisés.
À l’aide des menus déroulants Langue principale et Langue secondaire, sélectionnez les langues principale et secondaire des documents numérisés afin d’améliorer la qualité des résultats de reconnaissance. La liste des langues secondaires ne contient que les langues qui peuvent être utilisées avec la langue principale sélectionnée.
Bien que le moteur OCR reconnaisse automatiquement toutes les langues occidentales et les caractères cyrilliques, le choix d'une langue améliore souvent la qualité des résultats de la reconnaissance de texte. Dans les cas ambigus, un problème de reconnaissance peut être résolu par un facteur spécifique de la langue, comme la reconnaissance de la lettre 'Ä' en finnois. La liste des langues secondaires ne contient que les langues qui peuvent être utilisées avec la langue principale sélectionnée.
Optionnelle : Cochez la case Utiliser hyper-compression pour réduire la taille des fichiers PDF si vous souhaitez réduire la taille des fichiers des PDF indexés créés par le biais de cette connexion.
Optionnelle : Cochez la case Convertir en format PDF/A-1b si vous souhaitez que les documents PDF convertis soient conformes à la norme ISO 19005-1:2005 pour la conservation sur le long terme des documents électroniques.
PDF/A-1b est un format plus restreint par rapport au format PDF standard ; ainsi, la taille des documents convertis au format PDF/A est souvent plus volumineuse que celle des fichiers convertis au format PDF standard. De plus, pendant l'exportation au format PDF/A, certains paramètres avancés d'aspect peuvent être omis. Vous devriez utiliser la conversion au format PDF/A seulement lorsque c'est vraiment nécessaire, pour des conditions de conservation à long terme, par exemple.
Cliquez sur OK pour fermer la boîte de dialogue des Propriétés de Connexion.

Les documents numérisés avec cette connexion sont convertis en PDF indexés dans la mesure où ils se trouvent dans le format de fichier applicable. Après avoir été importés dans M-Files (ou y avoir été associés),vous pouvez les trouver en recherchant leur contenu.

Remarque : La reconnaissance de texte peut également être effectuée dans le M-Files Desktop classique. Pour davantage d'informations, veuillez vous reporter à Numérisation et reconnaissance de texte (OCR). Pour utiliser la reconnaissance de texte avec des sources externes via M-Files Admin uniquement, cette limitation peut être configurée en modifiant les paramètres du registre. Les paramètres de registre peuvent aussi être utilisés pour définir d'autres limitations. Pour plus d'informations sur les paramètres de registre, contactez notre service clientèle via M-Files Support Portal ou votre revendeur M-Files.