Durchsuchbares PDF

Um eine automatische Texterkennung von Dateien durchzuführen, die über den Scanner importiert werden, müssen Sie die Funktion OCR für die Volltextsuche von gescannten Dokumenten verwenden in der Registerkarte Durchsuchbare PDF-Datei im Dialogfeld Verbindungseigenschaften für die Verbindung zu einer externen Quelle wählen. M-Files konvertiert dann die importierten Bilddateien in durchsuchbare PDF-Dateien, so dass eine Volltextsuche des gescannten Dokuments möglich ist. Nach der Konvertierung finden Sie das PDF-Dokument, indem Sie den aktuellen Dokumenteninhalt durchsuchen.

Texterkennung kann für die folgenden Dateiformate durchgeführt werden: TIFF, JPEG, BMP, PNG und GIF. TIFF-Dateien,die einen Alpha-Kanal benutzen oder eine JPEG-Komprimierung werden nicht unterstützt.

Anmerkung: Die Konvertierung einer Datei in eine durchsuchbare PDF-Datei hat keine Auswirkungen auf die Darstellung des Dokuments bei dessen Anzeige. Benutzer sehen weiterhin das original eingescannte Bild. M-Files speichert die Ergebnisse der automatischen Texterkennung als unsichtbaren Text in der PDF-Datei, der beim Durchsuchen der Datei verwendet wird. Mögliche Ungenauigkeiten bei der Texterkennung haben keine Auswirkungen auf die Darstellung des gescannten Dokuments, sollte es angezeigt oder ausgedruckt werden.


Die Registerkarte "Durchsuchbare PDF-Datei" im Dialogfeld "Verbindungseigenschaften".

Obwohl OCR alle Zeichensätze für westliche Sprachen erkennt, verbessert die Angabe einer Sprachauswahl oft die Qualität der Texterkennungsergebnisse. Die Liste der sekundären Sprachen enthält nur Sprachen, die zusammen mit der gewählten Primärsprache verwendet werden dürfen.

Die Texterkennung kann auch über M-Files Desktop ausgeführt werden. Weitere Informationen finden Sie im Abschnitt Scannen und Texterkennung (OCR). Wenn Sie die Texterkennung nur mit externen Quellen über den M-Files Serveradministrator durchführen möchten, können Sie diese Einschränkung über Änderungen an der Registrierungsdatenbank festlegen. Die Registrierungseinstellungen können auch zur Einrichtung anderer Einschränkungen genutzt werden. Für weitere Information zu den Registrierungseinstellungen kontaktieren Sie bitten den technischen Support über [email protected].

Anmerkung: Das M-Files OCR-Modul ist ein M-Files Add-on-Produkt, das gegen eine zusätzliche Gebühr erhältlich ist. Die Aktivierung erfolgt über einen Lizenzcode. Der vorhandene Lizenzcode muss durch den neuen Lizenzcode, der die Verwendung von M-Files OCR ermöglicht, ersetzt werden. Weitere Informationen finden Sie im Abschnitt Lizenzverwaltung. Die OCR-bezogenen Funktionen sind anschließend in M-Files Admin und M-Files Desktop verfügbar.

M-Files verwendet ein OCR-Modul von I.R.I.S. Bei Fragen zum Erwerb des M-Files-OCR-Moduls wenden Sie sich bitte an unser Verkaufsteam unter [email protected].

In PDF/A-1b-Dateiformat konvertieren

Wählen Sie diese Option, wenn Sie die Anforderungen der ISO-Norm 19005-1:2005 für die Langzeit-Archivierung elektronischer Dokumente erfüllen möchten.

PDF/A-1b ist ein eingeschränkteres Format als das von herkömmlichen PDF-Dateien, weshalb PDF/A-Dateien häufig größer sind als Dateien, die in das herkömmliche PDF-Format konvertiert werden. Darüber hinaus können beim Exportieren in das PDF/A-Format bestimmte erweiterte Darstellungseinstellungen weggelassen werden. Sie sollten die Konvertierung in das PDF/A-Format nur dann verwenden, wenn dies wirklich erforderlich ist, beispielsweise wegen der an die Langzeit-Archivierung gestellten Anforderungen.