Durchsuchbares PDF

M-Files kann Bilddateien von externen Datenquellen durch Einsatz von optischer Zeichenerkennung (OCR) in Durchsuchbare PDFs konvertieren. Die ermöglicht eine Volltextsuche von gescannten Dokumenten. Nach der Konvertierung finden Sie das PDF-Dokument, indem Sie den aktuellen Dokumenteninhalt durchsuchen.

Bei diesen Dateiformaten können Sie die optische Zeichenerkennung verwenden:
  • TIF
  • TIFF
  • JPG
  • JPEG
  • BMP
  • PNG
  • PDF
TIFF-Dateien mit Alphakanal oder JPEG-Komprimierung werden nicht unterstützt.
Hinweis: Die Konvertierung einer Datei in eine durchsuchbare PDF-Datei hat keine Auswirkungen auf die Darstellung des Dokuments bei dessen Anzeige. Die Benutzer sehen die ursprünglich gescannte Bilddatei immer noch. M-Files speichert die Ergebnisse der automatischen Texterkennung als unsichtbaren Text in der PDF-Datei, der dann beim Durchsuchen der Datei benutzt wird. Mögliche Ungenauigkeiten bei der Texterkennung haben keine Auswirkungen auf die Darstellung des gescannten Dokuments, sollte es angezeigt oder ausgedruckt werden.

Die folgenden Schritte ausführen, um Bilder von externen Dateiquellen in durchsuchbare PDFs zu konvertieren:

  1. M-Files Admin öffnen.
  2. In der hierarchischen Ansicht auf der linken Seite, eine Verbindung zum M-Files Server erweitern.
  3. Dokumentenverwaltungen erweitern.
  4. Eine Dokumentenverwaltung erweitern.
  5. Verbindungen mit externen Quellen erweitern.
  6. Dateiquellen erweitern.
  7. In der Dateiquellen Liste auf die Dateiquelle doppelklicken, die Sie bearbeiten wollen.
    Ergebnis:Das Verbindungseigenschaften Dialogfeld wird geöffnet.
  8. Auf die Durchsuchbare PDF Registerkarte klicken.
    Ergebnis:Die Durchsuchbare PDF Registerkarte wird geöffnet.
  9. Das OCR verwenden, um die Volltextsuche für gescannte Dokumente zu aktivieren Kontrollkästchen.
  10. Die Primärsprache und Sekundärsprache Dropdown-Menüs verwenden, um die Primär- und Sekundärsprache der gescannten Dokumente auszuwählen, um die Qualität der Dokumentenerkennung zu verbessern. Die Liste der sekundären Sprachen enthält nur Sprachen, die zusammen mit der gewählten Primärsprache verwendet werden dürfen.
    Obwohl OCR alle Zeichensätze für westliche Sprachen und Kyrillisch erkennt, verbessert die Angabe einer Sprachauswahl oft die Qualität der Texterkennungsergebnisse. In nicht eindeutigen Fällen kann ein problematisches Erkennungsergebnis durch einen sprachspezifischen Faktor gelöst werden, so z. B. das Erkennen des finnischen Buchstabens „Ä“. Die Liste der sekundären Sprachen enthält nur Sprachen, die zusammen mit der gewählten Primärsprache verwendet werden dürfen.
  11. Optional: Das Verwenden Sie Hyperkomprimierung, um die Größe der PDF-Datei zu reduzieren Kontrollkästchen markieren, um die Dateigröße der Durchsuchbaren PDFs, die über diese Verbindung erstellt wurden, zu verringern.
  12. Optional: Das In PDF/A-1b-Dateiformat konvertieren Kontrollkästchen markieren, falls die konvertierten PDF-Dokumente den ISO-Standard 19005-1:2005 zur Langzeit-Archivierung von elektronischen Dokumenten erfüllen sollen.
    PDF/A-1b ist ein eingeschränkteres Format als das Format von herkömmlichen PDF-Dateien, sodass die PDF/A-Dateien häufig größer als die Dateien, die in das herkömmliche PDF-Format konvertiert werden, sind. Darüber hinaus können beim Exportieren in das PDF/A-Format bestimmte erweiterte Darstellungseinstellungen weggelassen werden. Sie sollten die Konvertierung in das PDF/A-Format nur dann verwenden, wenn es wirklich erforderlich ist, beispielsweise wegen der an die Langzeit-Archivierung gestellten Anforderungen.
  13. Auf OK klicken, um das Verbindungseigenschaften Dialogfeld zu schließen.
Die über die diese Verbindung gescannten Dokumente werden in durchsuchbare PDFs konvertiert, sofern sie in einem verwendbaren Format zur Verfügung gestellt werden. Nachdem sie importiert oder mit M-Files verknüpft worden sind, finden Sie diese, wenn nach dessen Inhalten suchen.
Hinweis: Die Texterkennung kann auch in M-Files Desktop ausgeführt werden. Weitere Informationen finden Sie im Abschnitt Scannen und Texterkennung (OCR). Um die Texterkennung nur mit externen Quellen über den M-Files Admin durchzuführen, können Sie diese Einschränkung über Änderungen an den Registry-Einstellungen festlegen. Die Registry-Einstellungen können auch zum Einrichten anderer Einschränkungen genutzt werden. Für weitere Information zu den Registry-Einstellungen wenden Sie sich über das M-Files Support Portal an unseren Kundendienst oder an Ihren M-Files Händler.