Durchsuchbares PDF

Hinweis: Dieser Inhalt wird nicht mehr aktualisiert. Den neuesten Inhalt finden Sie im Benutzerhandbuch für M-Files Online. Informationen zu den unterstützten Produktversionen finden Sie in unserer Lebenszyklus-Richtlinie.

M-Files kann Bilddateien von externen Datenquellen durch Einsatz von optischer Zeichenerkennung (OCR) in Durchsuchbare PDFs konvertieren. Die ermöglicht eine Volltextsuche von gescannten Dokumenten. Nach der Konvertierung finden Sie das PDF-Dokument, indem Sie den aktuellen Dokumenteninhalt durchsuchen.

Die optische Zeichenerkennung kann für folgende Dateiformate durchgeführt werden:
  • TIF
  • TIFF
  • JPG
  • JPEG
  • BMP
  • PNG
  • PDF
TIFF-Dateien, die einen Alpha-Kanal benutzen oder eine JPEG-Komprimierung werden nicht unterstützt.
Hinweis: Die Konvertierung einer Datei in eine durchsuchbare PDF-Datei hat keine Auswirkungen auf die Darstellung des Dokuments bei dessen Anzeige. Die Benutzer sehen die ursprünglich gescannte Bilddatei immer noch. M-Files speichert die Ergebnisse der automatischen Texterkennung als unsichtbaren Text in der PDF-Datei, der dann beim Durchsuchen der Datei benutzt wird. Mögliche Ungenauigkeiten bei der Texterkennung haben keine Auswirkungen auf die Darstellung des gescannten Dokuments, sollte es angezeigt oder ausgedruckt werden.
Hinweis: Das M-Files OCR-Modul ist ein M-Files kostenpflichtiges Add-On-Produkt. Die Aktivierung erfolgt über einen Lizenzcode. Für weitere Information siehe Enabling the M-Files OCR Module und Verwaltung der Serverlizenzen. M-Files benutzt ein OCR-Engine von IRIS. Bei Fragen zum Erwerb des M-Files OCR-Moduls wenden Sie sich bitte an unser Verkaufsteam unter [email protected].

Die folgenden Schritte ausführen, um Bilder von externen Dateiquellen in durchsuchbare PDFs zu konvertieren:

  1. M-Files Admin öffnen.
  2. In der hierarchischen Ansicht auf der linken Seite, eine Verbindung zum M-Files Server erweitern.
  3. Dokumentenverwaltungen erweitern.
  4. Eine Dokumentenverwaltung erweitern.
  5. Verbindungen mit externen Quellen erweitern.
  6. Dateiquellen erweitern.
  7. In der Dateiquellen Liste auf die Dateiquelle doppelklicken, die Sie bearbeiten wollen.
    Ergebnis:Das Verbindungseigenschaften Dialogfeld wird geöffnet.
  8. Auf die Durchsuchbare PDF Registerkarte klicken.
    Ergebnis:Die Durchsuchbare PDF Registerkarte wird geöffnet.
  9. Das OCR verwenden, um die Volltextsuche für gescannte Dokumente zu aktivieren Kontrollkästchen.
  10. Die Primärsprache und Sekundärsprache Dropdown-Menüs verwenden, um die Primär- und Sekundärsprache der gescannten Dokumente über die externe Verbindung auszuwählen, um die Qualität der Dokumentenerkennung zu verbessern. Die Liste der sekundären Sprachen enthält nur Sprachen, die zusammen mit der gewählten Primärsprache verwendet werden dürfen.
    Obwohl OCR alle Zeichensätze für westliche Sprachen und Kyrillisch erkennt, verbessert die Angabe einer Sprachauswahl oft die Qualität der Texterkennungsergebnisse. In nicht eindeutigen Fällen kann ein problematisches Erkennungsergebnis durch einen sprachspezifischen Faktor gelöst werden, so z. B. das Erkennen des finnischen Buchstabens „Ä“. Die Liste der sekundären Sprachen enthält nur Sprachen, die zusammen mit der gewählten Primärsprache verwendet werden dürfen.
  11. Optional: Das Verwenden Sie Hyperkomprimierung, um die Größe der PDF-Datei zu reduzieren Kontrollkästchen markieren, um die Dateigröße der Durchsuchbaren PDFs, die über diese Verbindung erstellt wurden, zu verringern.
  12. Optional: Das In PDF/A-1b-Dateiformat konvertieren Kontrollkästchen markieren, falls die konvertierten PDF-Dokumente den ISO-Standard 19005-1:2005 zur Langzeit-Archivierung von elektronischen Dokumenten erfüllen sollen.
    PDF/A-1b ist ein eingeschränkteres Format als das Format von herkömmlichen PDF-Dateien, sodass die PDF/A-Dateien häufig größer als die Dateien, die in das herkömmliche PDF-Format konvertiert werden, sind. Darüber hinaus können beim Exportieren in das PDF/A-Format bestimmte erweiterte Darstellungseinstellungen weggelassen werden. Sie sollten die Konvertierung in das PDF/A-Format nur dann verwenden, wenn es wirklich erforderlich ist, beispielsweise wegen der an die Langzeit-Archivierung gestellten Anforderungen.
  13. Auf OK klicken, um das Verbindungseigenschaften Dialogfeld zu schließen.
Die gescannten Dokumente über die diese Verbindung werden in durchsuchbare PDFs konvertiert, sofern sie in einem verwendbaren Format zur Verfügung gestellt werden. Nachdem sie importiert oder mit M-Files verknüpft worden sind, finden Sie diese, wenn nach dessen Inhalten suchen.
Hinweis: Die Texterkennung kann auch über M-Files Desktop ausgeführt werden. Weitere Informationen finden Sie im Abschnitt Scannen und Texterkennung (OCR). Wenn Sie die Texterkennung nur mit externen Quellen über den M-Files Admin durchführen möchten, können Sie diese Einschränkung über Änderungen an der Registry-Datenbank festlegen. Die Registry-Einstellungen können auch zum Einrichten anderer Einschränkungen genutzt werden. Für weitere Information zu den Registry-Einstellungen Schreiben Sie an unseren Kundendienst unter [email protected].