Scannen und Texterkennung (OCR)

Hinweis: Dieser Inhalt wird nicht mehr aktualisiert. Den neuesten Inhalt finden Sie im Benutzerhandbuch für M-Files Online. Informationen zu den unterstützten Produktversionen finden Sie in unserer Lebenszyklus-Richtlinie.

Papierdokumente können zu M-Files hinzugefügt werden, indem Sie einen Netzwerk-Scanner oder lokalen Scanner einsetzen. Weitere Informationen zum Scannen über ein Netzwerk finden Sie im Abschnitt Scanner-Quellen. Wenn Sie lokal scannen, muss der Scanner direkt mit dem Computer verbunden sein, der zum Hinzufügen der gescannten Datei zu M-Files verwendet wird. Auf die Scan-Funktionen können Sie zugreifen, indem Sie die Alt-Taste drücken und anschließend das Vorgänge Menü öffnen.

Hinweis: Zur Integration von Scannern in M-Files Desktop werden die Technologien TWAIN und WIA verwendet. Es werden nur Scanner unterstützt, die mit einem TWAIN- oder WIA-Treiber eingerichtet werden können.

Wenn das OCR-Modul (optische Zeichenerkennung) von M-Files aktiviert ist, schlägt M-Files vor, die gescannte Datei nach Abschluss des Scanvorgangs per Zeichenerkennung in eine durchsuchbare PDF-Datei zu konvertieren. Sie können die Zeichenerkennung aktivieren oder den Vorschlag ignorieren. Sie können auch erweiterte Einstellungen für die Zeichenerkennung definieren.

Hinweis: Das M-Files OCR-Modul ist ein M-Files kostenpflichtiges Add-On-Produkt. Die Aktivierung erfolgt über einen Lizenzcode. Für weitere Information siehe Enabling the M-Files OCR Module und Verwaltung der Serverlizenzen. M-Files benutzt ein OCR-Engine von IRIS. Bei Fragen zum Erwerb des M-Files OCR-Moduls wenden Sie sich bitte an unser Verkaufsteam unter [email protected].

Sie können eine Bilddatei auch in eine durchsuchbare PDF-Datei umwandeln. Die optische Zeichenerkennung wird auf die Bilddatei angewendet, um eine Volltextsuche in der gesamten Datei zu ermöglichen. Nach der Konvertierung können Sie beispielsweise nach einem von einer Bilddatei konvertieren Vertragsdokument suchen, indem Sie bei der Suche die Namen der Vertragsparteien oder einen beliebigen, in der originalen Bilddatei enthaltenen Text, verwenden.

M-Files schlägt auch automatisch Zeichenerkennung vor, wenn Sie eine Datei nach M-Files ziehen, sofern Sie zuvor das M-Files OCR-Modul installiert haben. M-Files schlägt die Zeichenerkennung für PDF-Dateien nicht vor, da die optische Zeichenerkennung einer bereits durchsuchbaren PDF-Datei die Qualität verringert und die PDF-Dateigröße erhöht. Sie müssen deshalb über das Kontextmenü der PDF-Datei nicht durchsuchbare PDF-Dateien manuell in durchsuchbare PDF-Dateien umwandeln.

Die optische Zeichenerkennung kann für folgende Dateiformate durchgeführt werden:
  • TIF
  • TIFF
  • JPG
  • JPEG
  • BMP
  • PNG
  • PDF
TIFF-Dateien, die einen Alpha-Kanal benutzen oder eine JPEG-Komprimierung werden nicht unterstützt.
Hinweis: Wenn die Texterkennung für eine Bilddatei durchgeführt wird, die nicht gespeichert und an M-Files zurückgegeben wurde, wird die Datei nur als PDF gespeichert. Andernfalls ist die ursprüngliche Bilddatei im Versionsverlauf des Dokuments zu finden.

Import von Bilddateien als durchsuchbares PDF

Um eine Bilddatei als durchsuchbares PDF in die Dokumentenverwaltung zu importieren, wie folgt vorgehen:

  1. Eine Datei nach M-Files ziehen und ablegen.
  2. Optional: Im Konvertierung in durchsuchbares PDF Dialogfeld das Automatische Spracherkennung benutzen Kontrollkästchen markieren, um M-Files so einzustellen, dass die Sprache des Dokuments automatisch erkannt wird.
  3. Optional: Im Konvertierung in durchsuchbares PDF Dialogfeld, können Sie die Qualität der Texterkennung durch Auswahl der Erweitert Optionen zur Festlegung der Primär- und Sekundärsprache, die in der Bilddatei verwendet werden, verbessern.
    Das Öffnen der erweiterten Optionen deaktiviert die Option der automatischen Spracherkennung.
  4. Auf Konvertieren klicken, um die Konvertierung zu starten.
  5. Nachdem die Konvertierung beendet ist, erscheint das Dialogfeld Neues Dokument erneut. Beenden Sie den Import der Bilddatei, indem Sie die Metadaten ausfüllen und klicken Sie auf Erstellen.
Die Bilddatei wird als durchsuchbares PDF in die Dokumentenverwaltung importiert und ermöglicht es Ihnen, diese durch Einsatz der M-Files Suchfunktionen zu lokalisieren.

Konvertierung einer Bilddatei, die in M-Files gespeichert ist, in ein durchsuchbares PDF

  1. In M-Files die Bilddatei lokalisieren, die Sie in ein durchsuchbares PDF konvertieren wollen.
  2. Auf die Datei rechtsklicken und Scannen und Texterkennung (OCR) > In durchsuchbares PDF konvertieren... aus dem Kontextmenü auswählen.
  3. Optional: Im Konvertierung in durchsuchbares PDF Dialogfeld das Automatische Spracherkennung benutzen Kontrollkästchen markieren, um M-Files so einzustellen, dass die Sprache des Dokuments automatisch erkannt wird.
  4. Optional: Im Konvertierung in durchsuchbares PDF Dialogfeld, können Sie die Qualität der Texterkennung durch Auswahl der Erweitert Optionen zur Festlegung der Primär- und Sekundärsprache, die in der Bilddatei verwendet werden, verbessern.
    Das Öffnen der erweiterten Optionen deaktiviert die Option der automatischen Spracherkennung.
  5. Auf Konvertieren klicken, um die Konvertierung zu starten.
Die Bilddatei wird in ein durchsuchbares PDF konvertiert und sämtliche Textinhalte der Bilddatei können nun durch Verwendung folgender Suchfunktionen gefunden werden M-Files.