OCR | Texterkennung und Verschlagwortung

Erfahren Sie mehr über OCR | Texterkennung und Verschlagwortung

Startseite » OCR-Texterkennung

OCR Texterkennung IconVolltext-Durchsuchbarkeit Ihrer PDF-Dateien

Der Scan eines Dokumentes erzeugt eine pixelbasierte Bilddatei, mit der alle grafischen Informationen aus dem Dokument digital erfasst werden, das menschliche Auge nimmt sie als Abbild wahr. Aus dem gescannten Dokument lässt sich durch Ausdrucken auf Papier eine physische Kopie dieses Abbildes herstellen.

Dokumentenstapel und Leselupe

Die Bildinformationen (Pixeldaten) der gescannten Dokumente haben einen genialen Vorteil: Sie können in voll durchsuchbare Textdateien umgewandelt werden. Dazu gibt es spezielle Schrift- bzw. Texterkennungsprogramme, sogenannte OCR-Software (Optical Character Recognition, deutsch: Optische Zeichenerkennung oder Texterkennung).

Die OCR-basierte Volltext-Durchsuchbarkeit kann zusammen mit den pixelbasierten Bilddateien gespeichert werden, z. B. als PDF-Datei. Damit sind die digitalisierten Dokumente auch für die digitale Computerauswertung nutzbar. Beispielsweise können somit tausende digitale Dokumente (PDF-Dokumente) mit einer einzigen Textsuchanfrage auf das Vorkommen bestimmter Schlagwörter, Nummern und Kombinationen aus Schlagwörtern und Nummern durchsucht werden. Mit dieser Methode ist es möglich, auch alte Bücher oder Dokumente mit Frakturschrift zu digitalisieren und z. B. als PDF-Datei mit Volltextsuche (OCR) zu speichern.

Verschlagwortung

Ein weiterer Vorteil digitaler Dokumente ist die Möglichkeit der Verschlagwortung. Ist eine komplette OCR-Konvertierung nicht angebracht, können für Datenbanken ausgewählte Dokumenteigenschaften erfasst werden. Das betrifft die separate Registrierung spezifischer Kenndaten wie Kundennummern, Personalnummern oder Projektnummern. In der Regel verschlagwortet unser Scan-Team die notwendigen Daten während des Scanprozesses.

OCR Konfiguration am Laptop

Liegen Ihre Papierdokumente als Datei digitalisiert vor, ist ein wesentlicher Mehrwert erreicht: Digitale Daten benötigen keine analoge Lagerfläche, die Dokumente sind digital durchsuchbar, unbegrenzt kopierbar und dauerhaft gesichert.

Für viele Anwendungsfälle reicht die einfache Form der Digitalisierung aus, das betrifft digitale Akten, auf die nur selten zugegriffen werden muss.

digitalisierung-service.de Logo

Wichtige Infos