Datenaufbereitung

Wir bieten Ihnen die Möglichkeit an, Ihre Dokumente per OCR zu konvertieren und per Verschlagwortung zu erfassen. Wir erstellen daraus Indizes, die direkt in Ihr Dokumenten-Mangement-System eingelesen werden können. Dies kann auch in Fraktur verfassten historischen Schriften durchgefüht werden.

Die Vorteile der digitalen Datenhaltung für mehr Effizienz im Arbeitsalltag nutzen:

  • Dokumente auf Datenträger gespeichert
  • keine Lagerfläche nötig
  • dauerhaft gesichert
  • Sicherung durch einfache Kopie möglich
  • jederzeit druckbar
  • Dokumente auf Wunsch logisch verknüpft
  • voll durchsuchbar und verschlagwortet

Vorteile einfacher digitaler Daten

Digitalisierte Dokumente können als Dateien auf Datenträgern ausgeliefert werden. Meist kommt das PDF/A-Format zum Einsatz. Es sind aber auch komprimierte TIFF-Dateien, vektorisierte Datenformate oder frei editierbare Textdateien möglich.

Liegen digitalisierte Dokumente als Datei vor, ist bereits ein wesentlicher Mehrwert erreicht. Die Daten brauchen keine Lagerfläche mehr, können per Kopie dupliziert und somit dauerhaft gesichert werden und sind durchsuchbar.

Für viele Anwendungsfälle reicht die einfache Form der Digitalisierung aus. Digitale Akten, auf die nur selten zugegriffen werden muss, können so angelegt werden.

Notwendigkeit von Dokumenten-Mangement-Systemen

Für viele Unternehmen ist es wichtig, komplex auf digitale Dokumente zugreifen zu können. Verschiedene Mitarbeiter müssen von verschiedenen Standorten digitale Dokumente nutzen können. Komplexe Zusammenhänge zwischen Dokumenten müssen abgebildet sein. So kann es beispielsweise notwendig sein, zu einem Vorgang gleichzeitig auf Auftragsbestätigungen, Lieferverträge und Rechnungen zugreifen zu können. Eine weitere Anforderung ist oft, dass nur berechtigte Personen auf Daten Zugriff erhalten.

All diese Anforderungen sind durch eine datenbankgestützte Dokumentenverwaltung zu gewährleisten, die server-/client-basiert aufgebaut ist. Softwarelösungen verschiedener Hersteller stehen am Markt zur Verfügung. Je nach Anforderung können die Systeme unterschiedlich dimensioniert ausfallen.

Datenaufbereitung, Indizierung

Um die komplexen Beziehungen von Dokumenten für ein datenbankbasiertes System abzubilden, müssen digitalisierte Dokumente um zusätzliche Informationen angereichert werden. Auch in der Papierwelt sind Dokumente strukturiert organisiert. So befindet sich ein Dokument nicht  irgendwo, sondern in einer bestimmten Abteilung des Unternehmens. Dort ist es in einem Aktenordner abgeheftet, welcher mit einer eindeutigen Beschriftung versehen ist. Dieser Ordner wiederum steht in einem bestimmten Regal, zusammen mit ähnlichen Ordnern. Diese Beziehungen werden in die digitale Welt übertragen. Außerdem können zusätzliche Beziehungen hergestellt werden, z.B. Verknüpfungen mit anderen Vorgängen des gleichen Kunden, der gleichen Abteilung oder mit ähnlichem Inhalt.

Zusatzdaten werden als Metadaten zu den Dokumenten gespeichert. Die Erfassung erfolgt idealerweise direkt vor dem Scanvorgang. Passend zum verwendeten Dokumenten-Management-System können Indizes erstellt werden, die mit den digitalen Dokumenten eingespeist werden können.

OCR-Konvertierung und Verschlagwortung auch mit Fraktur-Schrift

Der Scan eines Dokumentes erzeugt eine pixelbasierte Bilddatei. Für das menschliche Auge sind so alle Informationen digital erfasst. Ebenso lässt sich das Dokument durch Ausdrucken in eine physische Kopie verwandeln. Um in den Genuss zusätzlicher digitaler Vorteile zu kommen, können diese Pixeldaten durch  Schrifterkennung (OCR) zu voll durchsuchbaren Textdateien umgewandelt werden.  Dieser Volltext kann mit den  Pixeldaten zusammen gespeichert werden, z.B. als PDF-Datei. Nun sind die digitalen Dokumente auch für die Computerauswertung nutzbar. Beispielsweise können so tausende Dokumente mit einer einzigen Suchanfrage auf das Vorkommen bestimmter Schlagworte durchsucht werden. So können auch alte Bücher oder Dokumente mit Frakrur-Schrift digitalisiert werden und z.B. als PDF- Datei mit Volltextsuche (OCR) gespeichert werden.

Die Verschlagwortung von Dokumenten ist eine ähnliche Erweiterung von digitalen Dokumenten. Ist eine komplette OCR-Konvertierung nicht angebracht, können ausgewählte Dokumenteneigenschaften für Datenbanken erfasst werden. So können spezifische Werte, z.B. Kundennummern, separat erfasst werden.  In der Regel erfassen Mitarbeiter unseres Scanteams die notwendigen Daten manuell während des Scanprozesses.


to top
Cookies gewährleisten den vollen Funktionsumfang unseres Angebots. Mit der Nutzung unserer Dienste/Website erklären Sie sich damit einverstanden, dass wir Cookies verwenden. Mehr Informationen zu unserer Nutzung von Cookies finden Sie in unserer Datenschutzerklärung.
OK