Datenerfassung | Datenindexierung

Professionelle und zuverlässige Datenerfassung | Datenindexierung.
Mit vorhandener Indexliste, manuell oder automatisiert.

Startseite » Ablauf Scan-Projekt » Datenerfassung und Datenindexierung

Datenerfassung IconEffiziente Digitalisierung durch strukturierte Datenerfassung

Die Voraussetzung für das Auffinden von digitalisierten Daten ist ein durchdachtes und gut strukturiertes Dateiablagesystem. Viele Unternehmen benutzen daher entsprechende Dokumentenmanagementsysteme (DMS) oder verwenden eine eigene Dateisystemstruktur.

Für jede Form der Datenablage ist es notwendig, die komplexen Beziehungen von Dokumenten detailgenau abzubilden, damit die digitalen Dokumente korrekt zugeordnet werden und bei Bedarf schnell abrufbar sind. Dies setzt jedoch eine der digitalisierten Dokumentenart zugeordnete Dateibezeichnung bzw. Dateibenennung voraus, die unabdingbar und zweifelsfrei in dem Dateiablagesystem abrufbar ist.

Sind die für die Dateibezeichnung benötigten Indexdaten bereits digital vorhanden, bilden sie die Grundlage für die Benennung der Dateien der digitalisierten Dokumente. Gibt es keine digitalen Indexwerte, können sie durch unser professionelles Team manuell oder automatisiert erstellt werden.

Datenübertragung

Manuelle Erfassung von Dateibezeichnungen und Indexwerten

Bei der manuellen Datenerfassung geht es vorrangig um verschiedene Indexwerte, die aus den digitalisierten Dokumenten sicher und schnell extrahiert und registriert werden. Die manuelle Erfassung und die nachfolgende Prüfung der Daten erfolgen unter unseren hohen internen Qualitätsstandards.

Stilisierte Hände aus Polygonen

Wirtschaftlichkeit aus Kundensicht soll bei der manuellen Datenerfassung mit der effizienten Leistungserbringung aus unserer Sicht einhergehen. Je nach Kundenanforderung werden die Daten daher entweder vor dem Scan-Vorgang oder danach manuell erfasst.

Hintergrund für die Datenerfassung nach dem Scan-Vorgang ist, dass wir zuerst die Dokumente mit OCR | Text­erkennung verschlagworten, um anschließend die benötigten Indexwerte zu extrahieren, die nun in digitaler Textform im Dokument vorhanden sind.

Im Gegensatz dazu ist bei in den Dokumenten vorkommenden handgeschrieben Indexwerten eine OCR | Text­erkennung noch nicht möglich.

Bei diversen Vertragsarten können wir mit der manuellen Datenerfassung bestimmte gewünschte Begriffe und Werte, wie z. B. Namen der Vertragspartner, Vertragsgegenstand oder einzelne Titel aus Verlagsverträgen, erfassen. Es ist nicht erforderlich, dass die genannten Indexwerte in den digitalen Dokumenten immer an der gleichen Position platziert sind.

Die indexierten Werte können unabhängig von der Verwendung der Dateibenennung auf Wunsch auch separat in andere Dateiformate wie Word oder Excel übertragen werden.

Datenerfassung am Laptop
Projektion von digitalen Informationen

Automatisierte Erfassung von Indexwerten aus dem Dokument

Die automatisierte Erfassung erfolgt nach dem Scan-Vorgang. Es müssen jedoch bestimmte Bedingungen vorhanden sein. Zunächst ist es wichtig, dass die gewünschten und zu erfassenden Indexwerte möglichst jeweils an der gleichen Position im Dokument vorkommen. Eine zu erfassende Rechnungsnummer beispielsweise sollte immer an der gleichen Stelle im Dokument stehen. Kleine Positionsabweichungen sind dank der „zonalen Erkennung“ kein Hindernis für die automatisierte Datenerfassung. Bei der zonalen Erkennung können wir softwarebasierend bestimmte Positionen im Dokument digital kennzeichnen bzw. markieren und dadurch den Inhalt oder auch Teile davon entsprechend der an dieser Position vorhandenen Indexwerte automatisiert erfassen.

Nach der automatisierten Datenerfassung werden die erkannten Zeichen durch eine Feld-Validierung mit unserer speziellen Software überprüft. Werden bestimmte Zeichen nicht sicher erkannt, erfolgt deren Auflistung in einer speziellen Maske und nach anschließender visueller Prüfung die Freigabe durch unser Team. Zusätzlich erfolgt eine stichpunktartige visuelle Prüfung aller erfassten Daten durch unser Team.

Automatisierte Erfassung mehrerer und unterschiedlicher Indexwerte aus einem Dokument

Auch mehrere und verschiedene Indexwerte und Begriffe können wir aus einem Dokument automatisiert erfassen und digital auslesen. Dies ist der Fall, wenn Sie z. B. für Ihr Dokumentenmanagementsystem (DMS) Einzeldokumente benötigen, die bereits in der Dateibezeichnung verschiedene Indexwerte beinhalten, die dann entsprechend Ihrem Datenablagesystem zugeordnet werden.

Hierzu erzeugen wir anforderungskonform digitale Erfassungsvorlagen, die entsprechend der unterschiedlichen Dokumentenarten und verschiedener Erfassungsvorgaben und Prüfungsanforderungen kategorisiert und erstellt werden. Nach dem Scan-Vorgang prüft die digitale Erfassungsvorlage das digitale Dokument mit den hinterlegten Prüfungskriterien und Erkennungsvorgaben.

Auch bei der Erfassungsvorlage sind Sicherheitsmechanismen berücksichtigt, die mit einer speziellen Prüfungsmaske die nicht erkannten Zeichen kenntlich machen, um sie danach einer stichpunktartigen visuellen Prüfung zu unterziehen.

digitalisierung-service.de Logo

Wichtige Infos