datascan

Ein nicht unerheblicher Teil von wichtigen Produkt- und Teileinformationen stehen nicht in maschinenlesbarer digitaler Form zur Aufbereitung zur Verfügung. Diese in PDF oder in Papierform vorliegenden Informationen werden heute oftmals noch manuell bearbeitet. Mit dem IFCC.DataScanner ist es möglich, diese Informationen maschinell unterstützt aufzubereiten. Bei der Entwicklung dieser Scan-Software ging und geht es ausschließlich darum, die Informationen – ob in Tabellen- oder Textform – so aufzubereiten, dass sie in einzelne Stammdatensätze transferierbar sind. Gerade die Transformation von komplex aufgebauten Produkttabellen bringt jedem Unternehmen, das mit solchen Formaten zu arbeiten hat, einen hohen Mehrwert.

Durch diese Anwendung ist es gelungen, sämtlich externen Datenquellen zu verarbeiten. Somit kann nun die gesamte „Informations-Supply-Chain“ aus einer Hand bedient werden. Alle Daten können durch die integrierte IFCC-Anwendungsfamilie aufbereitet werden. Die Datenausleitung kann wiederum je nach Anforderung sehr unterschiedlich sein.

 

 

Funktionalitäten

  • Automatische Texterkennung durch integrierte OCR-Funktionalität
  • Generierung verschiedener Materialstammsätze aus einem einzelnen Datenblatt. Hierbei können die einzelnen Materialstammsätze anhand einzelner Merkmale differenziert werden.
  • Teilautomatische Klassifizierung der generierten Materialstammsätze
  • Semiautomatische Extraktion von Merkmalen aus Fließtexten
  • Integration mit dem IFCC.DataOptimizer – Sämtliche Materialstammdaten, die von IFCC.DataScan erfasst bzw. generiert werden können im IFCC.DataOptimizer weiterverarbeitet werden.

Import/Export

  • Einlesen von grafischen Dateien in den Formaten BMP, PDF, GIF, JPG, TIFF, u.v.m.
  • Einlesen von mehrseitigen PDF- und TIFF-Dateien
  • Export der bearbeiteten Materialstammdaten nach XLS, TXT, CSV, OLEDB, BMEcat u.v.m.

 

Technische Besonderheiten

  • State-of-the-Art OCR-Texterkennung durch Kooperation mit Abbyy, dem Marktführer im Bereich OCR und Nutzung der Abbyy FineReader Engine
  • Mehrplatz-Anwendung aufgrund von Client-Server-Technologie
  • Programmierung auf C# (C Sharp), der modernsten Programmiersprache für Desktopanwendungen
  • Leistungsfähige Microsoft SQL Server 2008 R2 Datenbank

Aktuelle Entwicklung

  • Tabellenerkennung zur Differenzierung von Materialstammsätzen anhand tabellarisch angegebener Merkmale