Export strukturierter Daten aus PDF mit MVPDFDataExtractor

Oft liegen Datenbestände "nur" im PDF-Format vor, sollen aber in eine strukturierte Form überführt werden. Zu diesem Zweck haben wir das Acrobat-Plug-In MVPDDataExtractor entwickelt, das speziell auch für grosse Datenbestände geeignet ist.

Ein Anwendungsbeispiel ist eine medizinische Studie über Herzkrankheiten, für welche die Rohdaten als Tabellen in hunderten von PDF-Dokumenten vorlagen. Durch Anpassung des Plug-Ins an das Layout und weitere Gegebenheiten konnten diese Daten in eine strukturierte Textdatei überführt und so für statistische Zwecke ausgewertet werden.