Zusätzlicher Suchtext bei eingescannten PDF-Dokumenten
Das Problem: Eine Sammlung von Schaltplänen oder Zeichnungen liegt in Form von eingescannten PDF-Dokumenten vor. Aufgrund der Auflösung und/oder der Qualität der Beschriftung kann eine OCR-Erkennung nicht durchgeführt werden oder ist ungenügend. Zudem sollen abgebildete Teile zum Beispiel über eine nicht im Plan vorhandene Artikelnummer suchbar bzw. findbar gemacht werden.
MVPDFHiddenSearchText ist ein Werkzeug zur Erstellung von verborgenem Suchtext. Der Text wird zunächst mit Acrobat-Standardwerkzeugen in Form von temporären Textfledern erfasst. Diese werden zunächst über die zu findenden Stellen gelegt. Das Plug-In durchläuft eine oder mehrere PDF-Dateien, erkennt solche eingefügten Textfelder und publiziert deren Inhalt als verborgenen Text im Hintergrund des Dokumentes. Anschliessend werden die temporären Felder aus dem Vordergrund entfernt.
Die Acrobat-Suche findet nun die eingefügten Textstellen und markiert die Fundstelle.
Dieses Verfahren ist vielseitig einsetzbar und ist insbesondere auch geeignet, Ersatzteilpläne und Explosionszeichnungen mit findbaren Artikelnummern oder Texten zu ergänzen bzw. für die Implementierung eines Bestellsystems vorzubereiten.
