unerwünschte Metadaten aus durch pdfTeX generierter PDF-Datei entfernen

Dienstag, 22. Februar 2011, 03:10 Uhr von Christian

Ich wurde zufällig darauf aufmerksam, dass, wenn man in ein mit LaTeX erstelltes Dokument bereits existierende PDF-Dateien (die z. B. Grafiken enthalten) einbindet und dieses LaTeX-Dokument mithilfe von pdfTeX (das auch Bestandteil von MiKTeX ist) als PDF-Datei ausgegeben wird, in dem Resultat die vollständigen Pfadangaben zu den eingebundenen PDF-Dateien enthalten sind. Das kann dann folgendermaßen aussehen:

/PTEX.FileName (A:/Masterarbeit/bilder/diagramm.pdf)

Im Rahmen der Weitergabe oder gar Veröffentlichung wird sicherlich nicht jeder wollen, dass das Dokument solche Informationen preisgibt.

Durch einen Patch (siehe auch Diskussion in der pdfTeX-Mailingliste) soll sich dieses Verhalten ab Version 1.50 von pdfTeX mittels \pdfsuppressptexinfo steuern lassen. Da jedoch in der momentan aktuellen Version 2.9 von MiKTeX noch eine 1.40er-Version enthalten ist, brauchen Ungeduldige eine andere Lösung. Nach etwas Recherche fand ich pdftk, mit dem sich PDF-Dateien zur weiteren Verarbeitung zumindest de- und komprimieren lassen. Der Vorgang gestaltet sich folgendermaßen:

  1. PDF-Datei dekomprimieren
  2. PTEX-Attribute entfernen
  3. PDF-Datei komprimieren

Ich nutze dafür also pdftk und PHP in diesen drei Schritten, um die PTEX-Attribute sauber mithilfe eines regulären Ausdrucks zu entfernen:

pdftk originaldatei.pdf output uncompressed.pdf uncompress
php -n -r "file_put_contents('cleaned.pdf', preg_replace('|^/PTEX.*\n|imU', '',
		file_get_contents('uncompressed.pdf')));"
pdftk cleaned.pdf output zieldatei.pdf compress

(Der Aufruf von PHP muss dabei in einer Zeile erfolgen.)

Die Datei „zieldatei.pdf“ ist die nun bereinigte Fassung des Dokuments. Die zwischendurch entstandenen Dateien „uncompressed.pdf“ und „cleaned.pdf“ sind irrelevant, sofern man die einzelnen Schritte nicht nachvollziehen bzw. kontrollieren will.

Geschrieben in: LaTeX | Schlagwörter: , ,
Keine Kommentare »

LaTeX-Paket „gradientframe“ zum Setzen eines dezenten Rahmens mit Graustufenverlauf um Objekte

Donnerstag, 10. Februar 2011, 18:38 Uhr von Christian

Heute wurde mein erstes LaTeX-Paket namens gradientframe veröffentlicht. Es dient dem Setzen eines dezenten Rahmens mit Graustufenverlauf um Objekte (wie Bilder oder Tabellen), um diese im Fließtext hervorzuheben. Die Dokumentation des Pakets enthält auch einige Beispiele. Es ist im CTAN unter http://tug.ctan.org/pkg/gradientframe/ bzw. http://www.ctan.org/tex-archive/macros/latex/contrib/gradientframe/ und, nachdem es verteilt wurde, auch unter http://mirror.ctan.org/macros/latex/contrib/gradientframe/ zu finden.

Geschrieben in: LaTeX | Schlagwörter:
Keine Kommentare »

Мы борг. Widerstand ist zwecklos.

Mittwoch, 2. Februar 2011, 00:15 Uhr von Christian

In letzter Zeit häufen sich Versuche der Kontaktaufnahme durch russische Bots, die (je nach Konfiguration) von einem ICQ-Client zuerst als sog. Autorisierungsanfragen gemeldet werden, die man dann wahlweise entweder annehmen oder ablehnen kann, wie das Bild zeigt (Nutzeridentifikationsnummern unkenntlich gemacht). Dieses Mal aber war der angegebene Grund jedoch sogar ganz lustig: „Мы борг. Вы будете ассимилированы. Сопротивление бесполезно“ oder auf deutsch „Wir sind die Borg. Sie werden assimiliert werden. Widerstand ist zwecklos“. Man muss nicht unbedingt Star-Trek-Fan sein, um dieses Zitat zu kennen. Auch ganz witzig und dazu passend ist diese Liste von „Übersetzungen“ in verschiedene Dialekte. Wie einem Spam doch den Abend (bzw. den Morgen) versüßen kann … Abgelehnt wurde diese Anfrage aber natürlich trotzdem. Widerstand ist also doch nicht ganz zwecklos. 😀

Geschrieben in: sonstiges, www | Schlagwörter: ,
Keine Kommentare »