Alles gefunden?
Hauptinhalt

Überblick zum Dokumentenformat PDF

„PDF-Dateien seien wie Gift“, wurde einmal eine blinde Person in einer Zeitung zitiert. Tatsächlich ist das Portable Document Format (PDF) wegen seiner Plattformunabhängigkeit überaus beliebt und eine Begegnung ist dadurch kaum zu vermeiden.

Bei der Entwicklung von PDF war eine zentrale Zielvorgabe elektronische Dokumente unabhängig von Plattform, ursprünglichem Anwendungsprogramm sowie Betriebssystem originalgetreu wiedergeben zu können. Ursprünglich von Adobe® Systems als universell kompatibles Dateiformat auf Basis des PostScript-Formats entwickelt, ist PDF heute internationaler Standard für den Austausch von Dokumenten und Informationen. Im Jahre 2008 hat Adobe die Weiterentwicklung des PDF-Formats geöffnet und an die ISO (International Organization for Standardization) übergeben. In der Iso-Norm 32000-2 finden sich die aktuellen Spezifikationen der aktuellen Version PDF 2.0.

Warum ist das PDF-Format so überaus beliebt?

  • grafische Integrität: Wie eingangs bereits erwähnt lassen sich in PDF Inhalt und Layout eines Dokuments plattformübergreifend exakt darstellen.
  • Vielfältig: Es können die unterschiedlichsten Inhalte eingebunden werden: Text, Bilder, Vektorgrafiken, Animationen, Audio-Dateien, 3D-Modelle, interaktive Felder, Hyperlinks, oder Schaltflächen.
  • Einfach handhabbar: Mit einem kostenlosen Viewer (Anzeigeprogramm) lassen sich PDF-Dokumente darstellen. Auch zum Erstellen von PDF-Dokumenten gibt es vielfältigste Möglichkeiten.
  • Sicherheit: Für den Schutz von Inhalten bzw. des gesamten PDF-Dokuments lassen sich verschiedene Zugriffsrechte festlegen. Dazu gehören bspw. Wasserzeichen, Passwörter oder Digitale Signaturen.
  • Kompaktheit: Obwohl PDF-Dateien unbegrenzt viele Informationen enthalten können, lassen sie sich auf sehr geringe Dateigrößen komprimieren.

PDF ist nicht gleich PDF

Sicherlich haben Sie unterbewusst schon öfters festgestellt, dass sich unterschiedliche PDF-Dokumente teils leicht anders in der Handhabung verhalten. Beispielsweise können Sie aus manchen PDF-Dokumenten Text herauskopieren, aus anderen dagegen nicht. Dies liegt daran, dass der Inhalt von PDF-Dokumenten ganz unterschiedlich aufgebaut sein kann.

Was für Sie mit Sehvermögen vielleicht einige Klicks mehr und einen kurzen Umweg bedeutet, kann für Personen, die den Computer mit Hilfstechnologien verwenden, ein Ausschlusskriterium darstellen.

Das PDF-Dokument kann sich als reines Bild, über einen nicht getagten Text bis zu einem vollständigen barrierefreien UA-konformen Dokument entpuppen. Es wird allerdings immer als Dateiname.pdf ausgegeben. Um welche Konformitätsstufe es sich handelt, können Sie nicht immer gleich feststellen.

Auch ist es – vor allem bei Dateien aus InDesign - sogar möglich, dass sich noch weitere Textebenen im Dokument verstecken. Dies kann im schlimmsten Fall dazu führen, dass Screenreadernutzende einen völlig anderen Text sehen, als das Text-Bild zeigt.

Welche Arten von PDF-Dokumenten gibt es?

Zumeist können PDF-Dokumente in vier Kategorien unterteilt werden:

  • Gescanntes PDF (Bild-PDF)

    Beim Scannen von Papierdokumenten oder umwandeln von Bildformaten (JPEG, TIF, BMP, gif etc.) entstehen sogenannte reine Bild-PDF-Dokumente. Sie können sich das so vorstellen, dass Sie den Text oder das Bild, dass Sie zuvor auf Papier mit den Augen lesen / sehen können jetzt mit den Augen am PC-Monitor lesen / sehen. Der gesamte Dokumentinhalt ist demnach in einem Bild "eingeschlossen".

    Eine Textebene fehlt, sodass für Personen mit Screenreader ohne Restsehvermögen das Dokument genau so leer ist, als würden Sie mechanisch ein Buch aufschlagen. Dort können die Seiten ohne Hilfsmittel auch nicht gelesen werden.

  • Digital erstelltes PDF

    Wenn Sie ein PDF-Dokument aus einem Textverarbeitungsprogramm wie Microsoft Word, LibreOffice, OpenOffice etc. oder aus Power-Point erstellen und dann nach PDF exportieren, so wird in der Regel ein "normales" PDF-Dokument erstellt. Dieses besteht dann aus Text und Bildern (je nach Verwendung im Ausgangsdokument).

    Hinweis: Natürlich kann im PDF-Dokument nur Text entstehen, wenn Sie in Ihrem Ausgangsdokument auch Text verwenden. Würden Sie in Ihrem Ausgangsdokument mehrere Bilder (auf denen sich Text befindet) einfügen und dann nach PDF exportieren, so kann denklogisch nur ein Bild-PDF entstehen.

    Digital erstelltes PDF mit oder ohne Tags

    Entscheidend von Lesbarkeit und Navigierbarkeit für Nutzende eines Screenreader ist die Verwendung sogenannter Tags. Vielleicht schon aus HTML bekannt, sind Tags Strukturelemente, die dem Screenreader eine logische Struktur vorgeben.

    Im Tag-Fenster wird die logische Dokumentstruktur angezeigt, die von Hilfstechnologien für die Auswertung des Dokuments verwendet wird. Durch die logische Struktur wird die Lesereihenfolge festgelegt. Außerdem werden Überschriften, Listen, Tabellen und andere Elemente identifiziert, die Benutzer von Hilfstechnologien verwenden können, um durch das Dokument zu navigieren.

    Problematisch ist, dass nicht bei jedem Export automatisiert Tags erstellt werden. Zudem gibt es bekannte Fehler bei verschiedenen Exportmöglichkeiten. Wählen Sie eine Export-Methode, welche keine Tags an das PDF-Dokument übergibt, erkennt der Screenreader aber eine Textebene, so wird je nach Screenreader in Abhängigkeit zur Version von Adobe Reader versucht das Dokument automatisiert zu taggen. Dazu öffnet der Screenreader ein Dialogfenster mit verschiedenen Einstellungsmöglichkeiten.

  • Durchsuchbare PDF

    Durchsuchbare PDF-Dokumente sind in der Regel das Ergebnis der Anwendung von OCR auf gescannte PDFs. Durch den Texterkennungsprozess werden Dokumentenstruktur und Textzeichen analysiert und “gelesen”. Eine Ebene mit dem erkannten Text wird dem Seitenbild hinzugefügt – in der Regel unter der Bildebene.

    Achtung: Wie bereits oben erwähnt, sind Textebene und Bildebene technisch voneinander getrennt.

    Diese OCR-behandelten PDFs sind optisch kaum von den Originaldokumenten zu unterscheiden, jedoch voll durchsuchbar. Texte können markiert, ausgewählt und bearbeitet werden.

  • Universal Accessible PDF

    Ist das PDF-dokument als Universal Accessible (UA) geprüft, so sollte es für Personen mit Behinderung ohne Probleme lesbar sein. Gleichzeitig ist das Erreichen diese Konformitätsstufe manuell nur mit einigem Aufwand und von Beginn an sorgfältiger Planung zu erreichen.