interconnections, 29.07.2004

Das Heinrich-Heine-Portal - ein integriertes Informationssystem
Seit Herbst 2002 läuft dieses Kooperationsprojekt zwischen dem Heinrich-Heine-Institut der Stadt Düsseldorf und dem Kompetenzzentrum für elektronische Erschließungs- und Publikationsverfahren in den Geisteswissenschaften der Universität Trier. Das Projekt erfährt seine Förderung im Rahmen des DFG-Programms "Retrospektive Digitalisierung von Bibliotheksbeständen" und ist auf fünf Jahre angelegt. Ziel der Arbeiten ist die erste vollständige Zusammenführung und Digitalisierung von Heines Werken und Briefen in einem Internetportal, welches beliebig erweiterbar sein soll.
Als Referenzausgaben dienen die Düsseldorfer Historisch-kritische Ausgabe (DHA), die zwischen 1973 und 1997 in 16 Bänden (23 Einzelbände mit insgesamt rund 20.000 Seiten) unter der Herausgeberschaft von Manfred Windfuhr erschienen ist und die Briefbände mit den dazugehörigen Kommentaren und dem Register (9 Bände, 17 Einzelbände mit circa 6.000 Seiten) der Weimarer Säkularausgabe (HSA), die 1970 bis 1984 von den Nationalen Forschungs- und Gedenkstätten der klassischen deutschen Literatur in Weimar (heute Stiftung Weimarer Klassik) und dem Centre National de la Recherche Scientifique in Paris herausgegeben wurde. Über die reine Bereitstellung dieser Texte hinaus, bietet das Portal eine Verknüpfung mit Faksimiles von den originalen Werk- und Briefhandschriften und eine digitale Bildergalerie. In einer zweiten Phase wird dem Portal auch eine umfangreiche Heine-Bibliographie hinzugefügt. Diese beinhaltet die in Buchform vorliegende Zusammenstellung der Publikationen bis 1995 und die vom Heine- Institut erstellte laufende Bibliographie. Des weiteren werden Datenbanken zu Heines Briefen und Werken erstellt, die sowohl eine Übersicht über den Aufenthaltsort der Faksimiles bieten als auch Auskunft geben über den Umfang, die Beschaffenheit des Papiers und die Nummer, unter der der jeweilige Brief in der HSA zu finden ist. Insgesamt entsteht somit eine umfassende Informationsplattform zu Heinrich Heine.

Zum Projektablauf
Der Projektablauf gliedert sich in drei große Einzelschritte: Am Anfang steht die Digitalisierung der gedruckten Texte, daran anschließend folgt deren inhaltlich-logische Aufbereitung, den Abschluß bildet die elektronische Publikation im Internet. Im September 2002 begann die Vorbereitung für die Datenerfassung in China und für die anschließend in Trier durchzuführende SGML/XML-konforme Auszeichnung der Texte: die ausführliche Dokumentanalyse. Dabei wird der Text nicht inhaltlich zur Kenntnis genommen, sondern im Hinblick auf seine typographischen und strukturellen Besonderheiten, die dann sorgfältig beschrieben werden und schließlich in Erfassungsanweisungen münden. Dazu werden Tabellen erstellt, in denen alle im Text vorkommenden Phänomene festgehalten und kurz erläutert werden. Jedes Phänomen erhält eine Kodierung und ein Muster/Beispiel aus dem Text als Beleg. So können die Datentypisten mit einem exakten Regelwerk ausgestattet werden. Dieses wird dann ins Chinesische übertragen und gemeinsam mit den Textvorlagen nach China gesandt. Dort geben die Mitarbeiter der Firma TQY den Text in zwei unabhängig voneinander arbeitenden Gruppen ein ("double keying"). Diese zweifache manuelle Eingabe erfolgt in MS Word. Zusätzlich zum eigentlichen Text wird auf der Grundlage des Regelwerkes ein character encoding (z.B. das Kodieren von typographischen Merkmalen wie etwa Kapitälchen, Kursivierungen und Sperrungen) und ein page encoding (das heißt, der originale Seiten- und Zeilenumbruch wird rekonstruiert) vorgenommen.

Dass diese Eingabearbeit in China durchgeführt wird, hat einen wichtigen Grund: ein deutschsprechender Mensch würde wesentlich mehr Fehler produzieren als jemand, der der Sprache nicht mächtig ist. Die doppelte Eingabe dient dem Vergleich der zwei Versionen, wodurch man die wenigen Fehler (etwa eine Verwechslung zweier Buchstaben aufgrund einer Ungenauigkeit in der Vorlage), die die Dateien aus China dennoch enthalten, beinahe vollständig entfernen kann. Die Dokumentanalyse und die Eingabe der gesamten Daten dauerten insgesamt rund ein Jahr lang. Im Mai 2003 waren die Daten der HSA zurück in Trier, im September 2003 folgte die vollständige DHA. Nach dem Datenabgleich erfolgt die Auszeichnung der Daten nach den TEI-Richtlinien. Diese ist momentan für die HSA komplett abgeschlossen, die Arbeiten an der DHA laufen und werden mit Ende der ersten Förderphase des Projektes Anfang 2005 abgeschlossen sein. Um sich das Ergebnis aus diesen Arbeitsschritten ansehen zu können, müssen die bearbeiteten Daten innerhalb einer Arbeitsumgebung für das Internet aufbereitet werden. Dies geschieht mittels des Content-Management Systems ZOPE (Z Object Publishing Environment). Eine solche einheitliche Arbeitsumgebung hat zunächst den Vorteil, dass sie kostenfrei nutzbar ist, überdies erweist sie sich als vorteilhaft, weil sie plattformungebunden zu verwenden ist. Der Aufbau des Portals mittels ZOPE hat bereits begonnen, einige Bände der HSA sind schon im Netz verfügbar; zusätzlich kann man sich einen Teil der Handschriften und Bilder anzeigen lassen. Nathalie Groß


 Zum Artikel im Internet