Methoden und Techniken

Zusammenfassung
Workflow
Editionskriterien und Markup

Zusammenfassung

Die wichtigste Herausforderung bei der Umsetzung des Projektes war die Definition von Editionskriterien und gleichzeitige Definition eines Schemas für die technische Auszeichnung der resultierenden Texte, das gängigen Standards entspricht und eine flexible Visualisierung im Browser ermöglicht.
Die Auszeichnung der Einzeldokumente erfolgte vollständig innerhalb des Schemas der fünften Version der Vorgaben der "Text Encoding Initiative" TEI P5.
Weil diese Auszeichnungssprache als gemeinsamer Standard für die Edition verschiedenster in den Digital Humanities relevanter Textsorten entwickelt wurde, war es notwendig, die Verwendung seiner Komponenten und Elemente für die Anforderungen des Korpus zu präzisieren und zu limitieren. Die Erarbeitung eines eigenen Moduls des TEI für die Repräsentation von in historischen Briefen gängigen Elementen und Strukturen ist ein allgemeines Desiderat, weshalb eine eigene special interest group (TEI-CORRESP-SIG) sich darum bemüht, die notwendigen Anpassungen zu formulieren.
Ich habe mich bei der Auswahl der zu verwendenden TEI-Elemente an den beiden Vorzeigeprojekten DALF (noch im Kontext des alten Standards TEI P-4 entwickelt) und WeGA orientiert. Im Gegensatz zu diesen Projekten habe ich - auch angesichts des weit limitierteren Umfangs - allerdings davon Abstand genommen, ein eigenes, vom Standard abweichendes Schema zu entwickeln, um den Anforderungen des Projekts gerecht zu werden. Vielmehr habe ich eine Reihe von Kompromissen geschlossen und vollständig im Rahmen des Standards zu arbeiten, ohne dabei die Natur und Struktur der Originaldokumente zu pervertieren oder die TEI-Elemente stark abweichend von ihrer Definition einzusetzen. Ich bedanke mich herzlich bei Peter Stadler, Sebastian Rahtz und anderen aktiven Mitgliedern der TEI und TEI-CORRESP-SIG Mailinglisten, die mich bei einzelnen Zweifeln und Umsetzungsproblemen unterstützt haben.

PFür die Arbeit mit den XML-Dateien wurden sowohl die Software XML Copy editor als auch OxyGen eingesetzt.

Workflow

Definition der inhaltlichen Elemente und Struktur der Dokumente, die im Markup und in der Visualisierung abgebildet werden sollten.
Zuordnung der TEI-Tags, mit denen diese Elemente ausgezeichnet werden wollten.
Definition der nötigen Metainformationselemente der Einzeldokumente.
Transkription der Dokumente in MS-WORD, unter Einsatz einiger Platzhalterelement. Parallele Kompilierung einer vollständigen Liste vorkommender Abkürzungen.
Konvertierung der Dokumente nach TEI, mithilfe von OxGarage.
Manuelle Ersetzung der TEI-Header mit der vorgefertigten Vorlage, Einsetzen der spezifischen Metainformation (Vorgang muss für größere Projekte verbessert/automatisiert werden).
Ersetzung der Platzhalter mit den passenden TEI-Tags.
Ersetzung der Abkürzungen durch geeigneten Markup (teilweise automatisierbar).
Programierung zweier Anpassungen der von TEI bereitgestellten XSL-Stylesheets "TEI2XHTML" zur Erzeugung zweier Ansichten:(Paläographische Ansicht und Redigierte Ansicht).
Webseitenprogrammierung.

Editions- und Markup-Kriterien

Hinsichtlich der Transkriptions- bzw. Editionskriterien habe ich mich weitestgehend an die für meine Dissertation entwickelten Vorgaben gehalten (open-access zugänglich) Zwischen Authentizität und Fiktion: Die private Korrespondenz spanischer Emigranten aus Amerika, 1492-1824, Suplemento electrónico: Edición de las cartas de llamada, que contiene la edición de unas 1200 cartas de emigrantes encontradas en el Archivo General de Indias en Sevilla.
Die folgende Liste enthält einige der maßgeblichen Grundsätze:

Die Strukturierung der Briefe in Absätze und Bündigkeit wurden respektiert und abgebildet. Seitenumbrüche werden markiert, Linienumbrüche jedoch nur bei den Briefumschlagen.
Satzzeichen, Akzente und Trennung der Worteinheiten, sowie Ersetzzung von "n" mit phonetischem Wert ɲ durch "ñ" wurden stillschweigend normalisiert, da diese Elemente häufig nicht existieren bzw. sehr inkonsequent eingesetzt wurden.
Ligierte Ausdrücke (desta) wurden stillschweigend mit "´" (d´esta) aufgelöst.
Auch der Gebrauch von Großbuchstaben wurde normalisiert, da es aufgrund der vielen verschiedenen Schriften mit recht kurzen Schriftproben häufig problematisch war, diese konsequent auseinanderzuhalten. /li>
Orts- und Zeitangaben wurden identifiziert und im Markup ausgewiesen, um Suchen zu ermöglichen.
Personennamen wurden hingegen vorläufig nicht einzeln ausgewiesen.

Um die doppelte Visualisierung zu ermöglichen mussten janus-gesichtige Elemente und Abkürzungen auf spezielle Weise ausgezeichnet werden. Abkürzungen wurden etwa folgendermaßen markiert:
<abbr>mantenim<am>.</am><ex>ien</ex><hi rend="superscript">to</hi></abbr>
um mit/ohne Abkürzungszeichen <am> bzw. mit/ohne editoriale Auflösung <ex> gezeigt werden zu können. Außerdem kann so der Teil <hi> hochgestelt oder wie regulärer Fließtext angezeigt werden.

Eine Sache, die sich von Anfang an als unpraktikabel herausgestellt hat war eine integrale Einbeziehung einer modernisierten und eine originalgetreuen Orthographie. Eine modernisierte Version müsste parallel und unabhängig erstellt werden.

"Im Auge des Hurrikans"

Briefe aus Ultramar nach Spanien, 1823 - Digitale Edition

Methoden und Techniken

Zusammenfassung

Workflow

Editions- und Markup-Kriterien