LERA-AE Handreichung

Diese Handreichung gibt eine kurze Einführung in die Arbeitsumgebung LERA und ihre zentralen Funktionalitäten, wie sie im Kontext der Digitalen Edition Hannah Arendt. Kritische Gesamtausgabe genutzt werden.

# 1. Die LERA Arbeitsumgebung

LERA (Locate, Explore, Retrace and Apprehend complex text variants, https://lera.uzi.uni-halle.de) ist eine interaktive, webbasierte Arbeitsumgebung zur Untersuchung von Gemeinsamkeiten und Unterschieden zwischen mehreren Fassungen eines Textes. Die Texte werden dazu von LERA in Segmente unterteilt und synoptisch gegenübergestellt. Unterschiede werden farbig hervorgehoben und in einem gemeinsamen Variantenapparat aufgeschlüsselt, sodass sie leicht lokalisiert werden können. Das Werkzeug bietet mit der Übersichtsleiste „CATview“ und der Suchfunktionalität weitere Ansätze zum effizienten Erkunden der Textunterschiede, vgl. LERA Demo unter https://lera.uzi.uni-halle.de/editions/3. LERA wurde am Institut für Informatik an der Martin-Luther-Universität Halle-Wittenberg für das Kollationieren als Grundlage für die Erstellung historisch-kritischer Ausgaben und Editionen entwickelt.

Aktuell wird LERA für ausgewählte Texte der kritischen Gesamtausgabe der Werke Hannah Arendts exemplarisch an das Webportal der Edition angebunden. Für diese exemplarische Umsetzung werden drei Textkomplexe bereitgestellt, die sich hinsichtlich verschiedener Parameter unterscheiden: Sprache (Deutsch, Englisch), Länge (Essay, Monographie), Anzahl der Fassungen (2–4). Die LERA-Anbindung wird kontinuierlich für weitere Textkomplexe umgesetzt mit dem Ziel, für alle Textkomplexe der kritischen Gesamtausgabe von Hannah Arendts Werk diese Arbeitsumgebung zugänglich zu machen.

# 2. Textkritischer Vergleich mit LERA

Von der Einzeltextansicht eines Textes auf dem Webportal der kritischen Gesamtausgabe der Werke Hannah Arendts (im Folgenden: AE-Portal) gelangt man über die Schaltfläche Textkritischer Vergleich (LERA) (im Werkzeugbereich „Textfassungen & Textkonstitution“) auf die LERA-Arbeitsumgebung. Nach Aufruf wird eine synoptische Gegenüberstellung des Ausgangstextes mit den anderen in der Edition verfügbaren Fassungen dieses Textes in LERA angezeigt.

2.1 Allgemeiner Seitenaufbau

Die LERA-Bedienoberfläche unterteilt sich in zwei Bereiche: Eine Menüleiste am oberen Seitenrand, über die sich zentrale Funktionalitäten ansteuern lassen, und einen großen Inhaltsbereich, in dem die alignierten Texte angezeigt werden. Im Einzelnen:
Von links nach rechts sind folgende Bedienelemente angeordnet:
  • de | en: Über diese Schaltfläche kann die Sprache (Deutsch | Englisch) gewechselt werden. Der Sprachwechsel bezieht sich auf die Sprache der Bedienelemente und Erläuterungen, nicht der Texte im Inhaltsbereich.
  • Schraubenschlüssel: Über die mittig stehende Schaltfläche mit dem Schraubenschlüssel können der Vergleichsalgorithmus und die Anzeige der Ergebnisse angepasst werden (siehe Abschnitt 3.1 und Abschnitt 3.2). Ist dieser Bereich geöffnet, ist die Schaltfläche rot unterlegt.
  • Barcode: Über die Schaltfläche mit dem Barcode gelangt man zu einer komprimierten Vergleichsansicht, der sog. CATview (siehe Abschnitt 4.1). Ist dieser Bereich geöffnet, ist die Schaltfläche rot unterlegt.
  • Edition durchsuchen: Ganz rechts wird der Suchschlitz für die Volltextsuche angezeigt (siehe Abschnitt 4.2). Die Suche bezieht sich auf alle Texte der aktuellen Vergleichsansicht.

Inhaltsbereich

Der Inhaltsbereich unterhalb der Menüleiste zeigt die vergleichende Gegenüberstellung (Synopse) von mehreren Texten:
  • In dem grauen Balken stehen die Titel der Textfassungen, die in den Vergleich einbezogen werden. Die Titel entsprechen der Verwendung im AE-Portal.
  • Die Textdarstellung erfolgt in Spalten, dabei enthält jede Spalte eine Textfassung, die wiederum in nummerierte Segmente unterteilt ist.
  • Unterschiede und Gemeinsamkeiten der Fassungen können farblich hervorgehoben werden (Schaltfläche Schraubenschlüssel, siehe Abschnitt 3.1 und Abschnitt 3.2).

2.2 Alignierung der Texte

Für eine Gruppe von Fassungen eines Textes erzeugt LERA automatisch eine vergleichende Gegenüberstellung (Synopse).
  • Die Textfassungen in den Spalten sind in Textsegmente unterteilt.
  • Einander entsprechende Textsegmente aus den verschiedenen Fassungen sind einander zugeordnet und werden in Zeilen aligniert.
  • Die alignierten Segmente sind aufsteigend nummeriert, die Nummer wird oberhalb einer Zeile alignierter Segmente mittig als graue Zahl angezeigt.
  • Gibt es für bestimmte Segmente einer Textfassung keine Entsprechung mit einem Segment einer der Vergleichsfassungen, wird dies durch den Text „keine Entsprechung vorhanden“ markiert.
Die komprimierte Vergleichsansicht, die sog. CATview (über die Barcode-Schaltfläche ansteuerbar), bietet einen schnellen Überblick über Zuordnung und Entsprechung von Segmenten und den Grad der Ähnlichkeit (mehr in Abschnitt 4.1).

2.3 Synoptische Ansicht

LERA setzt einen gleichrangigen Vergleich der Textfassungen um, d. h. jede Fassung wird mit allen anderen verglichen.
  • Unterschiede und Ähnlichkeiten in den Textfassungen werden farbig hervorgehoben (s. u.): Grau markiert sind Textvarianten und ihre korrespondierenden Parallelstellen in allen Fassungen. Durch farbliche Hervorhebung kann zudem die Art der Änderung für die varianten Stellen kenntlich gemacht werden (siehe Abschnitt 3.2).
  • Pro Segment werden die identifizierten Varianten durchnummeriert und als hochgestellte Zahlen im Text angezeigt.
  • In einem Variantenapparat werden diese aufgeschlüsselt; die Zahlen dort verweisen auf Zahlen in den Segmenten. Der Variantenapparat lässt sich durch Klicken auf den Pfeil unterhalb einer Zeile alignierter Segmente öffnen und dort unter dem Reiter Varianten einsehen.
  • Zusätzlich finden sich in diesem Bedienfeld unter dem Reiter Filter und Farbmodus lokale Optionen zur Anpassung der Vergleichs- und Anzeigefilter und der Farben (siehe Abschnitt 3).

# 3. Arbeiten mit LERA:
    Anpassung der Vergleichsoptionen und der Textanzeige

Der Aufruf von LERA ausgehend von einer Textansicht im AE-Portal führt zu einer synoptischen Gegenüberstellung aller in der Edition publizierten Textfassungen des Ausgangstextes. Die Ausführung des Textvergleichs und die Darstellung der Ergebnisse können über Einstellungen gesteuert werden. Nutzer*innen können über die Filtereinstellungen (Schaltfläche Schraubenschlüssel) in die Ergebnisse der Kollationierung und deren Darstellung eingreifen (siehe Abschnitt 3.1) und Optionen zur farblichen Markierung der Ergebnisse des Vergleichs wählen (siehe Abschnitt 3.2).

3.1 Filter

LERA stellt Filteroptionen bereit, mit welchen der Vergleich der alignierten Texte und deren Darstellung beeinflusst werden kann. Ein Klick auf die Schaltfläche Schraubenschlüssel in der oberen Menüleiste öffnet das Bedienfeld für Filter und Farbmodus. Ist das Bedienfeld geöffnet, ist die Schaltfläche rot hinterlegt. Durch erneutes Klicken auf die Schaltfläche wird das Bedienfeld geschlossen und die Schaltfläche erscheint wieder mit weißem Hintergrund.

Vergleichsfilter

Vergleichsfilter können verwendet werden, um Textvarianten zu ignorieren, die sich aus spezifischen Unterschieden bestimmter Buchstaben und Interpunktionszeichen ergeben. Dieses kann z. B. für Textvarianten nützlich sein, die ihren Ursprung in zu unterschiedlichen Zeiten geltenden Rechtschreibenormen haben (wie z. B. Varianz ß - Doppel-s) und nicht bedeutungsrelevant sind. Die Filter ermöglichen hier zwei Strategien: Ignorieren bestimmter Zeichen im Text (z. B. Satzzeichen) bzw. Normalisieren der Zeichen (wie z. B. ß → ss). Dies erlaubt es, variante Stellen aus der Darstellung auszuklammern, die für eine vorliegende Fragestellung ggf. nicht relevant sind, und eine bessere Lesbarkeit der Vergleichsansicht herzustellen.

Vergleichsfilter können unter dem Reiter Vergleichsfilter durch Aktivieren der jeweiligen Checkboxes gesetzt werden. Falls Unteroptionen verfügbar sind, wird dieses durch einen Pfeil am Ende des Checkbox-Labels markiert. Durch Klicken auf den Pfeil wird das Untermenü geöffnet, die Unteroptionen können einzeln aktiviert und deaktiviert werden. Die Checkbox einer Gruppe von Filtern aktiviert oder deaktiviert alle Unteroptionen.

Die Vergleichsfilter sind in drei Gruppen zusammengefasst: Buchstaben, Satzzeichen und Diakritische Zeichen.
Buchstaben
  • Groß- und Kleinschreibung ignorieren: Groß- und Kleinschreibung wird beim Vergleich als äquivalent behandelt.
  • Scharfes-s (ß) umwandeln (ß → ss): Alle Vorkommen von ß werden beim Vergleich durch Doppel-s ersetzt.
  • Umlaute umwandeln (Ä ä Ö ö Ü ü → Ae ae …): Alle Vorkommen von Umlauten werden beim Vergleich durch zwei Buchstaben ersetzt.
Satzzeichen
  • Alle Satzzeichen ignorieren: Satzzeichen werden vom Vergleich ausgeschlossen.
  • Unterschiedliche Anführungszeichen normalisieren: Alle Formen von Anführungszeichen werden beim Vergleich zu " normalisiert.
Diakritische Zeichen
  • Alle kombinierenden Zeichen ignorieren: Diakritische Zeichen werden vom Vergleich ausgeschlossen.

Für den aktuell geöffneten Reiter Vergleichsfilter oder Anzeigefilter können mit einem Klick auf die Schaltflächen alle und keiner in der Kopfzeile des Filtermenüs alle Filtergruppen inkl. Unteroptionen aktiviert bzw. deaktiviert werden.

Um Änderungen der Filtereinstellungen in der Synopse sichtbar zu machen, muss der Textvergleich über die blaue Schaltfläche Aktualisieren unten rechts im Bedienfeld Filter und Farbmodus aktualisiert werden. Die Filtereinstellungen können auch lokal für die einzelnen Segmente durch Klicken auf den Pfeil unterhalb einer Zeile alignierter Segmente im dortigen Bedienfeld Filter und Farbmodus vorgenommen werden. Diese müssen ebenfalls über die blaue Schaltfläche Aktualisieren ausgeführt werden.

Anzeigefilter

Mit Anzeigefiltern kann die Darstellung bestimmter Textelemente und -phänomene gesteuert werden, z. B. können Textzusätze der Editor*innen aus der Anzeige der Texte entfernt werden.

Anzeigefilter können unter dem Reiter Anzeigefilter durch Aktivieren der jeweiligen Checkboxes gesetzt werden. Falls Unteroptionen verfügbar sind, wird dieses durch einen Pfeil am Ende des Checkbox-Labels markiert. Durch Klicken auf den Pfeil wird das Untermenü geöffnet, die Unteroptionen können einzeln aktiviert und deaktiviert werden. Die Checkbox einer Gruppe von Filtern aktiviert oder deaktiviert alle Unteroptionen.

Die Anzeigefilter sind in drei Gruppen zusammengefasst: Editor*innentext, Textquelle und Layout.
Editor:innentext
  • Editor:innentext entfernen: Text der Editor:innen (d. h. Text in eckigen Klammern) wird ausgeblendet.
  • Lücken ausblenden: Hinweise auf Lücken in der Texttranskription werden ausgeblendet.
Textquelle
  • Texthervorhebungen ausblenden: In der Quelle vorgefundene Texthervorhebungen werden nicht wiedergegeben (z. B. Fettungen, Kursivierungen, Untertreichungen, Hochstellungen, Sperrungen und Kapitälchen).
  • Unsichere Lesungen nicht markieren: Nicht eindeutig entzifferte Textpassagen werden in der Textdarstellung nicht gekennzeichnet.
Layout
  • Zeilenumbrüche anzeigen: Zeilenumbrüche, die beim Upload der Textdaten in LERA erfasst wurden, werden angezeigt.

Für den aktuell geöffneten Reiter Vergleichsfilter oder Anzeigefilter können mit einem Klick auf die Schaltflächen alle und keiner in der Kopfzeile des Filtermenüs alle Filtergruppen inkl. Unteroptionen aktiviert bzw. deaktiviert werden.

Um Änderungen der Filtereinstellungen in der Synopse sichtbar zu machen, muss der Textvergleich über die blaue Schaltfläche Aktualisieren unten rechts im Bedienfeld Filter und Farbmodus aktualisiert werden. Die Filtereinstellungen können auch lokal für die einzelnen Segmente durch Klicken auf den Pfeil unterhalb einer Zeile alignierter Segmente im dortigen Bedienfeld Filter und Farbmodus vorgenommen werden. Diese müssen ebenfalls über die blaue Schaltfläche Aktualisieren ausgeführt werden.

3.2 Farbmodus

Die durch LERA im Textvergleich ermittelten varianten Textstellen können farblich markiert werden. Default ist die Hervorhebung von varianten Textstellen sowie ihrer Parallelstellen in allen Fassungen durch graue Markierungen. Ein Klick auf die Schaltfläche Schraubenschlüssel in der oberen Menüleiste öffnet das Bedienfeld für Filter und Farbmodus. Ist das Bedienfeld geöffnet, ist die Schaltfläche rot hinterlegt. Durch erneutes Klicken auf die Schaltfläche wird das Bedienfeld geschlossen und die Schaltfläche erscheint wieder mit weißem Hintergrund.

Im Bedienfeld Filter und Farbmodus kann im Bereich „Farbfilter“ die Art der Hervorhebung der varianten Stellen angepasst werden. Neben der grauen Markierung besteht eine Option zur farblichen Kodierung nach Art der Abweichung:
graue Markierungen
  • Alle varianten Textstellen werden grau hervorgehoben.
Wörter innerhalb der grau markierten Textstellen sind farblich hervorgehoben:
  • Innerhalb von grau markierten Varianten werden Wörter farblich hervorgehoben, die hinzukommen (grün), die gestrichen wurden (rot), oder die andere Wörter ersetzen (blau). Bitte beachten Sie, dass diese Interpretation auf der gegebenen Reihenfolge der Texte in der Vergleichsansicht basiert.
Um Änderungen der Filtereinstellungen in der Synopse sichtbar zu machen, muss der Textvergleich über die blaue Schaltfläche Aktualisieren unten rechts im Bedienfeld Filter und Farbmodus aktualisiert werden. Die Filtereinstellungen können auch lokal für die einzelnen Segmente durch Klicken auf den Pfeil unterhalb einer Zeile alignierter Segmente im dortigen Bedienfeld Filter und Farbmodus vorgenommen werden. Diese müssen ebenfalls über die blaue Schaltfläche Aktualisieren ausgeführt werden.

# 4. Zugriff auf die Texte

LERA bietet zwei Optionen für den effizienten und gezielten Zugang zu den Texten: über die komprimierte Vergleichsansicht CATview (siehe Abschnitt 4.1) und die Volltextsuche (siehe Abschnitt 4.2).

4.1 CATview

Ein Klick auf die Schaltfläche Barcode in der oberen Menüleiste öffnet die Vergleichsansicht CATview. Ist die CATview geöffnet, ist die Schaltfläche rot hinterlegt. Durch erneutes Klicken auf die Schaltfläche wird das Bedienfeld geschlossen und die Schaltfläche erscheint wieder mit weißem Hintergrund.

Die CATview bietet eine schematische Darstellung der alignierten Textsegmente: Jede Textfassung wird in einer Zeile repräsentiert, jedes Rechteck innerhalb der Zeilen steht für jeweils ein Segment der entsprechenden Fassung. Alignierte Textsegmente werden durch die vertikale Anordnung der Rechtecke in Spalten angezeigt. Fehlende Entsprechungen werden durch Leerflächen in der Spalte angezeigt. Der Grad der Varianz zwischen den Segmenten wird farblich markiert:
  • Identische Textsegmente werden durch graue Rechtecke angezeigt.
  • Die Varianz zwischen Segmenten wird durch unterschiedliche Blautöne visualisiert: Je kräftiger das Blau der Rechtecke, desto größer sind die Unterschiede im Text.
  • Der orangene Balken zeigt die aktuelle (Scroll-)Position in der Textsynopse.
  • Segmente, die ein Suchergebnis enthalten, werden gelb hervorgehoben (siehe Abschnitt 4.2).
Über einen Klick auf ein Rechteck in der CATview kann zu der entsprechenden Stelle in der Textsynopse gesprungen werden. In die CATview kann hinein und hinaus gezoomt werden. Der angezeigte Ausschnitt im gezoomten Modus kann durch Drag-and-drop weiterbewegt werden.

Eine Volltextsuche in den Texten der Vergleichsansicht kann über den Suchschlitz rechts in der oberen Menüleiste ausgeführt werden. Dazu muss der Suchbegriff im Suchfeld eingetragen und mit ENTER bestätigt werden. Es sind aktuell nur Einzelwörter suchbar. Der Asterisk (*) kann als Platzhalterzeichen an einer beliebigen Position im Einzelwort verwendet werden und wird in der Suche durch eine beliebige Zeichenfolge ersetzt, mit der Einschränkung, dass die verbleibende Zeichenfolge mindestens drei Zeichen umfasst. Zur Illustration:
  • möglich sind Philosophie*, Philosoph*, *sophie, Philo*e
  • nicht möglich ist i*ph*, da auf keiner Seite des Platzhalterzeichens mindestens drei Zeichen stehen.
Bei der Suche erfolgt eine automatische Normalisierung der Zeichen (u. a. bei Groß-/Kleinschreibung, diakritischen Zeichen, Umwandlung von Unicode in einen kompatiblen Modus, vgl. https://unicode.org/reports/tr15/#Canon_Compat_Equivalence).

Rechts des Suchschlitzes wird die Trefferzahl für den Suchbegriff angezeigt (z. B. 1/125) bzw. dass kein Ergebnis gefunden wurde („Kein Treffer“). Die Anzeige der Textsynopse springt automatisch zu dem Segment mit der ersten Fundstelle; der Suchbegriff wird gelb hervorgehoben. Die zweite Zahl (hier: 125) nennt die Gesamtzahl der Fundstellen, die erste Zahl die aktuell in der Textsynopse angezeigte Fundstelle (hier: 1). Mit den Pfeilen rechts kann zum vorherigen bzw. nächsten Suchergebnis navigiert werden. Die Segmente, die eine Fundstelle enthalten, werden auch in der Vergleichsansicht CATview gelb hervorgehoben (siehe Abschnitt 4.1).

Für eine erneute Suche kann die Eingabe im Suchfeld gelöscht und ein neuer Begriff eingegeben werden.