Das Institut für Slawistik der Humboldt-Universität zu Berlin untersucht aus dem 18. Jahrhundert überlieferte tschechischsprachige Handschriften aus Böhmisch-Rixdorf in Berlin und möchte mit Hilfe von computergestützten Analyseprogrammen herausfinden, wie sich Sprachwandel und kultureller Austausch daran nachweisen lassen. Gefördert wurde das im Frühjahr 2017 begonnene und auf drei Jahre ausgelegte interdisziplinäre Forschungsprojekt von der Volkswagenstiftung im Rahmen der Initiative „Mixed Methods“ in den Geisteswissenschaften
„Rixdorfer-Predigten“ – Handschriftenidentifikation und linguistische Autorenerkennung
Rund 5.000 Seiten, handschriftlich verfasst, entstanden zwischen 1740 und 1830 – Dokumente, die das Leben einer kleinen, ursprünglich tschechischsprachigen Gemeinde von Glaubensflüchtlingen aus Böhmen festhalten. Hintergrund ist die Flucht von rund 350 hussitischen Gläubigen aus Ostböhmen, die ab 1737 eine neue Heimat in Berlin-Rixdorf fanden. Deren Aufzeichnungen werden in einem Archiv in Berlin-Neukölln verwahrt.
Im Zusammenwirken beider Methodenstränge – Textwissenschaft und Bild-/Mustererkennung – sollten aussagekräftige Merkmale für die folgenden Aufgabenfelder gefunden und erprobt werden:
- Schreiberidentifikation in einer großen Zahl von handschriftlichen Texten
- Aufdecken von textgeschichtlichen Schichten durch Schreiberdifferenzierung
- Auffinden und Quantifizieren von wiederkehrenden Textstücken
- Identifikation von textgeschichtlich wichtigen Schriftmerkmalen
Im Fokus der Aufgabe für die MusterFabrik Berlin stand dabei die Entwicklung von Verfahren zur Analyse der Kontext-spezifischen Struktur von Bildmustern in den digitalisierten Handschriften zur Ableitung von qualitativen Aussagen über die Autoren und den Inhalt der Predigten.
Dazu wurden durch Entwicklung und Anwendung von Verfahren der Künstlichen Intelligenz in den Digitalisaten wiederkehrende Bildmuster wie beispielsweise Kontextverkettungen in Form von Buchstaben, Wörtern oder auch Satz-Phrasen detektiert und deren positionsbezogenes Vorkommen strukturell erfasst. Daraus wurde ein sogenanntes strukturiertes Netzwerk von Bildmustern abgeleitet, welches die detektierten wiederkehrenden Bildmuster, deren Anzahl sowie deren positionsbezogene Verknüpfung untereinander beschreibt. Darauf basierend wurde im Anschluss in Zusammenarbeit mit den Experten der Humboldt-Universität zu Berlin eine qualitativ-inhaltliche Analyse der Handschriften durchgeführt. Dabei wurden die vorab mit Hilfe der Verfahren des maschinellen Lernens automatisch ermittelten kontextspezifischen Zusammenhänge dahingehend analysiert, ob aus diesen qualitative Aussagen abgeleitet werden können.
Für eine derartige Struktur-Analyse wurden von der MusterFabrik Berlin in einem ersten Schritt geeignete Bildmerkmale für eine strukturelle Auswertung ermittelt. Darauf aufbauend wurde ein Modul zur Detektion von Bildmustern entwickelt. Zudem wurden Verfahren des maschinellen Lernens zur positionsbezogenen Verknüpfung und zur kontextspezifischen Analyse entwickelt. Abschließend wurde in Zusammenarbeit mit Mitarbeitern der Humboldt-Universität zu Berlin eine Analyse zur Ableitung qualitiver Aussagen aus den ermittelten Ergebnissen durchgeführt.
Gefördert von:
Unsere Projektpartner: