Über eXplore!
— Computergestützte Modellierung, Analyse und Exploration autobiographischer Texte
(als Grundlage für eScience in den eHumanities)
IDEE
Von Autobiographien und Erinnerungsbüchern über Reiseberichte und Briefe bis hin zum Tagebuch in all seinen Variationen – Die heterogene Gruppe autobiographischer Texte lässt sich kaum auf bestimmte Textsorten beschränken. Ein Hinweis auf eine mögliche Definition des weiten Begriffs lässt sich aus dem Terminus selbst ableiten. Etymologisch betrachtet sind Texte dann autobiographisch, wenn sie sich in schriftlicher Form mit dem Leben ihres Verfassers auseinandersetzen. Oftmals gestalten sich autobiographische Texte deshalb auch als Versuch einer innerhalb des Texts unterschiedlich präsenten Ich-Figur, sich selbst in Schriftform mit der sie umgebenden Welt in Verbindung zu setzen – als Versuch, sich selbst vielleicht sogar innerhalb dieser Welt zu verorten. Von Text zu Text in alternierendem Umfang und Zusammenhang und mit unterschiedlichem Grad an Reflexion und Emotion können Personen, Orte, Organisationen oder künstlerische Werke genauso Teil dieser von der Ich-Figur beschriebenen Umwelt des autobiographischen Texts werden wie historische Ereignisse, persönliche Erlebnisse, alltägliche Banalitäten oder Gedanken zum Schreibprozess des autobiographischen Texts selbst.
Ebenjene Entitäten mit all ihren Zusammenhängen, Abhängigkeiten und Einflüssen in Bezug auf die (be-)schreibende Ich-Figur des autobiographischen Texts sind Untersuchungsgegenstand des Forschungsvorhabens eXplore!. Durch Text Mining, Modellierung und Simulation untersuchen die beteiligten Forscher einerseits am konkreten Fallbeispiel der Tagebücher Klaus Manns, welche Einflussfaktoren sich in welcher Form auf die literarische Produktion und Produktivität des Tagebuchverfassers ausgewirkt haben. Durch die Exploration der dabei stattfindenden Forschungsprozesse und deren Abbildung in einen Scientific Workflow werden andererseits die Voraussetzungen geschaffen, um die entsprechenden Untersuchungsmethoden auf weitere autobiographische Texte übertragen zu können. Hierbei werden nicht nur inhaltlich nachhaltige Strukturen und Methoden der Digital Humanities aufgebaut. Auch die Forschungsarbeiten der mit digitalen Technologien arbeitenden Geistes- und Sozialwissenschaftler selbst werden reflektiert und wissenschaftlich begleitet.
INHALT
„Durch die (übrigens sehr amüsante und aufschlussreiche) Lektüre der alten Tagebücher (1919-20) fürs Kindheitsbuch, auf den Einfall gekommen, wieder Tagebuchartiges aufzuschreiben. Will mich aber an Sachlichstes halten.“ (Klaus Mann, Tagebuch, 9.10.31)
In mehrfacher Hinsicht verdeutlicht Klaus Mann gleich im ersten Eintrag seines wiederbegonnenen Tagebuchs dessen autobiographischen Charakter. Die Lektüre seiner frühen, heute nicht mehr erhaltenen Tagebücher zwecks Recherche für die Arbeit an seiner ersten Autobiographie „Kind dieser Zeit“ führt ihm offenbar einen entscheidenden Nutzen dieser Aufzeichnungen vor Augen. Für die neubegonnenen Tagebücher fasst er dementsprechend den Vorsatz, sich auf „Sachlichstes“ zu beschränken. Auch wenn er diese selbstgesetzte Norm nicht so streng befolgt, wie die superlativische Formulierung suggeriert, verzeichnet das vor allem in seinen Anfangsjahren nach dem Neubeginn fast täglich geführte Tagebuch doch in großem Umfang „Sachlichstes“: von Gesprächs- und Korrespondenzpartnern, eigenen und fremden Werken, Aufenthaltsorten, Verlagen und Zeitschriften, Restaurants und Bars über Theater- und Kinobesuche, Geschlechtsverkehr und den mehr oder weniger regelmäßigen Rauschmittelkonsum bis hin zu persönlich-privaten und historisch-politischen Ereignissen.
Die Vielzahl an tagtäglich Erlebtem oder Beobachtetem führt zum Einen inhaltlich zu der Frage, wann Klaus Mann bei all den diarisch festgehaltenen Aktivitäten zu seiner schriftstellerischen Arbeit kommt und wie sich diese täglichen Erlebnisse und Beobachtungen auf seine literarische Produktivität auswirken. Um literaturwissenschaftliche Fragestellungen wie diese beantworten zu können, ergibt sich zum Anderen methodisch die Frage, wie man diese Vielzahl an Informationen und Zusammenhängen überhaupt adäquat bewältigen kann. Im Zuge des Forschungsvorhabens eXplore soll nicht nur erprobt werden, inwiefern sich solche literaturwissenschaftlichen Fragestellungen zu autobiographischen Texten mithilfe von Text Mining, Modellierung und Computersimulation beantworten lassen. Durch die Exploration der dabei stattfindenden Forschungsprozesse und deren Abbildung in einen Scientific Workflow werden andererseits die Voraussetzungen geschaffen, um die entsprechenden Untersuchungsmethoden auf weitere autobiographische Texte übertragen zu können.
Methoden der Computersimulation haben sich bereits seit längerer Zeit in verschiedenen Wissenschaftsdisziplinen etabliert. Seit den 1990er Jahren halten diese auch vermehrt Einzug in sozialwissenschaftliche Forschungsbereiche und bieten dort verschiedene Möglichkeiten zur Darstellung und Analyse von gesellschaftlichen Systemzusammenhängen. Eine ähnliche Entwicklung lässt sich auch in den Digital Humanities beobachten, wenngleich diese Methoden – insbesondere im literaturwissenschaftlichen Bereich – eine eher untergeordnete Rolle spielen. Die insgesamt zunehmende Anwendung von Computersimulation als Forschungsmethode liegt darin begründet, dass sie die Möglichkeit bietet, komplexe, unzugängliche Systeme zu untersuchen und experimentell zu analysieren. In solchen Experimenten lassen sich u.a. durch die Betrachtung verschiedener Szenarien Resultate erzielen, die Rückschlüsse auf Plausibilitäten von Handlungen, Strukturen und Zusammenhängen im zugrundeliegenden System erlauben. Der Weg zu verlässlichen Ergebnissen einer Simulationsstudie führt in einem ersten, wesentlichen Schritt immer über die Modellbildung und Sammlung dafür relevanter Daten. Zu diesem Zweck soll das zugrundeliegende System, also konkret Klaus Mann, seine sozialen Kontakte und sein Umfeld möglichst realitätsnah mit allen wesentlichen Eigenschaften, Aktivitäten und Zusammenhängen in einer agentenbasierten Sozialsimulation abgebildet werden.
Die dafür notwendige Generierung einer geeigneten Datengrundlage ist ein anspruchsvoller Prozess, in dem anhand von Methoden aus dem Bereich des Text Mining zunächst die wesentlichen, auf den Untersuchungsgegenstand einwirkenden Faktoren identifiziert und analysiert werden müssen. Konkret sollen dabei verschiedene, bereits etablierte Methoden wie Named Entitiy Recognition, Sentiment Analyse oder Worthäufigkeits- und Kookkurrenzanalysen angewendet werden, um vorab Kontakte, Aktivitäten, Aufenthalte, Tätigkeiten, persönliche oder politische Ereignisse zu identifizieren, welche mit Klaus Manns literarischer Produktivität in Zusammenhang stehen könnten. Anders als im Falle der Computersimulation kommen Text Mining-Methoden, -Werkzeuge und Programmbibliotheken im literaturwissenschaftlichen Kontext bereits ungleich häufiger zum Einsatz. Zur Komplexitätsreduktion werden die zugrundeliegenden Text Mining-Prozesse dabei jedoch oft als Black Box betrachtet, was den Nachteil birgt, dass das Zustandekommen der erzielten Ergebnisse oft nur schwer nachvollzogen werden kann. Um dem entgegenzuwirken sollen die im Rahmen von eXplore! benötigten Text Mining-Prozesse explizit in Form von Scientific Workflows definiert und ausgeführt werden. Die in den Digital Humanities vergleichsweise wenig verbreiteten Scientific Workflows dienen der systematischen und transparenten Automatisierung wiederkehrender Datenverarbeitungsprozesse und haben sich in den Naturwissenschaften als geeignetes Mittel erwiesen, wissenschaftliche Prozesse zu strukturieren, zu dokumentieren und damit die Reproduktion und Validierung von Ergebnissen erheblich zu erleichtern. In eXplore! sollen erfolgreich eingesetzte Workflows daher als prozedurales Erfahrungswissen gespeichert und mithilfe von Verfahren der künstlichen Intelligenz wiederverwendbar gemacht werden, sodass die Definition neuer Text Mining-Workflows auf Basis bereits bestehender Workflows erfolgen und damit vereinfacht werden kann. Letztlich sollen somit nicht nur die Forschungsprozesse im Fallbeispiel Klaus Mann, sondern zukünftig auch ähnliche Text Mining-Problemstellungen sowie die Modellierungsarbeit in Simulationsstudien zur Erforschung weiterer autobiographischer Texte sinnvoll unterstützt werden.