Dieses Jahr nur zwei visuelle Eindrücke von der DGfS-Tagung:
Schlagwort-Archive: Uni Göttingen
Wie man ein Korpus zusammenstückelt und einen Teufelspakt schließt
Ich bin momentan dabei, eine Sammlung frühneuhochdeutscher Texte (ein “Korpus”), aus denen man idealerweise Aussagen über das Deutsch der damaligen Zeit ableiten kann, für mein Dissertationsvorhaben anzupassen. Das Korpus wurde ursprünglich zusammengestellt, um die Entstehung der Substantivgroßschreibung zu untersuchen, deshalb machte es z.B. nichts aus, dass auch übersetzte Texte darin enthalten waren. Bei meiner Fragestellung habe ich aber ein bißchen Angst, dass die Wort- und Satzstruktur durch direkte lateinische Vorlagen beeinflusst sein könnte. Deshalb werfe ich übersetzte Texte raus und nehme andere rein.
Ich war also in der letzten Zeit viel auf der Suche nach passenden Texten – sie müssen aus bestimmten Zeitspannen sein, als Drucke vorliegen und von bestimmten Druckorten (oder wenigstens aus deren Dialektgebiet) stammen. Ach ja, Gereimtes darf auch nicht. Und mindestens 4000 Wörter lang. Und sie müssen Originale oder Faksimiles als Vorlage haben.
Perfekt sind Texte, die elektronisch vorliegen, wie z.B. die Texte des Bonner Frühneuhochdeutschkorpus. Auch bei Wikisource findet sich für vergangene Jahrhunderte einiges, was sorgfältig von den Originalen abgetippt und korrekturgelesen wurde und sich damit auch bei Unsicherheiten immer vergleichen lässt. Weniger perfekt, aber als Lückenfüller geeignet ist auch GoogleBooks – die Texterkennung, die man über die alten Drucke gejagt hat, taugt zwar für Fraktur nichts, aber man kann sich viele alte Bücher als Pdf runterladen und dann per Auge durchsuchen. Ansonsten gibt es auch noch eine ganze Reihe von Unibibliotheken, die ihre alten Drucke und Manuskripte als Bilder digitalisieren, z.B. Heidelberg und Göttingen. (Heidelberg hat auch eine enorm ausführliche Linkliste zum Thema.)
Auf meiner Suche habe ich viele Texte angelesen – auch welche, die gar nicht geeignet, aber dafür sehr kurios sind. Zum Beispiel diesen (Foto von Historiograf):