Schlagwort-Archive: Uni Göttingen

Wie man ein Korpus zusammenstückelt und einen Teufelspakt schließt

Von Kristin Kopf

Ich bin momen­tan dabei, eine Samm­lung früh­neuhochdeutsch­er Texte (ein “Kor­pus”), aus denen man ide­al­er­weise Aus­sagen über das Deutsch der dama­li­gen Zeit ableit­en kann, für mein Dis­ser­ta­tionsvorhaben anzu­passen. Das Kor­pus wurde ursprünglich zusam­mengestellt, um die Entste­hung der Sub­stan­tiv­großschrei­bung zu unter­suchen, deshalb machte es z.B. nichts aus, dass auch über­set­zte Texte darin enthal­ten waren. Bei mein­er Fragestel­lung habe ich aber ein bißchen Angst, dass die Wort- und Satzstruk­tur durch direk­te lateinis­che Vor­la­gen bee­in­flusst sein kön­nte. Deshalb werfe ich über­set­zte Texte raus und nehme andere rein.

Ich war also in der let­zten Zeit viel auf der Suche nach passenden Tex­ten – sie müssen aus bes­timmten Zeitspan­nen sein, als Drucke vor­liegen und von bes­timmten Druck­o­rten (oder wenig­stens aus deren Dialek­t­ge­bi­et) stam­men. Ach ja, Gereimtes darf auch nicht. Und min­destens 4000 Wörter lang. Und sie müssen Orig­i­nale oder Fak­sim­i­les als Vor­lage haben.

Per­fekt sind Texte, die elek­tro­n­isch vor­liegen, wie z.B. die Texte des Bon­ner Früh­neuhochdeutschko­r­pus. Auch bei Wik­isource find­et sich für ver­gan­gene Jahrhun­derte einiges, was sorgfältig von den Orig­i­nalen abgetippt und kor­rek­turge­le­sen wurde und sich damit auch bei Unsicher­heit­en immer ver­gle­ichen lässt. Weniger per­fekt, aber als Lück­en­füller geeignet ist auch Google­Books – die Tex­terken­nung, die man über die alten Drucke gejagt hat, taugt zwar für Frak­tur nichts, aber man kann sich viele alte Büch­er als Pdf run­ter­laden und dann per Auge durch­suchen. Anson­sten gibt es auch noch eine ganze Rei­he von Unibib­lio­theken, die ihre alten Drucke und Manuskripte als Bilder dig­i­tal­isieren, z.B. Hei­del­berg und Göt­tin­gen. (Hei­del­berg hat auch eine enorm aus­führliche Lin­kliste zum Thema.)

Auf mein­er Suche habe ich viele Texte ange­le­sen – auch welche, die gar nicht geeignet, aber dafür sehr kurios sind. Zum Beispiel diesen (Foto von His­to­ri­ograf):

Weit­er­lesen