Die erste Phase der Wahl zum Anglizismus des Jahres 2011 war ein voller Erfolg: über sechzig Wörter sind nominiert worden, mehr als anderthalb Mal so viele wie im Vorjahr.
Natürlich waren, genau wie im Vorjahr, viele Wörter dabei, die die Kriterien nicht erfüllen, z.B. weil sie nicht mehr neu genug sind oder weil sie sich im allgemeinen Sprachgebrauch (noch) nicht durchgesetzt haben. In den letzten Tagen hat die Jury sich deshalb intensiv mit den Nominierungen befasst und zunächst die klaren Fälle aussortiert.
Übrig geblieben sind rund 20 Wörter, die ich morgen hier im Sprachlog und auf der Webseite des Wettbewerbs bekannt geben werde. Damit beginnt dann die zweite Phase der Wahl: Bis Ende Januar werden die Jurymitglieder diese Wörter ausführlich in ihren Blogs behandeln, um Zweifelsfälle zu klären, Favoriten herauszuarbeiten und dabei über Entlehnung im Besonderen und Sprachentwicklung im Allgemeinen zu diskutieren.
Ende Januar steht dann (hoffentlich) die Shortlist, die sowohl öffentlich zur Abstimmung gestellt wird (um den Anglizismus der Herzen 2011 zu ermitteln) als auch intern beraten wird (um den Anglizismus des Jahres 2011 zu ermitteln). Die Bekanntgabe erfolgt dann in der ersten Februarhälfte.
Im letzen Jahr waren sich die Jury und die Öffentlichkeit ja einig: beide wählten das Wort leaken auf den ersten Platz. Bevor morgen die neue Runde eröffnet wird, sollten wir noch einmal kurz zurückblicken und uns fragen, ob wir mit dieser Wahl richtig lagen — ob wir tatsächlich ein Wort gewählt haben, das mittelfristig einen Beitrag zur deutschen Sprache leisten wird, oder ob es sich um ein Modewort gehandelt hat, das wegen den Vorgängen rund um die Enthüllungsplattform „WikiLeaks“ kurzfristig in den allgemeinen Sprachgebrauch gespült wurde und dann wieder verschwunden ist.
Jurymitglied Kristin Kopf hat sich diese Frage schon im Dezember im „Schplock“ gestellt, konnte aber keine klare Antwort finden. Trotz ihrer detaillierten Analyse der ist ihr Fazit: „Ich fürchte, wir müssen in einem Jahr wieder nachschauen, wie es dem Leaken so geht“.
Das Problem ist, dass es keine zuverlässigen Korpora gibt, die den Sprachgebrauch des Jahres 2011 bereits erfassen. So musste sie sich auf die Google-News-Suche verlassen, die sowohl aktuell genug ist als auch eine Einschränkung auf einzelne Jahre erlaubt. Und die eindeutig einen massiven Anstieg der Häufigkeit von leaken zeigt: Das Wort war 2011 mehr als doppelt so häufig wie im Vorjahr.
Wo liegt also das Problem? Es scheint doch, als ob leaken sich in der deutschen Sprache wohlfühlt. Das Problem ist, dass keine Informationen darüber vorliegen, wieviele Wörter die Suche für das jeweilige Jahr insgesamt erfasst: Es ist durchaus möglich, dass das Archiv für 2011 einfach doppelt so groß ist, wie das für 2010, und der Anstieg der Häufigkeit von leaken nur diese Tatsache widerspiegelt.
Um das zu überprüfen gibt es aber einen recht einfachen Trick: Man nehme Wörter, bei denen zu vermuten ist, dass sie immer etwa gleich häufig sind, und stelle deren Häufigkeit für die verschiedenen Jahre fest. So lässt sich abschätzen, ob und wie stark die Textmenge im Archiv von Jahr zu Jahr ansteigt. Anhand dieser Schätzung kann man dann feststellen, ob ein neues Wort wie leaken weniger stark, genauso stark oder stärker ansteigt.
Ich habe dazu die Verben gehen und sehen ausgewählt und zunächst deren Häufigkeit ab 2008 festgestellt (für alle verbalen und adjektivischen Beugungsformen). Dann habe ich die Häufigkeit im Jahr 2008 als 100 Prozent gesetzt, und den Anstieg pro Jahr in Bezug auf diesen Ausgangspunkt berechnet. Beide Wörter verhalten sich relativ ähnlich, was dafür spricht, dass ich hier tatsächlich die Größe des Google-News-Archivs messe. Wenn ich nun dasselbe mit dem Verb leaken mache, ergibt sich ein deutlich stärkerer Anstieg:
Das Wort leaken hat sich also tatsächlich im Laufe des Jahres 2011 weiter durchgesetzt. Ein paar aktuelle Beispiele aus Nachrichten und Blogkommentaren der letzten Woche zeigen, dass es dabei um alle möglichen Zusammenhänge geht, in denen geheime Informationen anonym, gezielt und im öffentlichen Interesse bekannt gemacht werden:
- Jenseits von Verschwörungsphantasien hat es höchstwahrscheinlich einen Grund, dass bislang niemand die Mailboxnachricht geleakt hat. [Link]
- Viele Informationen waren schon in der Vergangenheit auf diversen Internet-Seiten „geleakt“ worden und sind hier nun gebündelt zu lesen. [Link]
- Nur Stunden, nachdem das Pressebild geleakt ist, hat Samsung das Galaxy Ace Plus bestätigt. [Link]
- Das ist das beunruhigende Ergebnis eines Zwischenberichts der EU-Kommission, der nun von der Bürgerrechtsorganisation Quintessenz geleakt wurde. [Link]
In den Duden hat es das Wort bislang leider noch nicht geschafft, und im Wiktionary gab es zwar wohl einen Eintrag, der aber einem Schnellöschantrag zum Opfer gefallen ist.
[Dieser Beitrag erschien ursprünglich im alten Sprachlog auf den SciLogs. Die hier erschienene Version enthält möglicherweise Korrekturen und Aktualisierungen. Auch die Kommentare wurden möglicherweise nicht vollständig übernommen.]
Googleology
die Abschätzung anhand von Google-Daten setzt aber mindestens das Vertrauen darin voraus, dass die Daten für die betrachteten Perioden gleich aufbereitet werden/wurden (dass man also die gleichen Formen findet, wenn man nach “gehen” sucht) und dass die zurückgegebenen Zählwerte stimmen. Leider kann man beides nicht überprüfen. Und wenigstens für den zweiten Punkt kann und sollte man sehr skeptisch sein. Die Zahlen sind wahrscheinlich eher Schätzwerte als absolute Häufigkeiten.
Die grobe Tendenz wird vielleicht trotzdem stimmen und deckt sich auch mit meiner subjektiven Einschätzung, aber eine verlässliche Analyse ist das nicht.
Kristins vorsichtigeres Fazit finde ich daher überzeugender.
Anglizismen anderer Sprachen
Wie häufig wird “leaken” in anderen Sprachen genutzt?
Ich habe das französische Partizip “leaké” 130000-mal gefunden, das spanische “leakeado” aber nur 10000-mal, das italienische “leakato” immerhin 20000-mal. (Je gemeinsam mit der femininen Form).
Wortformen
@Axel Herold: Ich habe mich nicht auf Googles Sprachtechnologie verlassen, sondern alle Wortformen einzeln und in Anführungszeichen eingegeben. An dieser Stelle gibt es deshalb keine Probleme. Schwieriger ist die Frage, inwiefern mehrfache Treffer für dieselben Texte (Pressemeldungen etc.) das Bild verzerren, und natürlich sind die Häufigkeiten selbst Ergebnis eines proprietären und geheimen Algorithmus von Google, über dessen Funktionsweise wenig bekannt ist.
Google-Recherche
@A.S.
[Suchanfragen in Anführungszeichen]
Ah, verstehe.
Ein weiterer Punkt aus dem Problemkreis »was zählen die da eigentlich?« ist meiner Meinung nach, dass nicht klar, ist, wofür die Vorkommensschätzungen genau stehen — Anzahl der Dokumente, Teile von Dokumenten oder Sätze auf die die Query passt oder ganz andere Einheiten?
Der methodische Schwachpunkt ist doch ein anderer als der Anteil am Korpus: Wie wird “leaken” für einen Sachverhalt benutzt, den man vorher anders umschrieben hat? Statt den Korpus mit “laufen” oder “sehen” zu normieren, sollte man vielmehr “enthüllten” und “aufdecken” nehmen.
.
Ich vermute, daß das Wortfeld “leaken” in den letzten beiden Jahren deutlich öfter in dem Nachrichtenkorpus auftauchte als zuvor und so stark verzerrt.
Dem schließt sich die Frage an, wie sich “leaken” im Verhältnis zu den verwandten herkömmlichen Ausdrücken verhält, d.h., ob es dauerhaft ein eigenständiges Bedeutungsspektrum erhält — neben den genannten wäre das z.B. verraten, informieren, ausplaudern, publik machen etc.
Schwarzkopieren
Leute, wenn ihr wissen wollt, was ein Wort gerade bedeutet, müsst ihr dem Volk aufs Maul schauen, bzw. den Hackern auf die Tastatur:
“leaken” hat inzwischen die politische Ebene verlassen und hat vorwiegend die Bedeutung “schwarz kopieren”. Das gilt genauso für die oben von mir erwähnten französischen, spanischen und italienischen Nutzungen.
Wiktionary-Eintrag
Nur ein kurzer Hinweis zu Wiktionary-Eintrag: Der Eintrag war fast inhaltsleer und ohne jegliche Belege.
Mit den hier gegebenen Belegen würde er mit Sicherheit bestehen bleiben. Vielleicht, wenn ich mal wieder Zeit übrig habe. 🙂
Wiktionary
Dafür gibts seit der Wahl immerhin im englischen Wiktionary einen Eintrag — immer noch 😉
http://en.wiktionary.org/wiki/leaken