Kandidaten für den Anglizismus 2014: Big Data

Von Anatol Stefanowitsch

Wie jedes Jahr im Jan­u­ar beteili­gen wir uns an der Wahl zum Anglizis­mus des Jahres, indem wir die Kan­di­dat­en der Endrunde auf ihre Tauglichkeit zum Sieger abklopfen. Bere­its abge­han­delt haben wir Social Freez­ing und Phablet, heute ist Big Data an der Reihe.

Das Wort Big Data beze­ich­net sowohl Daten­men­gen, die so groß sind, dass sie mit herkömm­lichen Meth­o­d­en nicht mehr hand­hab­bar sind, als auch die Spe­ich­er- und Rechen­meth­o­d­en, die zur Lösung dieses Prob­lems entwick­elt wur­den und wer­den (diese Bedeu­tun­gen find­en sich im Oxford Eng­lish Dic­tio­nary für das Englis­che, und unser Jury-Mit­glied Michael Mann hat sie im let­zten Jahr in sein­er Analyse auch für den deutschen Sprachge­brauch gefun­den – im Duden ste­ht das Wort noch nicht).

Big Data ist zum zweit­en Mal in der Endrunde für den Anglizis­mus des Jahres, ver­passte im let­zten Jahr aber deut­lich einen vorderen Platz (dafür lan­dete es bei der Wort-des-Jahres-Wahl auf Platz 5). Sehen wir uns an, inwieweit es den Kri­te­rien unseres Wet­tbe­werbs genügt und ob es vielle­icht in diesem Jahr ein aus­sicht­sre­ichen Kan­di­dat für das lexikalis­che Siegertrep­pchen ist.

Englische Vorgeschichte

Das Oxford Eng­lish Dic­tio­nary hat seit 2013 einen Ein­trag für Big Data und nen­nt als erste Ver­wen­dung eine Pas­sage aus einem Auf­satz des His­torik­ers Charles Tilly von 1980, in der dieser über Ver­suche spricht, geschichtliche Forschung zu betreiben, in dem „riesige Daten­men­gen“ (vast quan­ti­ties of data) mit­tels kom­plex­er math­e­ma­tis­ch­er Proze­duren (sophis­ti­cat­ed math­e­mat­i­cal pro­ce­dures) per Com­put­er (elec­tron­ic com­put­er) analysiert werden:

Against these pro­ce­dures, Stone lodges the objec­tions that … none of the big ques­tions has actu­al­ly yield­ed to the blud­geon­ing of the big-data people.

Als die Auf­nahme des Wortes 2013 bekan­nt­gegeben wurde, wur­den sofort Zweifel laut, dass dies wirk­lich die erste Ver­wen­dung des Wortes im heuti­gen Sinne sei und auch das Wik­tionary schließt Ver­wen­dun­gen vor dem Jahr 2000 kat­e­gorisch als Quelle aus und schließt sich der Mei­n­ung des Jour­nal­is­ten Steve Lohr an, der den Ursprung der heuti­gen Bedeu­tung Mitte in Mit­tagstisch-Gesprächen der Fir­ma Sil­i­con Graph­ics in den 1990er Jahren verortet.

Aus mein­er Sicht ist diese Diskus­sion müßig, da Tilly ganz klar von Daten­men­gen spricht, die (für die dama­lige Zeit) zu groß für die üblichen Ver­fahren sind und nur mit speziellen Meth­o­d­en bear­beit­et wer­den kön­nen. Das entspricht der mod­er­nen Bedeu­tung und wenn es keine direk­te Tra­di­tion von sein­er For­mulierung zum heuti­gen Wort gibt, bedeutet das eben, dass das Wort eben mehrfach geschöpft wurde. So ungewöhn­lich oder orig­inell ist die Wortschöp­fung im Englis­chen ja auch gar nicht – siehe Wörter wie big pay (1868), big busi­ness (1905), big gov­ern­ment (1925), big cir­cu­la­tion (1929), big sci­ence (1948) und big bud­get (1961).

Auf jeden Fall ist klar, dass big data spätestens seit den frühen 2000er Jahren im Englis­chen etabliert war. Dabei war übri­gens – ich komme später darauf zurück – die Meta­pher von Dat­en als Gold­mine von Anfang an häu­fig zu find­en, z.B. in dem zweit­en vom OED genan­nten Beleg von 2003: ((Im OED wird dieses Zitat übri­gens falsch wiedergegeben – statt „not a pile of dusty tapes“ heißt es dort „not just a col­lec­tion of dusty tapes“; aber da man mir bish­er für meine dort gemelde­ten Kor­rek­turen nie auch nur eine automa­tisierte Dankesmail zurück­geschrieben hat, muss man das dort ohne meine Hil­fe merken.))

Much of what is need­ed is already in place – the col­lab­o­ra­tion of astronomers and sta­tis­ti­cians, the com­mit­ment to stan­dards, … and the recog­ni­tion that big data is a gold mine and not a pile of dusty tapes. [Roy Williams, Grids and the Vir­tu­al Obser­va­to­ry]

Entlehnung und weitere Entwicklung

Aus dem Englis­chen wurde big data dann etwa zehn Jahre später ins Deutsche entlehnt. Der erste echte Tre­f­fer im Deutschen Ref­eren­zko­r­pus (DeReKo) stammt aus der Online-Aus­gabe der Zeit vom 10. März 2011:

Nach Stuttgart ist der 34-Jährige gekom­men, um einen »Bericht zur Lage der Zukun­ft« vorzu­tra­gen. Hin­richs schlen­dert auf die Bühne, das Hemd hängt an ein­er Seite aus der Anzughose. Er spricht von der »Cloud«, der Wolke aus Rech­n­erka­paz­itäten, die das Inter­net bildet. Von »Big Data« und »Soft­ware as a Ser­vice« — riesi­gen Daten­men­gen und Pro­gram­men, die im Netz »on demand« bere­it­gestellt werden.

Das bedeutet natür­lich nicht, dass das Wort im Deutschen vorher nie ver­wen­det wurde, aber die Tre­f­fer im Deutschen Ref­eren­zko­r­pus zeigen, wann das Wort ver­bre­it­et und etabliert genug war, um in einem Medi­um mit einem all­ge­meinen Adres­satenkreis ver­wen­det zu wer­den. Inter­es­san­ter­weise han­delt es sich bei dem Tre­f­fer um einen Bericht über einen Vor­trag eines Fach­manns; dass es in Anführungsze­ichen ste­ht, deutet auf die Neuheit und Fremd­heit des Wortes zu diesem Zeit­punkt hin.

Wie Michael Mann in seinem Beitrag im let­zten Jahr schon fest­gestellt hat, stammte großer Teil der frühen Tre­f­fer aus tech­nis­chen Quellen (haupt­säch­lich dem Fach­blatt „VDI nachricht­en“ des Vere­ins deutsch­er Inge­nieure): 2011 stammten 80 Prozent aller Tre­f­fer aus dieser Quelle oder der Wikipedia, für 2012 stam­men noch fast 60 Prozent aus den VDI nachricht­en. Im Jahr 2013 stellen Belege aus Tages- und Wochen­zeitun­gen dann aber eine Mehrheit von knapp unter siebzig Prozent, die sich 2014 nicht mehr sehr stark auf knapp über siebzig Prozent steigert. Das zeigt, dass das Wort sich von einem eher fach­sprach­lichen zu einem all­ge­mein­sprach­lichen Wort entwick­elt – eine Beobach­tung, die auch dadurch gestützt wird, dass der Anteil von Ver­wen­dun­gen des Wortes in Anführungsze­ichen stetig sinkt. 2011 und 2013 schrieb man in der all­ge­meinen Presse noch in der Hälfte aller Fälle „Big Data“ statt ein­fach Big Data, 2013 nur noch in einem Drit­tel aller Fälle, und 2014 standen dann nur noch knapp 20 Prozent der Ver­wen­dun­gen in Anführungszeichen.

Was die all­ge­meine Häu­figkeit­sen­twick­lung bet­rifft, so stellt 2014 den bis­lang höch­sten Stand der Ver­wen­dung­shäu­figkeit­en im DeReKo und dem Such­in­ter­esse bei Google Trends dar, wie die fol­gende Grafik zeigt (für bei­de Daten­rei­hen habe ich die größte jährliche Häu­figkeit als 100 Prozent geset­zt und die übri­gen Jahre rel­a­tiv zu dieser Summe berech­net, die DeReKo-Dat­en habe ich vorher noch auf Tre­f­fer pro ein­er Mil­lion Wörter normalisiert).

Häufigkeitsentwicklung des Wortes Big Data im Deutschen Referenzkorpus und bei Google Trends

Häu­figkeit­sen­twick­lung des Wortes Big Data im Deutschen Ref­eren­zko­r­pus und bei Google Trends

Das Wort ist also ganz klar dabei, zu einem selb­stver­ständlichen Teil des deutschen Wortschatzes zu wer­den. Sog­ar die Bun­deskan­z­lerin, aus infor­ma­tion­stech­nis­ch­er Per­spek­tive vor allem dafür berüchtigt, das Inter­net mehr als ein Viertel­jahrhun­dert nach sein­er Erfind­ung und zu einem Zeit­punkt, da über drei Vier­tel der deutschen Bevölkerung online sind, als „Neu­land“ zu beze­ich­nen, erkan­nte 2014 die beson­dere Rel­e­vanz des Begriffs. In ihrer Rede anlässlich des 8. Nationalen IT-Gipfels am 21. Okto­ber 2014, in dem sie auch „Fre­quen­zen, Förderung und Fes­t­netz“ zu den „drei F“ der deutschen IT-Poli­tik erk­lärte sie:

…dass wir unseren deutschen Daten­schutz nicht zur Dis­po­si­tion stellen wollen. […] Auf der anderen Seite müssen wir dafür sor­gen, dass das Man­age­ment von Big Data möglich ist. Wenn ich höre, dass man schon von „Big Data Min­ing“ spricht, dann erin­nert mich das natür­lich an den deutschen Steinkohle­berg­bau. Aber es kön­nte sein, dass das ganze Unternehmen doch gewin­nträchtiger ist.

Damit greift sie (bzw. ihr/e Redenschreiber/in) die Berg­baumeta­pher auf, die mit dem Wort Big Data auch im Englis­chen so eng verknüpft ist. Dass sie dabei als Ver­gle­ichs­maßstab anstatt der Gold­mine des englis­chen Sprachge­brauchs die Steinkohle wählt, kön­nte man als boden­ständig-deutschen Real­is­mus werten, wenn es nicht ander­norts im sel­ben Jahr schon Pläne gegeben hätte, die Deutschen zu Welt­meis­tern beim Schür­fen von Big Data zu machen (Big reicht dabei dann auch nicht mehr, es sollen Smart Data wer­den).

Fazit

Big Data ist ein solid­er Kan­di­dat. Das Wort beste­ht aus englis­chem Sprach­ma­te­r­i­al und wurde aus dem Englis­chen ins Deutsche entlehnt. Dort füllt es eine Lücke, die sich durch eine neue tech­nis­che Entwick­lung im deutschen Wortschatz aufge­tan hat, und für die nicht ein­mal die notorisch wortschöpferische Wikipedia bish­er eine deutsche Alter­na­tive vorschlägt. Das Wort hat einen Häu­figkeit­sanstieg hin­ter sich, in dessen Ver­lauf es sich von fach­sprach­lichen in all­ge­mein­sprach­liche Zusam­men­hänge vorgear­beit­et hat. Vor­w­er­fen kön­nte man dem Wort höch­stens, dass der Häu­figkeit­sanstieg zwis­chen 2012 und 2013 drastisch war, zwis­chen 2013 und 2014 dann aber nur noch min­i­mal – es hätte seine Chance also eher im let­zten Jahr gehabt. Dass es im let­zten Jahr nicht ein­mal in die Top 5 kam, dürfte daran liegen, dass es wed­er die Jury noch die All­ge­mein­heit bei der Pub­likumsab­stim­mung beson­ders inspiri­ert hat. Ja, es füllte auch 2013 schon eine Lücke, aber eine Lücke, für die sich auf gesellschaftlich­er Ebene (noch?) keine rechte Lei­den­schaft entzün­det hat­te. Ob das in diesem Jahr anders ist, vielle­icht durch die seman­tis­che Verknüp­fung mit der all­seits beliebten Tra­di­tion des Steinkohle­berg­baus, wird sich zeigen.

5 Gedanken zu „Kandidaten für den Anglizismus 2014: Big Data

  1. Till

    Vie­len Dank für die aus­führliche Betra­ch­tung! Als kleine Rand­no­tiz: Der VDI ist der Vere­in deutsch­er Inge­nieure (und Her­aus­ge­ber der “vdi nachricht­en”). Die Indus­trie ist im Bun­desver­band der Deutschen Indus­trie (BDI) organisiert.

    Antworten
  2. Pingback: Kandidaten für den Anglizismus 2014: Big Data | ANGLIZISMUS DES JAHRES

  3. Christoph

    Ist Big Data wirk­lich ein rein tech­nis­ch­er Begriff? Mir fehlt hier irgend­wie die für mich ganz klar neg­a­tive Kon­no­ta­tion. Big Data heißt für mich, dass man — in dem Fall Akteure wie soziale Net­zw­erke, Inter­nethändler, Geheim­di­en­ste — nicht mehr entschei­den muss, was man spe­ichert, man spe­ichert ein­fach alles und wirft dann aus­gek­lügelte Algo­rith­men darauf, die aus diesem Daten­brei Kommunikations‑, Bewegungs‑, Ver­hal­tens- und let­ztlich Per­sön­lichkeit­spro­file extrahieren können.

    Danke für das Merkel-Zitat übri­gens. Data Min­ing mit Steinkohle in Verbindung zu brin­gen ist der­maßen bizarr, das schlägt das Neu­land nochmal um Längen 🙂

    Antworten
  4. Daniel

    Eine kleine Rand­no­tiz, da ich ger­ade in einen Vor­trag von Sandy Pent­land mit dem Titel “Social Physics” rein­ge­laufen bin: Die Leute vom MIT beze­ich­nen den Meth­o­d­en­teil von Big Data mit Social Physics (ich habe nichts Physikalis­ches daran erken­nen kön­nen). Ich habe aber den Ein­druck, dass das ein dort erfun­den­er Aus­druck ist, der außer­halb des MIT nicht groß gebraucht wird.

    Antworten

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.