Datenjournalismus - Lorenz Matzat - E-Book

Datenjournalismus E-Book

Lorenz Matzat

0,0

Beschreibung

Datenjournalismus ist eine Reaktion auf die anhaltende Digitalisierung. Er ist eng mit Software und Algorithmen verknüpft, nährt sich vom gleichen Treibstoff wie die Rechner und das Internet: Daten. Welche Methode wäre also besser dafür geeignet, eine digitale Welt zu begleiten und zu beschreiben? Der Datenjournalist Lorenz Matzat gibt einen Einblick in das recht junge Genre Datenjournalismus und richtet sich damit an Einsteiger in das Thema: Was gehört zum sogenannten data-driven-journalism und wie lässt er sich umSetzen? Im ersten Kapitel geht es um den Rohstoff des Ganzen: Daten und deren Formate – wie im Zusammenspiel mit Software interaktiver Journalismus gemacht kann. Der zweite Abschnitt dreht sich um das methodische Vorgehen: Dem Beschaffen und Säubern von Daten, der Analyse der Daten und der Berichterstattung mit ihnen. Der dritte und letzte Abschnitt handelt von dem Produkt, dem journalistischen Werk: Es ist dabei nicht nur die Rede vom prägnanten Journalismus, sondern auch von Servertechnologie, Nutzerfreundlichkeit, Testen und nicht zuletzt von Datenvisualisierungen. Dieses Buch verspricht weder, aus dem Leser in Nullkommanichts einen Könner im Datenjournalismus zu machen. Auch fordert es nicht, dass jeder Journalist Programmierer werden sollte. Vielmehr zeigt Lorenz Matzat, dass Datenjournalismus viel Arbeit, Geduld und Teamarbeit verlangt. Aber auch, dass diese Arbeit entsprechend belohnt wird: und zwar mit der Möglichkeit, aussagekräftig und vielfältig das digitale Medium Internet bespielen zu können.

Sie lesen das E-Book in den Legimi-Apps auf:

Android
iOS
von Legimi
zertifizierten E-Readern
Kindle™-E-Readern
(für ausgewählte Pakete)

Seitenzahl: 82

Veröffentlichungsjahr: 2016

Das E-Book (TTS) können Sie hören im Abo „Legimi Premium” in Legimi-Apps auf:

Android
iOS
Bewertungen
0,0
0
0
0
0
0
Mehr Informationen
Mehr Informationen
Legimi prüft nicht, ob Rezensionen von Nutzern stammen, die den betreffenden Titel tatsächlich gekauft oder gelesen/gehört haben. Wir entfernen aber gefälschte Rezensionen.



INHALT

A EINFÜHRUNG

A1 Über dieses Buch

A2 Was ist Datenjournalismus?

A3 Eine kurze Geschichte

B GRUNDLAGEN DES DATENJOURNALISMUS

B1 Was Daten sind

Big Data

B2 Struktur

AI

Linked Data

B3 Geodaten

B4 Formate

PDF

JSON

CSV

XLS

B5 Schönheit von Statistik

B6 Journalist, Programmierer und Designer

Software

C METHODIK

C1 Hilfe zur Selbsthilfe

Fallbeispiel Datensichtung

C2 Datenarbeit

Quellenkritik

Datenbeschaffung

Rechtliches

Plausibilität

Säuberung

Veredelung

C3 Tipps für die Arbeit mit Daten

Mathe & Statistik

Excel & Co.

C4 Data Mining

Analyse

Ist es berichtenswert?

D VERÖFFENTLICHUNG

D1 Rhetorik im Design

Präsentation

D2 Visualisierung

Kontext

Eine gute Visualisierung

Formate

D3 Umsetzung

Planung

Tools – Eine Auswahl

Veröffentlichen

D4 Ausblick

X ANHANG

X1 Glossar

X2 Register

X3 Abbildungsverzeichnis

A

EINFÜHRUNG

A1Über dieses Buch

A2Was ist Datenjournalismus?

A3Eine kurze Geschichte

A1 ÜBER DIESES BUCH

Daten zum Klingen zu bringen ist das Aufgabengebiet des Datenjournalismus. Mit ihm können auf einzigartige Weise Erkenntnisse verdeutlicht und Sachverhalte geklärt werden. Das Genre begann, sich Ende des ersten Jahrzehnts des 21. Jahrhunderts zu bilden, als die Digitalisierung der Gesellschaft voll in Schwung kam und die Menge an erzeugten und verfügbaren Daten stetig weiter zunahm. Datenjournalismus ist das Instrument, um der Digitalisierung der Gesellschaft, Wirtschaft und Wissenschaft journalistisch gerecht zu werden. Dieses Buch gibt einen Einblick in das recht junge Genre Datenjournalismus und richtet sich an Einsteiger in das Thema. Im ersten Kapitel geht es um den Rohstoff des Ganzen: Daten und deren Formate – wie zusammen mit Software Journalismus gemacht kann. Der zweite Abschnitt dreht sich um das methodische Vorgehen: dem Beschaffen und Säubern von Daten, der Analyse der Daten und der Berichterstattung mit ihnen.

Der dritte und letzte Abschnitt handelt von dem Produkt, dem journalistischen Werk: Also was ist bei dessen Veröffentlichung zu beachten? Es ist dabei die Rede von Servertechnologien, Nutzerfreundlichkeit, Testen und nicht zuletzt von Datenvisualisierungen. Am Ende des Buches findet sich ein Glossar zu den wichtigsten Begriffen und Verfahren.

Unter der Internetadresse www.datenjournalist.de/buch finden sich alle im Buch aufgeführten Links zu Leitfäden, Werkzeugen, Beispielen und Datenquellen mit der entsprechenden Seitenzahl. Im Text wird durch LINK auf einen Eintrag dort hingewiesen.

A2 WAS IST DATENJOURNALISMUS?

Der Einsatz eines Balkendiagramms auf der Website eines journalistischen Mediums oder einer Karte mit einigen markierten Datenpunkten, das ist kein Datenjournalismus. Wäre dem so, wäre der Begriff überflüssig. Denn Statistiken und Diagramme gehören seit Langem, wenn nicht von Anbeginn an zum Journalismus.

Aber es ist oft einfacher zu sagen, was etwas nicht ist, als umgekehrt. Mit der Debatte darüber soll hier niemand gelangweilt werden. Zusammengefasst: Seit dieser Begriff sich in den Jahren 2009/2010 etablierte, vertreten einige Journalisten die Meinung, Datenjournalismus sei im Wesentlichen eine Recherchemethode, die mittels Computern Datenmengen durchforstet. Die Veröffentlichungsform, also etwa eine Visualisierung der Daten des Rechercheergebnisses, spiele keine zentrale Rolle. Das Gegenargument ist, dass es bereits seit den 50er-Jahren des vergangenen Jahrhunderts Computer Assisted Reporting (CAR) gibt, also ein Begriff für die computergestützte Recherche bereits existiert.

In diesem Buch wird Datenjournalismus als Format verstanden, in dem einem Datensatz (oder mehreren) eine wesentliche Rolle zukommt. Sein Produkt wird in der Regel digital veröffentlicht. Der englische Begriff data-driven journalism (DDJ), datengetriebener Journalismus, beschreibt die Methode bzw. das Genre wohl treffender. Es ist ein Ansatz, der Softwarewerkzeuge und manchmal eigens programmierte Codes verwendet, um mit kleinen und größeren Datenmengen zu arbeiten. Der die gegenüber den anderen Mediengattungen einzigartigen Möglichkeiten des digitalen Mediums nutzt: Nämlich im Browser des Rechners interaktive Anwendungen zu fahren („news apps“), die, gestützt durch Datenbanken, dynamisch Inhalte jenseits von Schrift und Bild darstellen können: interaktive Visualisierungen, die nicht-linear sind, also dem Nutzer erlauben, eigene Parameter zu definieren und eigene Schwerpunkte zu setzen.

Dabei ist die Visualisierung der Daten kein Selbstzweck, sondern sie wird in der Regel eingerahmt durch einen analytischen ausformulierten Bericht. Selbstredend kann Datenjournalismus auch rein textbasiert oder mit einer statischen Visualisierung in Print stattfinden. Dabei sollten Datenvisualisierungen nicht mit Infografiken gleichgesetzt werden, die eben Grafiken enthalten: So besteht z. B. eine Aufbauanleitung für ein Ikea-Möbelstück aus mehreren Infografiken, während ein Balkendiagramm über die Absatzmengen von besagtem Möbelstück eine schlichte Datenvisualisierung wäre.

Auch in TV/Video oder gar Radio kann DDJ stattfinden (im Audiobereich ist manchmal die Rede von „Sonifikation“). Allerdings geht durch den linearen Charakter dieser drei Gattungen das Potenzial interaktiver Formate, die dynamisch auf Datenbanken zurückgreifen können, verloren.

Datenjournalismus wird auf den folgenden Seiten als Zweischritt gedacht: Zum einen die Datenarbeit, die sowohl daraus besteht, Datensätze zu finden oder zu erstellen. Die aber auch die „Säuberung“ der Daten beinhaltet, welche möglicherweise noch angereichert, „veredelt“ werden müssen, um überhaupt sinnvoll weiterverarbeitet werden zu können. Abschluss der Datenarbeit ist dann die Erkundung: Diese analytische Arbeit, die Auswertung der Datensätze, um Aussagekräftiges zu finden, wird auch “data mining“ genannt.

Der zweite Schritt des Datenjournalismus ist dann der eigentliche Bericht, bei dem die verwendeten Daten mittels interaktiver Visualisierungen dazu beitragen, einen Sachverhalt zu schildern.

Simon Rogers, der 2009 das Datablog der britischen Tageszeitung Guardian startete und insgesamt das Genre prägte, fasst es so:

ZITAT

USING DATA TO TELL STORIES IN THE BEST POSSIBLE WAY, COMBINING THE BEST TECHNIQUES OF JOURNALISM: INCLUDING VISUALIZATIONS, CONCISE EXPLANATION AND THE LATEST TECHNOLOGY. IT SHOULD BE OPEN, ACCESSIBLE AND ENLIGHTENING.

SIMON ROGERS (DATENJOURNALIST, THE GUARDIAN)

A3 EINE KURZE GESCHICHTE

Als ein bedeutender Text für die Idee des Datenjournalismus gilt „A fundamental way newspaper sites need to change“ des US-amerikanischen Journalisten und Programmierers Adrian Holovaty.

» www.holovaty.com/writing/fundamental-change

2006 schrieb er darüber, dass (Lokal-)Zeitungen die täglich anfallenden Nachrichten in die Bestandteile der üblichen W-Fragen zerlegen. Und diese eben in einer Datenbank ablegen. Daraus, so Holovaty, ließen sich dann nach einiger Zeit Muster erkennen und Dienste entwickeln. Er selbst gründete später das nicht wirklich von Erfolg gekrönte Portal Everyblock, das auf Basis von frei zugänglichen Daten (Open Data) ein Nachbarschaftsportal bot.

2007 folgte der Text zweier Journalisten des Guardian: „Give us our crown jewels“ – es ging um die Daten der öffentlichen Hand (Public Sector Information – PSI). Sie argumentierten, dass die durch Steuergelder finanzierten Datensätze der Verwaltungen in die Hände der Allgemeinheit gehören. Und zwar in offenen Formaten und freien Lizenzen, welche das uneingeschränkte (auch kommerzielle) Wiederverwenden erlauben. Um diese Zeit wurden die Schlagworte von Open Data und Open Government populär. 2009 machte Barack Obama Letzteres zu einem Bestandteil seiner Kampagne: die transparente Regierung. Der Guardian-Text zeigt, dass Datenjournalismus und Open Data zumindest miteinander verwandt sind. So war es eben auch der Guardian, der ein Datablog herausbrachte.

Wenig später, im Jahr 2010, veröffentlichte Wikileaks die Afghanistan-Tagebücher: ein großer Datensatz, der aus zehntausenden Militärberichten der US-Armee bestand. Wikileaks wurde damit berühmt und berüchtigt. Und Medien wie der Guardian und die New York Times nutzten eindrucksvoll die Möglichkeiten der Datenanalyse und -visualisierungen, um die Inhalte der Militärdepeschen zu ergründen: Den Nutzern wurden nicht nur Erkenntnisse und Rechercheergebnisse präsentiert, sondern ihnen wurden interaktive Visualisierungen an die Hand gegeben. Mit denen konnte jeder sich selbst in den Datensatz graben und ihn erkunden.

Jetzt im Frühjahr 2016 gibt es weltweit diverse Datenjournalismus-Teams. Auch im deutschsprachigen Raum haben einige Medienhäuser DDJ-Abteilungen etabliert, etwa Spiegel Online, Zeit Online, der Bayerische Rundfunk und das Schweizer Radio und Fernsehen (SRF). In zahlreichen Ländern haben sich regelmäßige, eher informelle Treffen etabliert (z. B. Hacks/Hackers und in Deutschland regionale DDJ-Treffen), die durch ihre grundsätzliche Offenheit nicht zuletzt Anlaufpunkte für Einsteiger sind.

» www.datenjournalismus.net/wissen/category/termine

Es gibt weltweit Konferenzen zum Thema, einen internationalen Datajournalism-Award und andere Preise, die die Gattung zumindest berücksichtigen. Die Gewinner und die Nominierungen des jährlich vergebenen Datajournalismus Awards vom Global Editors Network verschaffen einen guten Überblick über die Szene. Auch die Sammlungen der Arbeiten der NYT und des Guardians sind inspirierend. Für den deutschsprachigen Raum gibt es einen Datenjournalismuskatalog.

» katalog.datenjournalismus.net

Das Genre kann also als etabliert gelten. Und die Digitalisierung der Welt schreitet voran: Datengetriebener Journalismus dürfte damit stetig an Bedeutung gewinnen. Damit steigen auch die Berufsaussichten für Journalisten, die Praxiserfahrung und Qualifikationen im Datenjournalismus vorweisen können. Dieses Buch will dabei helfen, den Einstieg in das Genre zu schaffen.

B

GRUNDLAGEN DES DATENJOURNALISMUS

B1Was Daten sind

B2Struktur

B3Geodaten

B4Formate

B5Schönheit von Statistik

B6Journalist, Programmierer und Designer

B1 WAS DATEN SIND

Es gibt so gut wie keine Informationen, die sich nicht zu Daten machen lassen. Selbst Musik, in Notenform gegossen, lässt sich als Datensatz verstehen: Noten beschreiben Tonhöhe und -länge – damit ließe sich z. B. untersuchen, ob verschiedene Komponisten einen unverwechselbaren Fingerabdruck hinterlassen, etwa durch ein immer ähnliches Verhältnis von tiefen und höhen Tönen sowie einer Durchschnittslänge usw.

Hingegen ist ein gedrucktes Buch mit seinen Seiten kein Datensatz. Aber es lässt sich durch Daten beschreiben. Das ist die Aufgabe von Bibliothekskatalogen, die früher in Karteikästen – den Vorläufern von Datenbanken – und heute digital die sogenannten Metadaten vorhalten: Autor, Titel, Erscheinungsjahr, Seitenanzahl usw.

Es ließe sich ein Schritt weitergehen: Man könnte für jede Seite deren jeweilige Zeichenanzahl erfassen. Daraus ließe sich dann etwa die Durchschnittszahl der Zeichen pro Seite ausrechnen. Es könnte auch gezählt werden, welche Buchstaben und Wörter wie oft verwendet wurden. Wie interessant diese Daten sind und welche Erkenntnis sich in ihnen verbirgt, ist eine andere Frage. Die wesentliche Frage nämlich – dazu im Kapitel B „Ist es erzählenswert?“ mehr.