Data-Mining in Social Media - Lena Dirsch - E-Book

Data-Mining in Social Media E-Book

Lena Dirsch

0,0
39,99 €

-100%
Sammeln Sie Punkte in unserem Gutscheinprogramm und kaufen Sie E-Books und Hörbücher mit bis zu 100% Rabatt.
Mehr erfahren.
Beschreibung

Durch soziale Medien wird eine gewaltige Menge an Daten erzeugt, die Unternehmen nie dagewesene Möglichkeiten geben, ihr Wissen über Märkte und Kunden zu verbessern. Um sinnvolle Informationen aus den sozialen Medien gewinnen zu können, müssen jedoch sogenannte Data-Mining-Techniken angewandt werden. Nur sie können die Herausforderungen bewältigen, die mit den Unmengen an Daten aus sozialen Medien einhergehen. Eben hier setzt die vorliegende Analyse an: Sie untersucht, welche der zahlreichen bereits existierenden Data-Mining Methoden zur Analyse von Daten aus sozialen Medien verwendet werden können. In einem zweiten Schritt zeigt sie anschließend erstmals auf, welche Geschäftsmöglichkeiten sich daraus ergeben können. Das Ziel ist dementsprechend, einen Überblick über die Data-Mining-Methoden zu geben, die entweder grundlegend für Data-Mining in sozialen Medien sind und/oder die Analyse spezieller Aspekte des Social Media-Minings ermöglichen. Anschließend werden die Geschäftsmöglichkeiten betrachtet, die sich aus der Anwendung dieser Data-Mining Methoden auf Daten aus sozialen Medien ergeben. Es geht darum, wie Unternehmen Social Media-Mining, nicht aber soziale Medien allgemein zu ihrem Vorteil nutzen können. Aus dem Inhalt: - Data-Mining; - Soziale Medien; - Social Media Mining; - Geschäftsmöglichkeiten; - Social Network Analysis

Das E-Book können Sie in Legimi-Apps oder einer beliebigen App lesen, die das folgende Format unterstützen:

EPUB
MOBI

Seitenzahl: 251

Veröffentlichungsjahr: 2017

Bewertungen
0,0
0
0
0
0
0
Mehr Informationen
Mehr Informationen
Legimi prüft nicht, ob Rezensionen von Nutzern stammen, die den betreffenden Titel tatsächlich gekauft oder gelesen/gehört haben. Wir entfernen aber gefälschte Rezensionen.



Impressum:

Copyright (c) 2018 GRIN Verlag / Open Publishing GmbH, alle Inhalte urheberrechtlich geschützt. Kopieren und verbreiten nur mit Genehmigung des Verlags.

Bei GRIN macht sich Ihr Wissen bezahlt! Wir veröffentlichen kostenlos Ihre Haus-, Bachelor- und Masterarbeiten.

Jetzt beiwww.grin.com

Inhaltsverzeichnis

Abbildungsverzeichnis

Tabellenverzeichnis

Abkürzungsverzeichnis

1 Einleitung

1.1 Motivation

1.2 Problemstellung und Zielsetzung

1.3 Aufbau der Arbeit

2 Soziale Medien

2.1 Entwicklung

2.2 Definition und Eigenschaften von sozialen Medien

2.3 Bedeutung von sozialen Medien für Unternehmen

3 Data-Mining

3.1 Definition und Eigenschaften von Data-Mining

3.2 Bedeutung von Data-Mining für Unternehmen

3.3 Web-Mining

3.4 Multimedia-Mining

3.5 Social Media-Mining

3.5.1 Social Network Analysis

3.5.2 Opinion-Mining und Sentiment Analysis

4 Data-Mining Methoden in sozialen Medien

4.1 Crawling

4.2 Pre-Processing

4.2.1 Text Pre-Processing

4.2.2 Webpage Pre-Processing

4.3 Supervised Learning Methoden

4.3.1 Logistische Regression

4.3.2 Künstliche neurale Netze

4.3.3 Decision Trees

4.3.4 Support Vector Machines

4.3.5 K-Nearest Neighbors

4.3.6 N-Grams

4.3.7 Naive Bayesian Klassifikation

4.4 Unsupervised Learning

4.4.1 Clustering

4.4.2 Merkmalsselektion

4.4.3 Social Network Analysis

4.4.4 PageRank

4.5 Semi-supervised Learning

4.5.1 Gaußsche Felder und Harmonische Funktionen

4.5.2 Recursive Autoencoders

4.5.3 Pattern Recognition bei sarkastischen Inhalten

4.6 Zusammenfassung der Methoden

5 Geschäftsmöglichkeiten aus Social Media-Mining

5.1 Social Media-Mining als Serviceleistung

5.2 Marktforschung

5.3 Customer Relationship Management

5.4 Produktentwicklung

5.5 Wettbewerbsanalyse

5.6 Vorhersagen mithilfe von Social Media-Mining

5.7 Recruiting

5.8 Gegenüberstellung der Methoden und Geschäftsmöglichkeiten

6 Schluss

6.1 Zusammenfassung

6.2 Limitationen

6.3 Fazit und Ausblick

7 Literaturverzeichnis

Abbildungsverzeichnis

Abbildung 1: Honeycomb of social media (Kietzmann et al. 2011, S. 243)

Abbildung 2: Beispiel eines Sozialen Netzwerkes (Liu 2011, S. 271)

Abbildung 3: Prozess eines Sequential Crawlers (Menczer 2011, S. 312)

Abbildung 4: Darstellung der Kandidaten während des Crawlings (Aggarwal et al. 2001, S. 98)

Abbildung 5: Supervised Learing Prozess (Chakrabarti 2002, S. 127)

Abbildung 6: Beispiel eines neuronalen Netzes (Tu 1996, S. 1227; Ottenbacher et al. 2004, S. 552; Kaefer et al. 2005, S. 2601; Chiang et al. 2006, S. 522)

Abbildung 7: Trennende Hyperebenen und Marge der SVM (Liu 2011, S. 111)

Abbildung 8: Beispiel von verknüpften Social Media-Daten (Tang/Liu 2014, S. 2915)

Abbildung 9: LUFS Framework (Tang/Liu 2012)

Abbildung 10: Anwendung eines RAE auf einen binären Baum (Socher et al. 2011, S. 153)

Abbildung 11: RAE mit -Schicht (Socher et al. 2011, S. 155)

Tabellenverzeichnis

Tabelle 1: Verbreitete Kategorien sozialer Medien (Barbier/Liu 2011, S. 330; Hu/Liu 2012, S. 387)

Tabelle 2: Merkmalswerte und Linkinformationen (Tang/Liu 2012, S. 904 f.)

Tabelle 3: Merkmalswerte je nach Übereinstimmung von Satz und Muster (Tsur et al. 2010, S. 164)

Tabelle 4: Zusammenfassung der beschriebenen Methoden

Tabelle 5: Mustererkennung in Produktreviews (Viswanathan et al. 2011, S. 4)

Tabelle 6: Gegenüberstellung der Methoden und Geschäftsmöglichkeiten

Abkürzungsverzeichnis

1 Einleitung

Die Digitalisierung in verschiedensten Bereichen schreitet unaufhaltsam voran (Liu 2011, S. 1). Das Internet ist aus der heutigen Zeit nicht mehr wegzudenken und bildet die größte und umfassendste Quelle für Informationen (Liu 2011, S. 1). Anders formuliert kann man im World Wide Web (WWW) alles an Wissen finden, in allen erdenklichen Bereichen (Liu 2011, S. 1). Gerade in der heutigen Zeit mit zunehmendem Wettbewerb auf unsicheren globalen Märkten können Organisationen einen nachhaltigen Vorteil gegenüber ihren Konkurrenten aus diesem Wissen ziehen (Nonaka 1991; Peters/Brush 1996; Heinrichs/Lim 2003, S. 104; Dey et al. 2011). Damit einem Unternehmen dies gelingt, braucht es begabte und fähige Menschen, eine auf Lernen fokussierte Organisationskultur und neueste Informationstechnologien, um effektives Wissensmanagement (Knowledge Management) zu betreiben (Kuo 1998; Sauter 1999; Heinrichs/Lim 2003, S. 104; Dey et al. 2011, S. 1). Für eine erfolgreiche Adaption von Wissensmanagement muss folglich auch das Geschäftsmodell des Unternehmens angepasst werden. Das betrifft zum einen taktische Modelle, die sich auf das Geschäftsfeldportfolio, die Preissetzung und verkaufsfördernde Aspekte beziehen und zum anderen strategische Modelle, die die finanzielle Struktur, die Brand Equity und den Kundenwert thematisieren (Gale/Wood 1994; Lim et al. 1999; Heinrichs/Lim 2003, S. 105). Um sich erfolgreich am Markt behaupten zu können, muss ein Unternehmen mehr über Geschäftsprozesse, Technologien, Märkte und Kunden wissen (Lim et al. 1999; Heinrichs/Lim 2003, S. 105). Mit der Weiterentwicklung des Internets zum interaktiven Web 2.0 und der Entstehung von sozialen Online-Plattformen bieten sich der heutigen Geschäftswelt in dieser Hinsicht neue Möglichkeiten (Chakrabarti 2002; Liu/Chen-Chuan-Chang 2004). Auf diese Gegebenheiten aufbauend, leitet sich im nachfolgenden Teilkapitel die Motivation für diese Arbeit ab.

1.1 Motivation

Aufgrund der sich rasch entwickelnden Internettechnologien wird in sozialen Medien eine große Menge an Echtzeit-Verbraucher-Daten geschaffen, die eine bisher nicht dagewesene Möglichkeit für ausgereifte Analysetools und die nächste Generation von sozialen Applikationen bieten (Banerjee et al. 2009, S. 1826). Diese wiederum können eingesetzt werden, um interessante Einblicke in soziale Netzwerke und Gesellschaften in einem bisher nicht realisierbaren Ausmaß zu gewinnen (Barbier/Liu 2011, S. 332). Menschliche Beziehungen, die früher hauptsächlich in einem physischen Umfeld untersucht wurden, können nun in digitalen Medien erforscht werden (Lauw et al. 2010; Barbier/Liu 2011, S. 332). Auf diese Weise können sowohl soziale als auch politische Meinungen und Einstellungen regionalen Bevölkerungsgruppen zugeordnet werden, ohne kostspielige Umfragen durchführen zu müssen (Kumar et al. 2009; Ritterman et al. 2009; Ulicny et al. 2010; Barbier/Liu 2011, S. 332). Des Weiteren zeichnen soziale Medien virale Marketingtrends auf und bieten somit eine ideale Quelle, um Einflussmechanismen besser zu verstehen und zu nutzen (Domingos/Richardson 2001; Barbier/Liu 2011, S. 332). Um jedoch sinnvolle Informationen aus sozialen Medien gewinnen zu können, müssen sogenannte Data-Mining Techniken, wie in Kapitel 3 erläutert, angewandt werden, die die Herausforderungen bewältigen können, die mit Daten aus sozialen Medien einhergehen (Barbier/Liu 2011, S. 332). Die größten Herausforderungen sind erstens der Umfang der Daten aus sozialen Medien, zweitens, dass die Daten viel Rauschen, also unnütze Elemente, enthalten, und drittens, dass die Daten durch Änderungen und häufige Updates dynamisch sind (Liu/Chen-Chuan-Chang 2004, S. 1; Barbier/Liu 2011, S. 332). Durch entsprechende Methoden können nicht nur Inhalte, sondern auch Beziehungen zwischen in den sozialen Medien vertretenen Objekten (Nutzer, Webseiten, etc.) analysiert und zu entsprechenden Informationen verarbeitet werden (Barbier/Liu 2011, S. 332). Es existieren bereits Data-Mining Methoden, die darauf spezialisiert sind, Beziehungsmuster und -regeln zu identifizieren (Han/Kamber 2006; Barbier/Liu 2011, S. 332). Die bereits entwickelten Techniken, wie Support Vector Machines (Kapitel 4.3.4) oder Clustering (Kapitel 4.4.1), können auf Data-Mining in sozialen Medien angewandt werden, auch wenn Modifikationen und Weiterentwicklungen teilweise nötig sind (Chen/Chau 2004; Barbier/Liu 2011, S. 333; Lappas 2011, S. 337). Dadurch und durch den großen Umfang von Social Media-Daten ergibt sich eine Vielzahl von neuen Möglichkeiten, die Unternehmen nutzen können: Suchergebnisse von täglich angewandten Suchmaschinen können verbessert werden, Unternehmen können gezieltes und individualisiertes Marketing betreiben, Psychologen haben die Möglichkeit, das Verhalten von Nutzern zu untersuchen, es entstehen neue Einblicke in soziale Strukturen, die vor allem für Soziologen interessant sind, Webservices können für Verbraucher personalisiert werden und die Vorhersage bestimmter Ereignisse wird möglich (Cortizo et al. 2009; King et al. 2009; Barbier/Liu 2011, S. 333). Konkret sind Data-Mining Methoden auf soziale Medien anwendbar, um Communities oder Gruppen zu ermitteln (Zhou et al. 2007; Baatarjav et al. 2008; Tang et al. 2008), Informationen zu verbreiten (Gruhl et al. 2004), Einflusswirkungen zu untersuchen (Java et al. 2006; Agarwal/Liu 2009; Agarwal et al. 2009; Ulicny et al. 2010), bestimmte Themen zu finden und zu beobachten (Chi et al. 2009; Ritterman et al. 2009), das Verhalten von Individuen (Backstrom et al. 2007; Liu/Liu 2009; Lauw et al. 2010) oder Gruppen (Tang/Liu 2010; Yu et al. 2010) zu analysieren oder Marktforschung zu betreiben (Domingos/Richardson 2001)(Barbier/Liu 2011, S. 333).

1.2 Problemstellung und Zielsetzung

Die Motivation, Data-Mining in sozialen Medien zu betreiben, ist vielfältig und bringt unterschiedliche Möglichkeiten für Berufsgruppen und Organisationen mit sich. Eben hier setzt die vorliegende Arbeit an:

Es wird untersucht, welche bereits existierenden Data-Mining Methoden zur Analyse von Daten aus sozialen Medien verwendet werden können und welche Geschäftsmöglichkeiten sich daraus ergeben.

Zur Beantwortung dieser Fragestellung werden wissenschaftliche Studien und Artikel aus Fachzeitschriften und -tagungen sowie Fachbücher herangezogen. Es existiert, wie oben erläutert, eine Vielzahl an Data-Mining Methoden, die sich im Rahmen des maschinellen Lernens auch für Social Media-Mining eignen. Zwar gibt es bereits tiefgehende Forschungsberichte über Data-Mining Methoden, jedoch keine detaillierte Zusammenstellung der Methoden im Hinblick darauf, wie sie für Social Media-Mining eingesetzt werden können. Ziel der Arbeit ist es daher, einen Überblick über die Data-Mining Methoden zu geben, die entweder grundlegend für Data-Mining in sozialen Medien sind und/oder die Analyse spezieller Aspekte des Social Media-Minings ermöglichen, beispielsweise Methoden zum Opinion-Mining (siehe unter anderem Kapitel 3.5.2). Die Vorstellung der Methoden ist dabei nicht abschließend, da eine umfassende Untersuchung aller möglichen Data-Mining Methoden – je nach gewünschtem Ergebnis und Art der Daten kann eine individuelle Methode nötig sein (Barbier/Liu 2011, S. 335) – den Umfang der Arbeit übersteigen würde. Dies kann somit die Grundlage weiterer Arbeiten bilden.

Zum Verständnis der hinter den Methoden stehenden mathematischen Modelle werden Kenntnisse in der Vektorrechnung sowie weitere mathematische, insbesondere statistische Vorkenntnisse vorausgesetzt.

Im zweiten Teil der Arbeit sollen die Geschäftsmöglichkeiten betrachtet werden, die sich aus der Anwendung von Data-Mining Methoden auf Daten aus sozialen Medien ergeben. Es geht folglich darum, wie Unternehmen Social Media-Mining, nicht aber soziale Medien allgemein (optimale Gestaltung etc.) zu ihrem Vorteil nutzen können.

1.3 Aufbau der Arbeit

Nach der allgemeinen Hinführung zum Thema, der Motivation, Problemstellung und Zielsetzung der Arbeit wird in Kapitel 1 auf soziale Medien eingegangen. Es folgt eine Darstellung der Entwicklung sozialer Medien, der Begriffsdefinition, der Eigenschaften sozialer Medien und schließlich ihrer Bedeutung für Unternehmen. Kapitel 2 beinhaltet die Definition von Data-Mining. Auch hier wird die Bedeutung für Unternehmen betrachtet, bevor auf besondere Formen des Data-Mining wie Web-Mining, Multimedia-Mining und Social Media-Mining eingegangen wird. Anschließend werden in Kapitel 3 Data-Mining Methoden vorgestellt, die im Rahmen des Social Media-Minings Anwendung finden. In Kapitel 4 finden sich die Geschäftsmöglichkeiten, die sich durch die Nutzung von Data-Mining in sozialen Medien ergeben. Kapitel 1 fasst die Arbeit zusammen, weist Limitationen auf, zieht ein Fazit und gibt Anregungen für weitere Forschungsarbeiten.

2 Soziale Medien

Im Folgenden wird eine Übersicht über die Entwicklung der Social Media gegeben, bevor sie definiert, beschrieben und ihre Bedeutung für Unternehmen dargelegt werden.

2.1 Entwicklung

Bereits in seinem Ursprung sollte das Internet dem Informations- bzw. Datenaustausch dienen. Zu Beginn war es nicht mehr als ein sogenanntes Bulletin Board System, also ein schwarzes Brett (Kaplan/Haenlein 2010, S. 60). Ende der neunziger Jahre dann stieg die Zahl an Homepages an, auf denen Nutzer private Inhalte teilen konnten (Kaplan/Haenlein 2010, S. 60). Das heutige Pendant dazu sind Blogs (Kaplan/Haenlein 2010, S. 60). In der Mitte der Neunziger erschienen Unternehmen wie amazon.com und Ebay erstmals auf der Bildfläche, was dazu führte, dass das Internet nach und nach auch vermehrt für E-Commerce genutzt wurde (Kaplan/Haenlein 2010, S. 60). Das Interesse am und die Anforderungen an das Internet seitens Unternehmen und Kunden haben sich seither zu dem Bedürfnis des interaktiven Austauschs zwischen und innerhalb der beiden Gruppen gewandelt (Banerjee et al. 2009, S. 1823). Hier kommen soziale Medien ins Spiel. Studien zufolge werden soziale Medien wie Facebook und Twitter mehr und mehr dazu genutzt, sich seinen Freunden oder Followern mitzuteilen, neue Freunde zu finden, Informationen zu bekommen, sich die Zeit zu vertreiben oder um die eigene Meinung öffentlich kundzutun (Raacke/Bonds-Raacke 2008; Shih 2009; Park et al. 2009; Kaplan/Haenlein 2010; Keckley/Hoffmann 2010; Shih 2010; He et al. 2013, S. 464; Brooks 2015; Ellwein/Noller 2015, S. 3). Die Inhalte und persönlichen Informationen können mit anderen Nutzern sozialer Medien in Echtzeit und in verschiedenen Multimediaformaten wie Text-, Audio- und Videodateien geteilt werden (Banerjee et al. 2009, S. 1823; Barbier/Liu 2011, S. 331). Auf diese Weise erhalten Anwender nicht nur die Möglichkeit, ihre realen sozialen Kontakte im Web abzubilden, sondern können diese auch über geographische und soziale Grenzen hinweg erweitern (Banerjee et al. 2009, S. 1823; Barbier/Liu 2011, S. 331). Die Möglichkeit, selbst Inhalte in sozialen Medien zu generieren (User Generated Content (UGC)), hat die traditionelle Medienlandschaft von Zeitungen, Radio, Fernsehen und die Kommunikationswege grundlegend verändert (Barbier/Liu 2011, S. 330 f.; Hu/Liu 2012, S. 386) Aus einer einseitigen, von den Herausgebern oder Produzenten gesteuerten Informationsverteilung (one to many) wurde ein nicht nur zwei-, sondern vielseitiger Dialog (many to many), in den Menschen weltweit eingebunden sind (Barbier/Liu 2011, S. 330 f.; Hu/Liu 2012, S. 386). Wie umfassend der Begriff soziale Medien ist und welche Möglichkeiten für Unternehmen mit der Nutzung sozialer Medien einhergehen, soll in den folgenden zwei Abschnitten betrachtet werden.

2.2 Definition und Eigenschaften von sozialen Medien

Um soziale Medien zu definieren, grenzen Kaplan/Haenlein(2010) den Begriff zunächst von den Konzepten Web 2.0 und UGC ab. Das Web 2.0 beschreibt eine Plattform, auf der ständig Inhalte und Applikationen von allen Nutzern in Zusammenarbeit erstellt werden (Kaplan/Haenlein 2010, S. 61). Da diese Interaktion in sozialen Medien eine entscheidende Rolle spielt, ist das Web 2.0 als Grundlage für die Entwicklung sozialer Medien zu sehen (Kaplan/Haenlein 2010, S. 61). Der Begriff UGC wird seit 2005 zunehmend verwendet und umfasst alle Möglichkeiten zur Nutzung sozialer Medien, was die verschiedenen Medieninhalte einschließt, sofern sie öffentlich zugänglich sind und von Endnutzern verfasst wurden (Kaplan/Haenlein 2010, S. 61). Soziale Medien sind folglich Online-Plattformen, die UGC in jeder Weise möglich machen. Je nachdem, wofür ein soziales Medium genutzt wird oder welcher Art es ist, kann es einer Kategorie zugeordnet werden. Tabelle 1 zeigt die gängigsten Formen sozialer Medien sowie Beispiele zur jeweiligen Kategorie.

Tabelle 1: Verbreitete Kategorien sozialer Medien (Barbier/Liu 2011, S. 330; Hu/Liu 2012, S. 387)

Laut Wunsch-Vincent(2007) muss der nutzergenerierte Inhalt drei wesentliche Kriterien erfüllen, um als solcher klassifiziert zu werden:

Er muss im Internet frei für alle oder in einem sozialen Netzwerk einer bestimmten Gruppe zugänglich sein,

er muss in gewissem Maße eine kreative Leistung aufweisen und

er muss außerhalb von professionellen Routinen und Praktiken erstellt worden sein.

Nach Kietzmann et al.(2011) werden für soziale Medien mobile und webbasierte Technologien eingesetzt, um höchst interaktive Plattformen zu schaffen, über die einzelne Personen oder auch Gruppen nutzergenerierten Inhalt teilen, gemeinsam erstellen, diskutieren und bearbeiten können. Die Autoren entwickelten ein Modell basierend auf Ideen und Konzepten der Blogger Smith(2007), Webb(2004) und Morville(2004), in dem sie sieben wesentliche Komponenten für soziale Medien festhalten: honeycomb of social media Modell (siehe Abbildung 1). Dabei muss eine Plattform nicht alle Elemente aufweisen, um als soziales Medium zu gelten. Meist liegt der Fokus auf drei oder mehr Blöcken des Modells (Smith 2007; Kietzmann et al. 2011, S. 249). Im Folgenden werden die sieben Dimensionen erläutert und mit weiteren wissenschaftlichen Quellen hinterlegt.

Identity steht für den Grad, zu dem Nutzer sozialer Medien ihre Identität preisgeben. Dies umfasst nicht nur Name, Alter, Geschlecht etc., sondern auch Gedanken und Gefühle sowie Likes und Dislikes (positive und negative Bewertungen), abhängig von der jeweiligen Plattform. So geht es beispielsweise bei Twitter weniger um die Identität der Nutzer als um den Inhalt ihrer Nachrichten. Verkaufsplattformen hingegen sind an den Profilen ihrer Nutzer interessiert, um deren Interessen entsprechende Werbung anbieten zu können (Aggarwal/Yu 2000, S. 4). Obwohl Nutzer sozialer Medien freiwillig Angaben zu ihrer Identität machen, ist der Schutz der Privatsphäre wichtig (Bonneau et al. 2009; Barbier/Liu 2011, S. 336). Das heißt, den Nutzern ist nicht gleichgültig, was mit ihren Daten, die sie zu einem bestimmten Zweck angegeben haben, geschieht. Insbesondere entstehen Bedenken darüber, wie die Daten sekundär für Data-Mining und Überwachung verwendet werden (Kietzmann/Angell 2010). Andere Nutzer wiederum möchten hervorstechen und promoten sich selbst durch soziale Medien. Beispielsweise bezahlen professionelle Fotografen für die Verbreitung ihre Bilder auf Flickr, um mehr Aufmerksamkeit auf sich zu ziehen (Kietzmann et al. 2011, S. 244).

Abbildung 1: Honeycomb of social media (Kietzmann et al. 2011, S. 243)

Conversations bezeichnet im Honeycomb-Modell das Ausmaß, in dem Nutzer untereinander in sozialen Medien kommunizieren. Oft ist der Wunsch, Gleichgesinnte oder einen Partner/eine Partnerin zu finden oder sich über neue Ideen und Trends zu informieren, der Grund, warum Menschen in sozialen Medien kommunizieren. Andere wiederum möchten sich durch Social Media Gehör verschaffen, auf humanitäre oder Umweltprobleme aufmerksam machen oder politische Debatten führen (Beirut 2009). Aus der Häufigkeit, mit der ein Nutzer Beiträge teilt und dem Inhalt von Konversationen können Unternehmen wichtige Informationen gewinnen (Barbier/Liu 2011; Kietzmann et al. 2011). Von besonderer Bedeutung sind hierbei zwei Variablen: die rate of change, die die Anzahl an neuen Konversationen innerhalb einer bestimmten Zeitperiode angibt und die direction of change, die bezeichnet, wie kontinuierlich bzw. diskontinuierlich eine Konversation verläuft, zum Beispiel in Bezug auf ein Produkt (Kietzmann et al. 2011, S. 244).

Sharing beschreibt den Grad, zu dem Nutzer Inhalte austauschen, verbreiten und erhalten. Entscheidend ist dabei das Objekt, das die Nutzer zusammenbringt. So entscheiden Nutzer im Prinzip in Abhängigkeit des Objektes, ob sie soziale Bindungen eingehen wollen oder nicht. Interessiert sich jemand beispielsweise für Bilder, wird er am ehesten Mitglied bei Flickr und vernetzt sich dort mit anderen Nutzern. Steht der Austausch über Musik im Vordergrund, bildet MySpace die passende Plattform, um Kontakte zu finden. Würden diese Objekte (Bilder und Musik) wegrationalisiert, hätten die Nutzer der Plattformen keine gemeinsamen Themen und würden sich folglich nicht länger an ihnen beteiligen (Kietzmann et al. 2011, S. 245).

Presence gibt an, inwieweit Nutzer feststellen können, ob andere Nutzer erreichbar sind. Dies schließt das Wissen ein, wo sich andere Nutzer befinden, sowohl in der realen als auch in der virtuellen Welt, und ob sie verfügbar sind. So gibt es beispielsweise Apps wie Friends Around Me, die es ermöglichen zu sehen, ob und welche Freunde aus verschiedenen sozialen Netzwerken wie Facebook und Twitter gerade in der Nähe sind (Kietzmann et al. 2011, S. 245 f.).

Relationships stellt den Umfang dar, innerhalb dessen Nutzer mit anderen in Verbindung stehen. Damit ist gemeint, dass zwei oder mehrere Personen miteinander kommunizieren, Objekte teilen, sich treffen oder sich gegenseitig als Freund oder Fan listen. Dabei kommt es nicht allein auf die Häufigkeit von Kommunikationen oder die Anzahl an Freunden an, sondern auch darauf, ob und wie diese Beziehungen gepflegt werden. Je nach Plattform unterscheiden sich Struktur und Art der Verbindung. Während LinkedIn beispielsweise darauf abzielt, ein möglichst großes Netzwerk um einen Nutzer herum aufzubauen, das heißt, neue Menschen kennenzulernen, ist Skype darauf ausgerichtet, mit bereits bekannten Personen zu sprechen, seien es gute Freunde oder auch formellere Kontakte. Auf Plattformen wie YouTube und Twitter dagegen spielen Beziehungen eine untergeordnete Rolle, was auch damit einhergeht, dass die Identität der Nutzer auf diesen Plattformen nur von geringer Bedeutung ist (Kietzmann et al. 2011, S. 246 f.).

Reputation bezeichnet das Ausmaß, zu dem Nutzer ihr Ansehen oder das anderer Nutzer in sozialen Medien feststellen können. Häufig ist das Ansehen dabei abhängig von der Vertrauenswürdigkeit des Nutzers. Allerdings gestaltet sich die Messung einer solchen qualitativen Variablen schwierig. In sozialen Medien werden dazu beispielsweise Likes auf Facebook oder YouTube herangezogen, oder die Anzahl an Followern auf Twitter. Außerdem werden nicht nur die Teilnehmer der Social Media bewertet, sondern auch die Inhalte, die sie posten, teilen usw. (Kietzmann et al. 2011, S. 247).

Groups schließlich beschreibt den Grad, zu dem Nutzer Gruppen (communities) und Untergruppen (subcommunities) bilden. Je größer und weiter verzweigt ein Netzwerk wird, desto größer ist die Gruppe von Freunden, Followern und Kontakten. Dabei unterscheiden Kietzmann et al.(2011) zwei Arten von Gruppen: selbst erstellte Gruppen, denen enge Freunde, weniger enge Freunde, Fans usw. zugeordnet werden können und solche, die Clubs oder Vereinigungen aus der realen Welt entsprechen, was bedeutet, dass sie entweder allen zugänglich sind, die Erlaubnis zum Beitritt erfordern oder geheim sind und denen man nur per Einladung beitreten kann (Kietzmann et al. 2011, S. 247).

Diese breite Definition von Social Media lässt Rückschlüsse darauf zu, wie umfassend und weitreichend das Web 2.0 geworden ist. Mit sprichwörtlich einem Klick können Millionen Menschen weltweit erreicht und Informationen mit ihnen geteilt werden (Mangold/Faulds 2009, S. 359). In der Leichtigkeit der Informationsverbreitung und deren Reichweite wiederum liegen große Chancen für Unternehmen, aber auch zahlreiche Risiken (Kaplan/Haenlein 2010). Auf diese wird im folgenden Abschnitt eingegangen.

2.3 Bedeutung von sozialen Medien für Unternehmen

Im ersten Quartal 2015 verzeichnete Facebook 1,441 Milliarden Nutzer (Facebook o. J.). Im Vergleich dazu waren es im Jahr 2008 noch 100 Millionen (Facebook o. J.). Dabei können Nutzer als Privatpersonen oder Unternehmensvertreter auftreten. Folglich bieten Social Media-Plattformen die Möglichkeit, dass Unternehmen, Geschäftspartner, Lieferanten und Kunden untereinander kommunizieren (Culnan et al. 2010, S. 243). Beispielsweise können Unternehmen Werbeinhalte viral über soziale Medien verbreiten, während Kunden Feedback zu Produkten geben und so anderen (potentiellen) Kunden Informationen bereitstellen (Domingos 2005, S. 80 ff.). Bei Kaufentscheidungen kann nicht mehr nur auf die Meinungen oder Empfehlungen von Freunden und Familie zurückgegriffen werden, sondern es können vielseitige Eindrücke in Foren oder Blogs, auf Verkaufsplattformen wie zum Beispiel amazon.com und Ebay, und in sonstigen sozialen Medien eingeholt und darauf basierend entschieden werden (Aggarwal/Yu 2000, S. 4; Cambria et al. 2013, S. 15).

Das Feedback der Kunden kann auch von Unternehmensseite genutzt werden, um beispielsweise neue Produkte, die den Anforderungen des Marktes zu einem hohen Grad entsprechen, zu entwerfen oder bestehende zu verbessern (Heinrichs/Lim 2003, S. 107; Dey et al. 2011; Bekmamedova/Shanks 2014, S. 3729). Geben zum Beispiel Käufer Bewertungen zu einem Produkt auf der Verkaufsplattform amazon.com ab, können die Hersteller diese auswerten und das Feedback als Anregung zur Anpassung ihres Angebots nutzen.

Firmen haben die Möglichkeit, die sozialen Medien zu instrumentalisieren, um die Einstellung gegenüber dem Unternehmen oder Kaufentscheidungen der Kunden zu beeinflussen, indem sie durch die Bewerbung ihrer Produkte, Services und der Marke die Markenwahrnehmung erhöhen und so die Kundenbindung stärken (Kaplan/Haenlein 2010, S. 61; Kiron et al. 2013; Bekmamedova/Shanks 2014, S. 3729). Fällt ein Kunden-Review positiv aus, ist die Wahrscheinlichkeit hoch, dass sich andere (potentielle) Kunden auch für dieses Produkt entscheiden (Liu 2011, S. 459). Außerdem ermöglicht die Werbung per Social Media Kostensenkungen unter anderem durch die virale Verbreitung von Werbeinhalten (Domingos 2005, S. 80; Bekmamedova/Shanks 2014, S. 3729). Ziel hierbei ist es, dass der Clip oder sonstige Werbung von Kunde zu Kunde mit einer positiven Wertung weitergegeben wird (positives Word-of-mouth (WOM)), wodurch der beworbene Inhalt hohe Aufmerksamkeit zu vergleichsweise geringen Kosten erzielt (Domingos 2005, S. 80). Wichtig bei solchen Kampagnen ist es, eine kritische Masse zu erreichen (Culnan et al. 2010, S. 244). Ist dies gewährleistet, verbreitet sich der Inhalt ‚wie von selbst weiter‘ (Culnan et al. 2010, S. 244). Jedoch verbreiten sich nicht nur positive Inhalte mit hoher Geschwindigkeit, sondern auch negative. Als zum Beispiel United Airlines die 3500 USD teure Gitarre des Musikers David Carrol bei der Gepäckbeförderung beschädigte und er über ein Jahr lang ohne Erfolg mit der Fluggesellschaft um Schadensersatz gekämpft hatte, griff Carrol auf YouTube zurück (Deighton/Kornfeld 2010; Carroll 2012). Er veröffentlichte im Juli 2009 einen Song inklusive Video, der das Geschehene in gut viereinhalb Minuten zusammenfasst (Sons of Maxwell 2009). Innerhalb eines Tages sahen 150.000 Internetnutzer das Video, einen Monat später waren es bereits 5 Millionen (Tripp/Grégoire 2011), im Juli 2015 über 15 Millionen (Sons of Maxwell 2009). Das Video erzeugte nicht nur negatives WOM, sondern hatte drastische finanzielle Auswirkungen für die Fluggesellschaft und ihre Aktionäre: der Aktienkurs fiel um 10%, was die Shareholder über 180 Millionen USD kostete, den Gegenwert von mehr als 51.000 Ersatz-Gitarren (Ayers 2009). Dieses Beispiel zeigt, welch großen Einfluss Kunden mithilfe sozialer Medien auf Unternehmen haben können. Daher ist es wichtig, dass Unternehmen eine angemessene Social Media-Strategie entwickeln und umsetzen (Lardi/Fuchs 2013, S. 18 f.).

Für eine effektive Nutzung sozialer Medien sind drei Aspekte zu beachten:

1. Die Organisation muss eine sorgfältige Entscheidung zu Beginn der Präsenz in sozialen Medien treffen (Culnan et al. 2010, S. 246). Dies beinhaltet die Klärung der Fragen, welche Plattformen genutzt und verwendet werden, woran der Wert, der durch die Verwendung sozialer Medien generiert wird, gemessen werden kann (zum Beispiel Größe der Community, Verbreitung der vom Unternehmen erstellten Inhalte) und wer für die Verwaltung der sozialen Plattformen verantwortlich ist (Culnan et al. 2010, S. 246). Des Weiteren müssen die Applikationen einfach über Links von Unternehmensseiten oder direkt zugänglich sein und ein Risikomanagement eingerichtet werden (Culnan et al. 2010, S. 247). Dies dient dazu, Risiken wie Verstöße gegen die Sicherheit oder die Vertraulichkeit der Kunden, das Durchsickern intellektuellen Eigentums und die Verletzung der Firmenpolitik oder des Verhaltenskodexes zu begegnen (Culnan et al. 2010, S. 247). Mit einem erfolgreichen Risikomanagement hätte auch ein Verlust wie in oben genanntem Fall von United Airlines verhindert oder zumindest begrenzt werden können.

2. Die Organisation sollte Communities bilden, die eine möglichst große Anzahl an Kunden und Followern umfassen (Culnan et al. 2010, S. 246). Zu ihnen sollte eine enge Bindung aufgebaut werden, da soziale Plattformen vorrangig der Kommunikation dienen (Culnan et al. 2010, S. 246). Dabei muss die Infrastruktur des Webauftritts eines Unternehmens so gestaltet sein, dass eine Community zunächst entsteht und anschließend bestehen bleibt, was bedeutet, dass stets eine kritische Masse an Teilnehmern aktiv in die sozialen Medien eingebunden ist (Culnan et al. 2010, S. 249).

3. Die Organisation braucht die nötigen Kompetenzen, um den von ihren Kunden generierten Inhalt sinnvoll nutzen zu können (absorbtive capacity) (Culnan et al. 2010, S. 246). Dazu gehören einerseits die Auswertung des UGC und andererseits die angemessene Reaktion darauf (Culnan et al. 2010, S. 249). Zur Schaffung der erforderlichen Kompetenz ist zum einen die Zuweisung der Verantwortlichkeit für Social Media-Monitoring nötig, zum anderen die Entwicklung formeller Systeme und Regeln, nach denen kundengenerierte Nachrichten weitergeleitet und beantwortet werden (Culnan et al. 2010, S. 249 f.). Zum dritten ist eine Entscheidung darüber nötig, wie Berichte (diverse Statistiken) über die Aktivitäten in Social Media erstellt, geteilt und vom Unternehmen genutzt werden (Culnan et al. 2010, S. 249 f.).

Aufgrund des immensen und globalen Wachstums sozialer Medien wie Facebook und Twitter sehen es Firmen jeder Größe und Branche als unumgänglich an, soziale Medien in ihre Marketingstrategie zu integrieren (Hanna et al. 2011, S. 272 f.).

Zusätzlich können Unternehmen soziale Medien auch intern einsetzten. Das Ergebnis einer Studie aus dem Jahr 2009, in der der Gebrauch von Social Media-Plattformen von 1700 Unternehmen untersucht wurde, zeigte, dass 64% der Befragten Web 2.0 Plattformen intern (Intranet-Systeme) nutzen (Culnan et al. 2010, S. 243). Der interne Einsatz ermöglicht den Mitarbeitern den gegenseitigen Austausch von Wissen und Informationen, was nicht nur die Motivation, sondern auch die Generierung neuer, dem Unternehmen dienlicher Ideen fördert (Culnan et al. 2010, S. 257; Dey et al. 2011, S. 1; Brooks 2015; Ellwein/Noller 2015, S. 3). Diese Art der Verwendung sozialer Medien steht jedoch in vorliegender Arbeit nicht im Vordergrund.

Zusammenfassend bieten soziale Medien Unternehmen vielfältige Möglichkeiten, um mit ihren Kunden zu kommunizieren. Jedoch zeichnen sich soziale Medien insbesondere durch den UGC aus, wodurch sie umfassende Daten über Nutzer, Produkte, Firmen, Veranstaltungen, Ereignisse und vieles mehr enthalten. In diesen Daten liegen umfangreiche Informationen verborgen, die, sofern sie korrekt gesammelt und ausgewertet werden, Unternehmen großen Gewinn bringen können. Für die Analyse der Daten ist die Anwendung von Data-Mining notwendig, was im folgenden Kapitel genauere Betrachtung findet.

3 Data-Mining

Das Kapitel dient der Begriffserklärung des Data-Minings und der sich daraus ergebenden Bedeutung für Unternehmen. Anschließend werden Sonderformen des Data-Minings vorgestellt: Web-Mining und Multimedia-Mining. Daraus ergibt sich schließlich die Thematik des Social Media-Minings. Neben der jeweiligen Begriffsdefinition geht das Kapitel insbesondere auf die Aufgaben der Data-Mining-Formen ein.

3.1 Definition und Eigenschaften von Data-Mining

Im Hinblick auf eine Definition von Data-Mining ist sich die Wissenschaft grundsätzlich einig. So ist unter Data-Mining die Erkennung von Mustern zu verstehen, die aus Daten abgeleitet werden (Chakrabarti 2002, S. XV; Grabmeier/Rudolph 2002, S. 303; Chye Koh/Kee Low 2004, S. 462; Liu 2011, S. 6; Aggarwal et al. 2012, S. 164). Data-Mining wird auch als Knowledge Discovery from Data (KDD) oder Knowledge Discovery in Databases (KDD) bezeichnet (Han/Kamber 2006; Barbier/Liu 2011, S. 328; Liu 2011). Das Ableiten von Mustern erfolgt mithilfe verschiedener statistischer Methoden, auf die in Kapitel 1 eingegangen wird. Die Definitionen weichen lediglich im Präzisionsgrad voneinander ab. Bei einigen Begriffsfestlegungen müssen zum Beispiel die Muster und Beziehungen aus den Daten valide, neuartig, potenziell nützlich und verständlich sein (Chye Koh/Kee Low 2004, S. 462; Liu 2011, S. 6), während andernorts versteckte und ebenfalls potenziell nützliche Informationen aus einer sehr großen Datenbasis gewonnen werden müssen (Aggarwal et al. 2012, S. 164). Data-Mining ist eng mit maschinellem Lernen (machine learning), statistischen Methoden, Datenbasen, künstlicher Intelligenz (artificial intelligence), Informationsgewinnung (information retrieval) – was das Finden von Dokumenten und Inhalten bedeutet, die für die Suchanfrage relevant sind – und Visualisierung (visualisation) verknüpft (Barbier/Liu 2011, S. 328; Liu 2011, S. 211; Larose/Larose 2014).

Der KDD-Prozess umfasst, nachdem ein zu lösendes Problem klar definiert wurde, im Wesentlichen drei Schritte: die Datenvorbereitung (pre-processing), das Data-Mining und die Datennachbereitung (post-processing).

Beim Pre-Processing wird die sorgfältig ausgewählte Datenbasis von Rauschen und Abnormitäten befreit sowie um überflüssige Informationen durch Stichprobenauswahl oder durch die Auswahl bestimmter Merkmale reduziert (Miller et al. 2006, S. 2; Markov/Larose 2007, S. 15; Liu 2011, S. 6; Ramasubramanian/Ramya 2013).

Im Data-Mining-Schritt werden auf die aufbereiteten Daten Algorithmen angewandt, um Muster zu erkennen oder Informationen ableiten zu können (Chakrabarti 2002; Barbier/Liu 2011, S. 328; Liu 2011, S. 6; Ramasubramanian/Ramya 2013, S. 4536).

Im letzten Schritt, dem Post-Processing, werden die gefundenen Muster und Informationen aufbereitet, die für den jeweiligen Zweck tatsächlich hilfreich sind. Um diese zu identifizieren und für den Endnutzer verständlich aufzubereiten, werden vielfältige Bewertungs- und Visualisierungstechniken angewandt (Bruha/Famili 2000; Díaz et al. 2010, S. 2; Liu 2011, S. 6). Schließlich können, basierend auf den gewonnenen Ergebnissen, Entscheidungen getroffen werden (Bruha/Famili 2000, S. 111; Díaz et al. 2010, S. 2).

Um ein zufriedenstellendes Ergebnis zu erhalten und dieses dann operativ anwenden zu können, muss der Prozess meist mehrfach durchgeführt werden. Die häufigsten Ursachen für das Scheitern von Data-Mining sind die hohe technische Komplexität der Daten und der eingesetzten Software, mangelnde Unterstützung und Interesse durch das Senior Management, unzureichende Flexibilität der Softwaretools, um gegebene Fragestellungen zu lösen sowie die Herausforderung, die Ergebnisse gewinnbringend einzusetzen (Heinrichs/Lim 2003, S. 104).

Beim traditionellen Data-Mining-Prozess werden Daten untersucht, die in Data Warehouses strukturiert und in relationalen Tabellen in klar definierter Form (Spalten, Zeilen) gelagert sind (Chakrabarti 2002, S. 12; Liu 2011, S. 6)