Erhalten Sie Zugang zu diesem und mehr als 300000 Büchern ab EUR 5,99 monatlich.
Was vor wenigen Jahren noch nach Science-Fiction klang, ist mittlerweile Realität: Durch Künstliche Intelligenz lassen sich Bilder in beliebigem Stil digital erzeugen. Man gibt in Worten an, was man sehen will, und bekommt sofort Vorschläge präsentiert. In manchen Branchen herrscht deshalb Unruhe, in anderen Aufbruchsstimmung. Doch entsteht hier wirklich Neues oder wird nur Bestehendes recycelt, gewissermaßen plagiiert? Merzmensch stellt die wichtigsten Programme und exemplarische Werke der KI-Kunst mit ihren Qualitäten und Problemen vor und unternimmt Ausblicke auf die weitere Entwicklung.
Sie lesen das E-Book in den Legimi-Apps auf:
Seitenzahl: 76
Veröffentlichungsjahr: 2023
Das E-Book (TTS) können Sie hören im Abo „Legimi Premium” in Legimi-Apps auf:
KI-Kunst verändert die Bildwelten, weit über die Kunst hinaus. Merzmensch erklärt das visuelle Potenzial der von vielen gefürchteten Umwälzung durch KI, führt durch Debatten über Originalität und Urheberschaft und skizziert die Umrisse einer neuen Epoche, in der Mensch und Maschine kreativ zusammenarbeiten.
Merzmensch
KI-KUNST
Kollaboration von Mensch und Maschine
Verlag Klaus Wagenbach Berlin
DIGITALE BILDKULTUREN
Durch die Digitalisierung haben Bilder einen enormen Bedeutungszuwachs erfahren. Dass sie sich einfacher und variabler denn je herstellen und so schnell wie nie verbreiten und teilen lassen, führt nicht nur zur vielbeschworenen »Bilderflut«, sondern verleiht Bildern auch zusätzliche Funktionen. Erstmals können sich Menschen mit Bildern genauso selbstverständlich austauschen wie mit gesprochener oder geschriebener Sprache. Der schon vor Jahren proklamierte »Iconic Turn« ist Realität geworden.
Die Reihe DIGITALE BILDKULTUREN widmet sich den wichtigsten neuen Formen und Verwendungsweisen von Bildern und ordnet sie kulturgeschichtlich ein. Selfies, Meme, Fake-Bilder oder Bildproteste haben Vorläufer in der analogen Welt. Doch konnten sie nur aus der Logik und Infrastruktur der digitalen Medien heraus entstehen. Nun geht es darum, Kriterien für den Umgang mit diesen Bildphänomenen zu finden und ästhetische, kulturelle sowie soziopolitische Zusammenhänge herzustellen.
Die Bände der Reihe werden ergänzt durch die Website www.digitale-bildkulturen.de. Dort wird weiterführendes und jeweils aktualisiertes Material zu den einzelnen Bildphänomenen gesammelt und ein Glossar zu den Schlüsselbegriffen der DIGITALEN BILDKULTUREN bereitgestellt.
Herausgegeben von
Annekathrin Kohout und Wolfgang Ullrich
»Hallo Computer. Zeichne mir bitte ein Renaissance-Gemälde im Stil eines 3D-Shooters.« Nach wenigen Sekunden gab »DALL·E 2 « dieses Bild aus:
Es war nicht das, was ich erwartet hatte. Es war viel besser …
Der Science-Fiction-Autor Arthur C. Clarke formulierte drei berühmt gewordene axiomatische Gesetze, die er auch in seinen Werken verfolgt. Das dritte Gesetz lautet: »Jede ausreichend fortgeschrittene Technologie ist von Magie nicht zu unterscheiden.«1
Daran musste ich in den letzten zehn Jahren beim Blick auf die rasante technologische Entwicklung immer wieder denken. Der Semiotiker Tzvetan Todorov2 definiert den Unterschied zwischen dem Fantastischen und dem Märchenhaften unter anderem anhand der Erzählperspektive: Im fantastischen Genre begegnet man den seltsamen Ereignissen (Zeitreisen, Kontakten mit außerirdischen Zivilisationen etc.) mit analytischem Denken – deshalb staunt man und vergleicht die Anomalien mit der vertrauten Wirklichkeit. In Fantasy und Märchen hingegen nimmt man alles als gegeben hin – Drachen, Zauberer, Magie sind hier bereits ontologisch verankert. Man wundert sich nicht.
Sind wir also von der nüchternen Science-Fiction-Erzählung zu einer magischen Wirklichkeit übergegangen? Die Maschinen unserer Zeit erzählen Geschichten, schreiben Musik, malen Bilder, mit unserer Hilfe, aber auch ohne sie. Und wir wundern uns nicht mehr darüber. Wir sind in jener Zukunft angekommen, die in den fantastischen Erzählungen der Vergangenheit beschrieben wurden.
Vor diesem Hintergrund möchte ich meinen eigenen Zustand des Nicht-mehr-Wunderns schildern. Mein Forschungsbereich ist die historische Avantgarde, insbesondere der Dadaismus und die Merzkunst von Kurt Schwitters.3 Die Kunstbewegungen der »Goldenen Zwanziger« stellten die vermeintlich hochentwickelte westliche Zivilisation infrage, die die Gräueltaten des Ersten Weltkrieges nicht verhindert, sondern sogar hervorgebracht hatte.4 Ausgehend von dieser Diskreditierung der Traditionen suchten die Dadaisten nach neuen Perspektiven, kreativen Ansätzen und Erzählungen.
Heute leben wir wieder in den Zwanzigern, mit vielen Parallelen zu denen vor hundert Jahren. Diesmal erzeugen neue, disruptive Technologien und die damit verbundenen globalen soziokulturellen Entwicklungen einen Paradigmenwechsel – in unserem Kunstverständnis, unserer Kreativität und der Rezeption des Kulturellen.
Mein erster Kontakt mit KI als Schnittstelle zwischen Kunst und neuen Technologien begann mit einer Reihe von Essays von Ross Goodwin, Ghostwriter für das Weiße Haus in der Zeit Barack Obamas, Technologe bei Google, Künstler und Schriftsteller. Goodwins Biografie liest sich wie ein spannender Roman. Aber auch seine Arbeit mit KI-Sprachmodellen ist herausragend. Für seinen Film Sunspring (2016) – den ersten KI-Film – trainierte er die Künstliche Intelligenz mit unzähligen Drehbüchern und ließ neue erstellen. 2018 stattete er sein Auto mit computerisierten KI-Modellen aus, und während er damit quer durch die USA fuhr, schrieb es ein Buch (1 the Road, das erste auf diese Weise geschriebene Werk). In seinem Essay »Adventures in Narrated Reality«5 von 2016 versucht Goodwin anhand zahlreicher Beispiele zu zeigen, dass Maschinen die menschliche Kreativität niemals ersetzen, aber auf innovative Weise erweitern werden.
Mit verstärktem Interesse fing auch ich an, diese Symbiose von Technologie und Kultur zu untersuchen, Papers zu lesen, KI-Ansätze selbst auszuprobieren, mich mit Forscher*innen und Künstler*innen auszutauschen. In der Maschine begegneten mir nun kreative Potenziale, mit denen ich nie gerechnet hätte. Im Jahr 2020 fragte mich das Forschungsinstitut OpenAI, ob ich Teil ihrer Community Ambassadors werden wolle: eine kleine internationale Gruppe, die den Entwickler*innen und Nutzer*innen von OpenAI-Modellen mit Rat und Tat zur Seite steht. Dabei erhält man viele Einblicke in Abläufe und Funktionsweisen. Parallel untersuchte ich als Beta-Tester »GANbreeder«, »Artbreeder«, »RunwayML« und viele andere auf Deep Learning (DL) basierende kreative Systeme.
Und jetzt, nach unzähligen Workshops, Ausstellungen und Publikationen, kann ich Ross Goodwins Eindruck teilen und seinem Urteil zustimmen: Im letzten Jahrzehnt hat es eine Explosion der menschlichen Kreativität gegeben, die durch Maschinen forciert wurde. Eine Explosion, die mittlerweile zu einer eigenen Werkkategorie geführt hat: KI-Kunst.
Dabei ist KI-Kunst zunächst ein Passepartout-Wort, das nicht viel mehr benennt als die Gesamtheit der Kunstwerke, die unter Beteiligung verschiedener KI-Verfahren entstanden sind. KI-Kunst ist ein eingängiger Begriff, der mittlerweile von KI-Künstler*innen als zu ungenau abgelehnt wird. Zugleich ist er zu einem Unwort innerhalb mancher Communitys von »Human Artists« geworden – und zu einem Buzzword der sensationsfreudigen Presse.
Grundsätzlich ist mit KI-Kunst die mediale Gesamtheit von Kreativität gemeint, die einer der folgenden Hauptkategorien zugeordnet werden kann:
1. Von KI-Modellen ohne menschliches Eingreifen erzeugte Artefakte (zum Beispiel Bilder, die nach minimalen Vorgaben automatisch von einem KI-Modell produziert werden).
2. Mithilfe von KI-Werkzeugen erstellte Artefakte (zum Beispiel menschliche Artefakte, die mit maschinellen Lösungen nachbearbeitet werden).
3. Menschliche Artefakte, die von KI-Output inspiriert sind, indem dieser als Ideengeber für die künstlerische Auseinandersetzung mit der Realität dient (zum Beispiel KI-Bilder, die mit traditionellen Mitteln wie Ölfarben vom Menschen reproduziert, oder Ideen und Sujets, die von einem KI-Medium erzeugt und dann aufgegriffen werden).
Was aber ist Künstliche Intelligenz (KI)? Eine Definition ist ebenso schwierig. »Künstliche Intelligenz […] gibt es nicht«, schreibt Medienwissenschaftler Peter Weibel. Dafür gebe es aber das Forschungsfeld KI, bestehend aus einem »Ensemble von Maschinen, Medien, Programmen, Algorithmen, Hardware und Software«.6
Der paradigmatische Begriff »Künstliche Intelligenz« (Artificial Intelligence) geht auf die Dartmouth Conference zurück, ein interdisziplinäres Symposium, das 1956 von den Forschern John McCarthy, Marvin Minsky und anderen organisiert wurde. Ziel der Organisatoren war es, die Hypothese zu überprüfen, dass man »Maschinen dazu bringen kann, Sprache zu benutzen, Abstraktionen und Konzepte zu bilden, Probleme zu lösen, die bisher dem Menschen vorbehalten waren, und sich selbst zu verbessern«.7 So formulierten sie im Förderantrag für das Symposium die Idee der KI als technologisierte Rekonstruktion menschlichen Denkens und Lernens, ja der Kreativität.
Allerdings konnte die Rechenleistung der Computer die Hoffnungen zunächst nicht erfüllen, KI-Firmen schlossen, und die Finanzierung versiegte.
Ende der 1990er-Jahre ereigneten sich auf dem Gebiet der KI bedeutende technologische Durchbrüche. 1997 bezwang »Deep Blue« Schachweltmeister Garri Kasparow. 2011 gewann »IBM Watson« gegen menschliche Champions bei der Quizshow Jeopardy!, und 2016 besiegte »AlphaGo« den Go-Meister Lee Sedol, bevor es 2017 von »AlphaGo Zero«, einem fortgeschrittenen KI-Modell, geschlagen wurde. Während »AlphaGo« mit Millionen von Zügen von Go-Meister*innen trainiert wurde, lernte »AlphaGo Zero« durch das Spielen von unzähligen Spielen gegen sich selbst8 und benötigte keine menschliche Erfahrung. Wie Demis Hassabis, der Entwickler von »AlphaGo Zero« und CEO von »DeepMind«, erklärte, konnte »AlphaGo Zero« eigenes Wissen schaffen und war nicht an menschliches Wissen gebunden.9
Maschinelles Lernen (ML), einschließlich des Unterbereichs Deep Learning (DL), nutzt Daten, um Informationen und Wissen zu verarbeiten und neue Erkenntnisse zu gewinnen. Maschinelles Lernen kann zum Beispiel Daten über Verkehrsflüsse verwenden, um Vorhersagen zu machen. Deep Learning, das auf neuronalen Netzwerken (NN) basiert, ist in der Lage, selbstständig komplexe Aufgaben wie Objekt- und Gesichtserkennung oder Sprachsynthese zu bewältigen und benötigt weniger ausführliche Trainingsdaten. Es eröffnet Maschinen Zugang zu intuitiven und kreativen Bereichen.
Es gibt verschiedene Konzepte der KI: Schwache KI vermag meist nur eine Art von Aufgabe zu lösen, während starke KI verschiedene Arten von Informationen interpretieren und Aufgaben selbstständig definieren und meistern kann. Die hypothetische Künstliche Allgemeine Intelligenz (AGI), so die Überlegung, wird die geistigen Fähigkeiten des Menschen übertreffen und die »technologische Singularität« erreichen, einen Punkt, an dem der technologische Fortschritt als irreversibel und unberechenbar gelten muss.10
Mittlerweile oszilliert der Begriff der Künstlichen Intelligenz also zwischen dem Paradigma des Maschinellen Lernens/Deep Learning über die philosophisch-publizistische Auseinandersetzung mit maschinellem »Denken« und »Handeln« bis hin zum Konstrukt der AGI.
An Überlegungen zur Kunst und Kreativität von Maschinen mangelt es nicht.11 Arthur I. Millers The Artist in the Machine (2019) ist wohl die bisher ausführlichste Auseinandersetzung mit der Symbiose von Forschung und Kunst im Zeitalter der KI. Allerdings sind Publikationen in diesem Feld vor das Problem gestellt, dass sie durch die rasende Entwicklung auf dem Feld nach dem Erscheinen schon bald als überholt gelten müssen. Lag zwischen »Deep Blue« und »AlphaGo« noch ein Jahrzehnt, so wird die KI
