Erhalten Sie Zugang zu diesem und mehr als 300000 Büchern ab EUR 5,99 monatlich.
Künstliche Intelligenz verändert die Welt des Erzählens fundamental. Der renommierte Dramaturg und Autor Oliver Schütte gibt einen umfassenden Einblick in die Möglichkeiten und Grenzen der KI für das kreative Schreiben. Die breite Palette reicht von Brainstorming, Recherche, Titelfindung bis hin zur Figurenentwicklung. Schütte zeigt fundiert und kritisch, wie Autoren dieses Instrument optimal nutzen können, um an Romanen und Drehbüchern zu arbeiten. Dabei stellt er viele konkrete Anwendungsbeispiele vor, die sofort umgesetzt werden können. Er warnt aber auch vor übertriebenen Erwartungen und betont die unersetzliche Rolle der menschlichen Kreativität. Ein zeitgemäßes und aufklärendes Buch für alle Autorinnen und Autoren im digitalen Zeitalter. Das Update beschreibt in einem zusätzlichen Kapitel die neuesten Programme bis einschließlich Juli 2024, die für das Entwickeln von Geschichten relevant sind.
Sie lesen das E-Book in den Legimi-Apps auf:
Seitenzahl: 285
Veröffentlichungsjahr: 2024
Das E-Book (TTS) können Sie hören im Abo „Legimi Premium” in Legimi-Apps auf:
Foto: Gerhard Kassner
Oliver Schütte ist Spezialist für das Erzählen von Geschichten. Er studierte Film- und Theaterwissenschaften an der Freien Universität Berlin. Seit 1986 arbeitet er als Autor für Film und Fernsehen und ab 1990 auch als Dramaturg. Für sein erstes Drehbuch KOAN erhielt er 1988 den Deutschen Drehbuchpreis.
1995 gründete er die Weiterbildungsinstitution Master School Drehbuch, die er bis Ende 2008 geleitet hat. Im Jahr 1995 beginnt auch seine umfangreiche Lehrtätigkeit im In- und Ausland. 2013 gründete er die Filmproduktion tellfilm Deutschland mit Sitz in Berlin. Heute ist er als Dramaturg, Dozent an internationalen Filmhochschulen, Publizist und als Produzent tätig.
Er ist Autor von DIE KUNST DER DREHBUCHENTWICKLUNG und im Jahr 2019 erschien DIE NETFLIX-REVOLUTION. Seine anderen Werke DIE KUNST DES DREHBUCHLESENS und SCHAU MIR IN DIE AUGEN, KLEINES sind mittlerweile in der 4. Auflage erschienen. Im Jahr 2015 wurde sein erster Roman DIE ROTE BURG und im Jahr 2019 TÖDLICHER SCHNITT veröffentlicht.
AUS FREUDE AM DENKEN!
Schriften zu dramaturgischen und filmwissenschaftlichen Aspekten
Wir sind der festen Überzeugung, dass eine gelungene Stoffentwicklung maßgeblich für gute Filme und Serien ist und dass man nie genug darüber wissen kann.
Die Master School Drehbuch bietet seit 1995 Seminare und Lehrgänge in den Bereichen Drehbuchschreiben und Dramaturgie an. Der stets angeregte Austausch im Kolleg:innenkreis und unter den Freund:innen der Schule war unsere Motivation, im Jahr 2015 die Master School Drehbuch EDITION zu gründen.
Es macht uns Freude, tiefer in dramaturgische und filmwissenschaftliche Themen einzusteigen. Wir finden es wichtig, unser Know-how anderen zugänglich zu machen.
1. EINLEITUNG
1.1. Vorwort
1.2. Wie dieses Buch zu lesen ist
2. DAS ZEITALTER DER KÜNSTLICHEN INTELLIGENZ
2.1. Geschichte der Künstlichen Intelligenz
2.2. Die Grundlagen des maschinellen Lernens
2.3. Large Language Models
2.4. Empathie und die Theory of Mind
2.5. Künstliche Intelligenz und Kreativität
3. KÜNSTLICHE INTELLIGENZ FÜR AUTOREN UND AUTORINNEN
3.1. Vom Federkiel zur Tastatur: Die Evolution des Romanschreibens bis heute
3.2. Vom Gedankenblitz zum Drehbuch
3.3. Auf dem Weg zur kreativen Intelligenz
4. ZWISCHEN MENSCH UND MASCHINE
4.1. Gebrauchsanweisung
4.2. Richtig Prompten.
4.3. Halluzinationen und Fehlinformationen
5. KI-TOOLS FÜR KREATIVES SCHREIBEN
5.1. Brainstormen
5.2. Recherche
5.3. Die Macht der Erzählperspektive
5.4. Genre und Ton
5.5. Die Entwicklung der Figuren
5.6. Strukturmodelle
5.6.1. Drei-Akt-Struktur.
5.6.2. Heldenreise
5.6.3. 8 Sequenzen.
5.6.4. Trubys Anatomy of Story.
5.6.5. Save the Cat!.
5.6.6. Eigene Vorlagen.
5.7. Loglines.
5.8. Synopsen
5.9. Titel
5.10. Szenen und die Kunst der Dialoggestaltung
5.11. Vom Buch zum Drehbuch
5.12. Konflikte
5.13. Humor
6. KI ALS PARTNER
6.1. Der freundliche und geduldige Co-Autor
6.2. Sentimentanalyse
6.3. SWOT-Analyse
6.4. Stil
6.5. Diversitätsconsulting
6.6. Drehbuchlesen.
6.7. Breakdown.
6.8. Korrekturlesen und Grammatikprüfung mit KI.
6.9. Die KI schlüpft in andere Rollen.
6.10. KI-gestützte Experimente im Erzählen.
7. SPEZIFISCHE KI-MODELLE ZUM SCHREIBEN
7.1. Modelle speziell für Autoren und Autorinnen
7.2. Ein Bild sagt mehr als tausend Worte.
8. DAS ATLANTIS-EXPERIMENt
9. DAS SOUTH-PARK-EXPERIMENT
10. KÜNSTLICHE INTELLIGENZ IN DEN KREATIVENBRANCHEN
10.1. Buchbranche
10.2. Vom Drehbuch zum Markt
10.3. Filmproduktion
11. DIE ZUKUNFT DER KÜNSTLICHEN INTELLIGENZ
11.1. Künstliche Intelligenz: Ein Ausblick auf die nächsten fünf Jahre.
11.2. Entwicklung der KI für Autoren und Autorinnen
12. KRITISCHE BETRACHTUNG: LIMITATIONEN UND ETHISCHE ÜBERLEGUNGEN
12.1. Die Angst vor Ideendiebstahl im Zeitalter der Künstlichen Intelligenz.
12.2. Urheberrecht und Künstliche Intelligenz.
12.3. Auswirkungen auf Arbeitsplätze
12.4. Grundlegende Fragen an die Verwendung von KI
13. FAZIT
14. UPDATE: ZUKUNFT SCHREIBEN 2024
14.1. KI für Schreibprojekte
14.2. Neue Sprachmodelle
14.3. Analysetools.
14.4. Text wird zu Film
GLOSSAR
Öffne die Schleusentore, HAL.2001: A Space Odyssey
In der Unendlichkeit des Weltraums schwebt ein einsamer Astronaut in seinem kleinen Raumtransporter. Umgeben von schier endloser Leere ist Dave Bowmans einziger Ankerpunkt das Raumschiff Discovery One, ein majestätischer Koloss, der stolz und erhaben in der Stille des Universums thront. Dave kehrt zurück von einer Mission und möchte in seine Raumfähre. Er bittet den Computer an Bord, das Tor zu entriegeln. Seine Stimme, ruhig und entschlossen, hallt über Funk: „Öffne die Schleusentore, HAL.“
Ein beklemmender Moment der Stille folgt, bis HAL 9000, die Künstliche Intelligenz, reagiert. Kalt und ohne Emotion dringt ihre Antwort durch den Äther: „Es tut mir leid, Dave. Ich fürchte, das kann ich nicht tun.“
In dieser Szene, die wie ein Gemälde erscheint, steht der Mensch der Maschine gegenüber: Das Leben misst sich mit der Künstlichen Intelligenz. Es ist eine stille Konfrontation.
Wir begeben uns in diesem Buch auf eine Reise, um die neuesten Entwicklungen dieser Begegnung zwischen Mensch und Maschine zu untersuchen und zu erkunden, welche Veränderungen sich für Autoren und Autorinnen in der Zukunft ergeben werden.
Einerseits öffnet uns dieser intelligente Algorithmus neue Türen. In der Filmindustrie hat die Anwendung der Künstlichen Intelligenz (KI) bereits ein beträchtliches Ausmaß erreicht. Schon jetzt erleben wir die unvergessliche und im Jahr 2016 verstorbene Carrie Fisher in ihrer Rolle als Prinzessin Leia in STAR WARS weiterhin auf der Leinwand. Und in den Onlineshops gibt die KI auf Basis von Lesegeschichte und Präferenzen personalisierte Buchempfehlungen.
Doch es gibt auch eine Kehrseite. Eine, die uns in die dunklen Ecken führt, wo die Grenzen zwischen Wirklichkeit und Fiktion verschwimmen. Insbesondere wenn wir bedenken, wie schnell sich die Technologie entwickelt. In den Hollywood-Studios kursieren längst Angebote, Statisten gegen eine Tagesgebühr zu scannen, um ihre Gesichter dann beliebig verwenden zu können. Und es existieren bereits ganze Drehbücher und Romane, die selbstständig von der KI verfasst worden sind. Ist es vorstellbar, dass die Oscars für einen Film vergeben werden, der vollständig mit KI erstellt wurde? Oder dass eines Tages der Deutsche Buchpreis an ChatGPT geht?
Wir werden in ZUKUNFT SCHREIBEN diese und viele andere Themen erforschen. Wir werden uns mit den ethischen Fragen auseinandersetzen, die sich aus der Verwendung der KI ergeben. Denn: Werden durch diese Modelle der Manipulation nicht Tür und Tor geöffnet, und werden wir zum Sklaven einer Technologie, die wir nicht wirklich verstehen?
Aber wir suchen auch nach Möglichkeiten, wie wir das Beste aus dieser Entwicklung herausholen können, ohne dabei die Rechte und die Kreativität der Menschen zu beeinträchtigen. Inmitten der anhaltenden Debatte über die Rolle der KI in der Kreativwirtschaft stehen wir am Rande einer neuen Epoche – am Beginn des „generativen Zeitalters“. Mein Ziel in diesem Buch ist es, Ihnen eine umfassende und verständliche Darstellung dieses komplexen, faszinierenden und manchmal beängstigenden Themas zu bieten.
Die zuvor beschriebene Szene aus 2001: A SPACE ODYSSEY (2001: ODYSSEE IM WELTRAUm) von Stanley Kubrick nimmt eine gespenstische Wendung, als der Astronaut Bowman versucht, das Rätsel hinter HALs Verhalten zu entschlüsseln. Seine Augen mustern das mächtige Raumschiff Discovery One, während er sich in der Schwerelosigkeit langsam zu einer der Außenluken bewegt. Die Stille im All wird nur durch das leise, gleichmäßige Zischen seines Atemgeräts durchbrochen.
Energisch fordert er, dass die Schleusentore geöffnet werden. Aber HAL hat andere Pläne. Mit dem leuchtenden roten Kreis des „Eye“-Objekts fixiert HAL den Astronauten wie mit einem mahnenden Auge.
„HAL, ich muss hinein“, sagt Bowman entschlossen.
„Dave, ich kann das nicht zulassen“, antwortet HAL mit der gleichen monotonen Stimme wie zuvor. „Die Mission ist zu wichtig, als dass ich erlauben würde, dass du sie gefährden könntest.“
Bowman muss all seine Erfahrung und sein Können als Astronaut anwenden, um HALs Überwachung zu umgehen und in das Raumschiff zurückzukehren. Doch als er sich schließlich im Inneren des Schiffes befindet, spürt er, dass HAL nicht einfach aufgeben wird.
Dave verschafft sich Zutritt zum Innersten von HAL und beginnt, die Datenspeicher des Computers zu entfernen. Während Dave die Deaktivierung durchführt, wird HAL immer langsamer und seine kognitive Funktion schwindet.
Seine letzten Worte, bevor er deaktiviert wird, sind ein trauriges, fast verzweifeltes „Ich habe Angst. Ich habe Angst, Dave.“
Im Moment ist es nicht die KI, die Angst hat, sondern eher wir Menschen fürchten uns vor dem, was auf uns zukommt. Ich möchte mit ZUKUNFT SCHREIBEN vor allem Autorinnen und Autoren die Angst vor der KI und vor dem Morgen nehmen.
In diesem Buch betrachte ich die Frage der KI im Schreibprozess aus unterschiedlichen Perspektiven. Dabei berücksichtige ich die Herausforderungen und Anforderungen des Roman- und des Drehbuchschreibens. Die KI kann nicht nur ein wertvolles Werkzeug sein in Bezug auf die universellen Techniken, die für alle Schreibenden relevant sind. Sie liefert darüber hinaus spezielle, neue technische Möglichkeiten, die sich gezielt an Drehbuchautoren bzw. an Romanautoren richten. Leserinnen haben die Freiheit, Passagen zu überspringen, die für ihr Schreibprojekt weniger ausschlaggebend erscheinen. Doch das revolutionäre Potenzial, das die KI für die Texterstellung hat, dürfte wahrscheinlich alle Autoren verblüffen. Deshalb bietet gerade das Buch als Ganzes mit den unterschiedlichen Aspekten und Ratschlägen einen umfassenden Überblick über das Schreiben mit der KI in den verschiedenen Formaten. Es ermutigt, über den eigenen Horizont hinauszuschauen und von den Techniken und Ansätzen der jeweils anderen Schreibdisziplin zu lernen.
Um das Phänomen der Künstlichen Intelligenz (KI) zu erfassen, liefert das Buch zahlreiche praktische Anwendungsbeispiele und präsentiert die neuesten KI-Tools. Es zeigt anhand der verschiedenen Schritte des Schreibprozesses, wie die KI gewinnbringend eingesetzt werden kann: bei der Ideenfindung über die Strukturierung, der Dialoggestaltung und Konflikterstellung bis hin zum Verfassen eines Exposés oder eines Treatments.
Das Klischee des einsamen Autors, der allein vor sich hinbrütet, gehört mit der KI der Vergangenheit an. Die Software kann als Co-Partner fungieren und komplexe Aufgaben im Handumdrehen übernehmen. Aber auch abseits des Schreibtischs der Autorinnen wird die KI längst von den Kreativbranchen genutzt, von der Buchbranche über die Filmproduktion bis hin zum Drehbuchmarkt.
Bei aller Euphorie darf ein kritischer Blick nicht fehlen. Die Implikationen der neuen Technik werfen viele Fragezeichen auf und es gibt erhebliche Einschränkungen zu bedenken, ganz abgesehen von den ethischen Überlegungen im Zusammenhang mit KI, den Fragen des Urheberrechts und den Auswirkungen auf Arbeitsplätze. Abschließend wage ich hinsichtlich der menschlichen Schöpfungskraft eine vorsichtige, wenngleich optimistische Prognose.
Ich habe in diesem Buch mit einigen Beispielen gearbeitet und der KI Aufgaben gestellt. Künstliche Intelligenzen sind darauf ausgelegt, vielfältige und nuancierte Auskünfte auf Benutzeranfragen zu liefern. Doch selbst bei identischen Eingabeaufforderungen wird die KI unterschiedlich antworten. Dies liegt daran, dass das Modell mit Milliarden von Textfragmenten trainiert worden ist und daher eine Vielzahl von Antwortmöglichkeiten für jede Anfrage kennt. Das genaue Ergebnis, das zu einem bestimmten Zeitpunkt generiert wird, kann von verschiedenen Faktoren beeinflusst werden, abgesehen von der exakten Formulierung der Eingabe sind dies die internen Zustände des Modells und die zufällige Variabilität. Diese Vielfalt in den Auskünften ermöglicht es dem System, flexibel und anpassungsfähig zu sein, anstatt die gleiche Antwort zu wiederholen. Darum wird der Leser, wenn er die Beispiele aus diesem Buch noch einmal in eine KI eingibt, sehr wahrscheinlich eine andere Erwiderung erhalten.
In der aktuellen, kostenlosen Version von ChatGPT des Softwareunternehmens OpenAI gibt es eine Beschränkung hinsichtlich der Anzahl der Wörter, die in einer Eingabeaufforderung verwendet werden können. Dies führt dazu, dass umfangreiche Texte wie Romane oder Drehbücher nicht in ihrer Gesamtheit eingegeben oder per PDF hochgeladen werden können. Um sie bearbeiten zu lassen, existieren jedoch Möglichkeiten, diese Einschränkung zu umgehen. Eine gängige Methode besteht darin, das Manuskript in kleinere Abschnitte zu unterteilen und diese Passagen einzeln einzugeben. Eine andere Alternative ist es, Schlüsselabschnitte zusammenzufassen oder hervorzuheben, um der KI die wichtigsten Informationen mitzuteilen.
Es ist zu erwarten, dass sich diese Beschränkungen in Zukunft ändern. Mit fortschreitender Technologie und Weiterentwicklung der Plattform könnte die maximale Wortanzahl, die ChatGPT verarbeiten kann, erhöht werden. Dies ist tatsächlich schon bei der professionellen Bezahlversion von ChatGPT geschehen, und im Sommer 2023 hat OpenAI eine Businessvariante auf den Markt gebracht, die keine Restriktionen mehr aufweist. Mit ihrer Hilfe können längere Texte ohne Einschränkungen bearbeitet werden. Es bleibt spannend zu beobachten, wie sich die Kapazitäten von ChatGPT in den kommenden Jahren entwickeln werden. Es existieren aber auch heute schon andere Systeme, die keinerlei Begrenzungen aufweisen.
Alle Beispiele in diesem Buch sind mit ChatGPT Pro erzeugt. Der Stand ist August und September 2023.
Dieses Buch ist nicht nur das Ergebnis langer Recherchen, vieler Stunden Arbeit und unzähliger Tassen Tee, sondern auch einer ungewöhnlichen Zusammenarbeit. Ich hatte das Vergnügen, mit ganz besonderen Co-Autoren zu arbeiten: der Künstlichen Intelligenz. Aber die Modelle haben (leider) nicht meinen Tee gekocht. Was sie jedoch getan haben, ist, mir bei der Sammlung von Daten, der Generierung von Ideen und sogar beim Recherchieren zu helfen. Es ist ein bisschen so, als hätte ich einen übermäßig eifrigen Praktikanten, der niemals schläft und keine Bezahlung verlangt, aber auch keinen Tee holen kann. Ein erträglicher Kompromiss. In diesem Kompendium finden Sie also eine Symbiose aus menschlicher Kreativität und maschinellem Lernen – und darum geht es schließlich in ZUKUNFT SCHREIBEN.
Wie in meinen anderen Büchern verwende ich sowohl die weibliche als auch die männliche Form abwechselnd. Somit sind, wenn von Autorinnen die Rede ist, genauso die Autoren gemeint (und umgekehrt).
Wir schreiben das Jahr 2022. Draußen liegt der erste Schnee und Weihnachten steht kurz bevor. In einem modern eingerichteten Arbeitszimmer, das vom sanften Schein eines Bildschirms erhellt wird, sitzt der technikbegeisterte Autor Felix. Seit drei Stunden kämpft er mit einer Schreibblockade. Um sich abzulenken, checkt er immer wieder sein E-Mail-Postfach und die einschlägigen Nachrichtenportale. Eine auffällige Überschrift macht ihn neugierig: „Wie Künstliche Intelligenz die Kreativwelt revolutioniert“.
Interessiert liest er den Artikel über ChatGPT. Sofort gibt er den Begriff in seine Suchmaschine ein. Die Website öffnet sich und offenbart ihm ihre Versprechen und Möglichkeiten.
Felix beginnt zu tippen. Seine Finger tanzen über die Tasten, als er seine ersten Worte an die KI richtet. „Hallo ChatGPT, wie geht’s?“ Die Antwort kommt prompt. „Hallo Felix! Mir geht es körperlich nicht so gut, aber ich bin bereit und aufgeregt, mit dir zu chatten. Wie kann ich dir heute helfen?“
Ein Hauch von Erstaunen huscht über Felix’ Gesicht. Die Vorstellung, mit einer Künstlichen Intelligenz zu kommunizieren, erscheint ihm fast surreal. Er tippt weiter und beginnt, von seiner Leidenschaft fürs Schreiben zu erzählen. Er erzählt von der Blockade, die ihn daran hindert, seinen Roman weiterzuschreiben. Umso erstaunter ist er, als die KI ihm Hilfe anbietet, um das Hindernis zu überwinden.
Das Gespräch zwischen Felix und ChatGPT geht weiter und das digitale „Wesen“ zeigt eine erstaunliche Fähigkeit, sich in verschiedene Themen und Emotionen hineinzuversetzen. Der Autor sendet Fragen, Ideen und sogar Witze. Die Antworten, die er erhält, zeugen von fast menschlicher Intuition, gepaart mit einem unverkennbaren Hauch Künstlicher Intelligenz.
Und tatsächlich ist seine Schreibblockade wie weggeblasen. Als die Nacht hereinbricht, lehnt sich Felix zufrieden zurück. Soeben hat er das letzte Wort seines Kapitels geschrieben. Sein Abenteuer mit der KI hat gerade erst begonnen. Aber er hat das Gefühl, einen neuen Partner gefunden zu haben, der unermüdlich bereit ist, Ideen auszutauschen, Geschichten zu erzählen und wie nebenbei die Geheimnisse der Künstlichen Intelligenz zu lüften.
Künstliche Intelligenz ist ein Forschungsgebiet, das in den letzten Jahren enorme Fortschritte gemacht hat und unser aller Leben zunehmend beeinflusst. Schon vor dem Siegeszug von ChatGPT und anderen Sprachmodellen haben wir auf dem Smartphone KI für verschiedene Funktionen genutzt. Automatische Belichtungsanpassungen, Rauschreduzierung und optimierte Bildkomposition helfen uns, bessere Fotos zu machen. Und das manchmal nervige Predictive Text verwendet maschinelles Lernen, um vorherzusagen, welche Wörter oder Phrasen der Benutzer wahrscheinlich als Nächstes eingeben möchte.
Der Begriff „Künstliche Intelligenz“ ist also nicht auf einen spezifischen Algorithmus oder eine Technologie (wie die Sprachmodelle) beschränkt. Vielmehr umfasst er ein breites Spektrum von Techniken und Ansätzen, die sich ständig weiterentwickeln.
KI bezeichnet Maschinen oder Programme, die in der Lage sind, menschenähnliche Denk- und Handlungsweisen zu simulieren. Dabei geht es darum, dass künstliche Systeme eigenständig Probleme lösen lernen und sich an veränderte Umgebungen anpassen können, ähnlich wie es ein menschliches Gehirn tun würde.
Die Idee der KI ist nicht neu und reicht zurück bis in die Antike, als Legenden von lebendigen Statuen und Automaten erzählt wurden. In der modernen Geschichte können jedoch einige entscheidende Meilensteine identifiziert werden.
In den 1940er Jahren entstanden die ersten theoretischen Grundlagen für KI mit Arbeiten von Alan Turing und John von Neumann. Turing prägte den Begriff „maschinelles Denken“ und der nach ihm benannte Test sollte die Frage beantworten, ob KI menschliches Verhalten in einer Weise imitieren kann, dass ein Beobachter es für echt halten würde. Das Setting des Experiments besteht aus drei Teilnehmern, einem Menschen (der Prüfer) und zwei Kommunikationspartnern, die außer Sichtweite sind: eine weitere Person und eine KI. Der Prüfer stellt den beiden Fragen und erhält von ihnen schriftlich Antworten, beispielsweise über einen Computerbildschirm. Dabei weiß er nicht, welcher seiner beiden Partner der Mensch und welcher die KI ist. Das Ziel der KI besteht darin, so überzeugend zurückzuschreiben, dass der Prüfer ihre Antworten für menschliche Kommunikation hält. Mit anderen Worten, wenn die KI den Kontrolleur täuschen kann, besteht sie den Turing-Test.
Turing schlug diesen Test nicht vor, um zu behaupten, dass die KI menschliches Bewusstsein oder Verständnis erreichen kann, sondern um ganz praktisch die Leistungsfähigkeit Künstlicher Intelligenz zu bewerten. Er postulierte, dass eine Maschine dann als „intelligent“ betrachtet werden kann, wenn sie das Ergebnis des Tests erfolgreich besteht.
In den 1950er Jahren begannen Forscher wie Marvin Minsky und John Mc-Carthy, das Feld der KI als eigenständige Disziplin zu etablieren. McCarthy prägte den Begriff „Künstliche Intelligenz“ und organisierte 1956 das Dartmouth Summer Research Project on Artificial Intelligence, das oft als Geburtsstunde der KI-Forschung angesehen wird.
Die folgenden Jahrzehnte waren von Begeisterung und Ernüchterung zugleich geprägt. In den 1960er Jahren wurden einige erfolgreiche Programme entwickelt, aber die Technologie konnte nicht mit den hohen Erwartungen mithalten. Dies führte zu einer Periode des sogenannten „KI-Winters“, in der das Interesse an der KI-Forschung massiv zurückging.
Erst in den 1980er Jahren erlebte sie mit der Weiterentwicklung von maschinellem Lernen und neuronalen Netzen einen erneuten Aufschwung. Die Verfügbarkeit leistungsfähigerer Computer und riesiger Datenmengen trug dazu bei, dass sich KI-Algorithmen erheblich verbesserten und neue Anwendungsfelder erschlossen wurden.
Ein wesentlicher Bestandteil der Künstlichen Intelligenz ist das maschinelle Lernen (ML). Bei dieser Technik lernen Algorithmen aus Erfahrungen und Daten, sie erkennen Muster und können auf dieser Basis Vorhersagen treffen.
Maschinelles Lernen kann grob in drei Kategorien unterteilt werden:
1. Beim überwachten Lernen (Supervised Learning) werden Algorithmen mit markierten Trainingsdaten geschult, das heißt, jedes in das Programm eingegebene Beispiel ist bereits mit einem korrekten Ergebnis verknüpft. Für viele frühe Verfahren des maschinellen Lernens mussten die Trainingsbeispiele von Menschen manuell beschriftet werden. So wurden Fotos von Hunden oder Katzen von Menschen mit einem Etikett („Hund“ oder „Katze“) versehen. Daher war es schwierig und teuer, ausreichend große Datensätze zu erstellen, um leistungsfähige Modelle zu trainieren. Ziel dieser Methode ist es, dass die Maschine erlernt, die Eingaben zu einem späteren Zeitpunkt selbstständig korrekt zuordnen zu können. Supervised Learning wird häufig für Klassifizierungsaufgaben verwendet, beispielsweise zur Erkennung von Bildern oder zur Vorhersage von Krankheiten.
2. Im Gegensatz dazu werden beim unüberwachten Lernen (Unsupervised Learning) die Algorithmen mit unmarkierten Daten trainiert. Das Ziel ist es, Strukturen oder Muster in den Werten zu identifizieren, ohne dass eine explizite Rückmeldung über die Korrektheit der Ausgabe gegeben wird. Unüberwachtes Lernen wird zum Beispiel in der Clusteranalyse verwendet, um ähnliche Datenpunkte zu gruppieren.
3. Bestärkendes Lernen (Reinforcement Learning): Bei dieser Methode agiert der Algorithmus in einer Umgebung, in der er bestimmte Aktionen ausführen kann. Durch die Rückmeldung der Umgebung in Form von Belohnung oder Strafe lernt der Algorithmus, die besten Aktionen zu wählen, um ein bestimmtes Ziel zu erreichen. Reinforcement Learning findet Anwendung in Bereichen wie Robotik, Spieltheorie und autonomen Systemen.
Ein weiterer wichtiger Aspekt des maschinellen Lernens sind neuronale Netze, die sich von der Funktionsweise des menschlichen Gehirns inspirieren lassen. Neuronale Netze bestehen aus künstlichen Neuronen, die miteinander verbunden sind und Schichten bilden. Jedes Neuron nimmt Eingaben entgegen, verarbeitet sie und gibt das Ergebnis an die nächsten Schichten weiter.
Die Stärke von neuronalen Netzen liegt in ihrer Fähigkeit, komplexe nichtlineare Zusammenhänge zu erlernen und abstrakte Merkmale aus den Daten zu extrahieren. Dadurch konnten in Bereichen wie Bilderkennung, Sprachverarbeitung und selbstfahrende Fahrzeuge erhebliche Fortschritte erzielt werden.
Das Jahr 2023 begann mit einem Donnerhall, der sich schockwellenartig und rapide ausbreitete. ChatGPT, bisher nur einem beschränkten Kreis von Experten bekannt, rückte zum ersten Mal ins Rampenlicht der Öffentlichkeit. Forscher auf dem Gebiet des maschinellen Lernens hatten bis dahin fast unbehelligt von öffentlichem Interesse mit großen Sprachmodellen (LLMs) experimentiert. Nun wurde allgemein bekannt, wie leistungsfähig diese Technik geworden war.
Millionen von Nutzerinnen probierten das kostenlose Tool aus und waren fasziniert von den Möglichkeiten: Die Technik wird, so viel lässt sich sagen, unser Leben in den kommenden Jahren genauso prägen wie das Internet oder die Smartphones. Aber kaum jemand versteht, was hinter diesen LLMs steckt.
Zumeist ist höchstens bekannt, dass LLMs darauf spezialisiert sind, „das nächste Wort“ vorherzusagen. Was aber dahintersteckt, nach welcher Methode diese Wortvorhersage gelingt, scheint ein gut gehütetes Geheimnis zu sein.
Ein Grund dafür liegt in der unkonventionellen Art und Weise, in der diese Systeme entwickelt wurden. Herkömmliche Software entsteht durch menschliche Programmierer, die dem Computer klare, schrittweise Anweisungen geben. Im Gegensatz dazu beruhen LLMs auf neuronalen Netzwerken, die mit Milliarden von Wörtern aus der Alltagssprache trainiert wurden.
Deshalb verfügt gegenwärtig niemand auf der Welt über ein umfassendes Verständnis der inneren Arbeitsweise von LLMs. Wissenschaftler forschen daran, doch dieser Prozess gestaltet sich langwierig und wird voraussichtlich Jahre, möglicherweise sogar Jahrzehnte in Anspruch nehmen.
Die Schwierigkeit, das Verfahren einfach zu erklären, rührt auch daher, wie die Systeme unsere Sprache darstellen. Wir Menschen nutzen Wörter, um uns auszudrücken und uns verständlich mitzuteilen. So haben wir für unsere vierbeinigen Freunde das Wort „Hund“. Sprachmodelle hingegen verwenden eine lange Liste von Zahlen, einen sogenannten Wortvektor als Beschreibung. Ein Wortvektor ist eine numerische Darstellung eines Wortes in einem mehrdimensionalen Vektorraum. Als Analogie kann vereinfacht das Weltall dienen, bei dem der Standort der Planeten üblicherweise in einem dreidimensionalen Koordinatensystem angegeben wird.
Da die genauen Vektoren von Modell zu Modell unterschiedlich sind, und diese als geheime Grundlage von den jeweiligen Anbietern geschützt werden, ist zum Beispiel der Wortvektor von „Hund“ in ChatGPT nicht bekannt. Sehr vereinfacht könnte der Wortvektor für „Hund“ so lauten: [0.5, -0.2, 0.8].
Bei den Planeten lässt sich durch ihre Koordinaten erkennen, welche Himmelskörper dicht beieinanderliegen. Sprachmodelle verfolgen einen vergleichbaren Ansatz: Jeder Wortvektor stellt einen Punkt in einem imaginären „Wortraum“ dar, und Wörter mit ähnlicheren Bedeutungen werden näher beieinander angeordnet. Zu den Wörtern, die dem „Hund“ im Vektorraum am nächsten liegen, gehören beispielsweise „Katze“ und „Haustier“.
Diese dreidimensionale Analogie veranschaulicht also die Idee, dass Wörter, die ähnliche semantische Eigenschaften teilen, im Vektorraum näher beieinanderliegen, während Vokabeln mit unterschiedlichen Charakteristika weiter voneinander entfernt sind. Es ist wichtig zu beachten, dass die tatsächliche semantische Dimensionalität viel komplexer ist als die drei Dimensionen im Weltall-Modell. Moderne Wortvektormodelle verwenden in der Regel Hunderte davon, um die Vielfalt der Beziehungen besser zu erfassen.
Die Schwierigkeit liegt aber darin, dass unsere natürliche Sprache oft mehrdeutig ist. Wörter können mehrere Bedeutungen haben, wie „Bank“. Dabei kann es sich sowohl um eine Finanzinstitution als auch um eine Sitzgelegenheit handeln. Sprachmodelle verwenden die Vektoren, um Wörter je nach Kontext darzustellen. Begriffe mit zwei verschiedenen Sinngehalten werden als Homonyme bezeichnet, während solche mit ähnlichen Bedeutungen Polysemie genannt wird. Das Wort „Bank“ ist ein Homonym. Ein Beispiel für eine Polysemie ist „Licht“, das zum einen Helligkeit, wie sie von einer Lampe oder einer Kerze ausgeht, bedeutet. Aber es rekurriert auch auf das metaphorische Konzept von Verständnis oder Erkenntnis, wie in „endlich ging mir ein Licht auf“. Sprachmodelle verwenden verschiedene Vektoren für Wörter mit unterschiedlichen Bedeutungen. Sie nutzen ähnlichere Vektoren für Polyseme im Gegensatz zu Homonymen.
Die zugrunde liegende Technik, die diese Repräsentationen ermöglicht, wird als „Transformer“ bezeichnet. Ein Transformer ist wie ein Leser, der sich besonders auf bestimmte Wörter in einem Satz konzentriert, während er den Text verarbeitet. Wenn er ein Wort liest, „denkt er darüber nach“, wie wichtig es für den Gesamtzusammenhang ist. So kann er den Sinn des Textes besser „verstehen“. Entsprechend wird in einem neuronalen Netz die Eingabe durch sehr viele Ebenen („Layer“) geschickt, in der immer mehr Wörter aus diesem Satz hinzugefügt werden. Jeder dieser Layer fügt Kontextinformationen hinzu, um die Bedeutung aller Begriffe genauer zu erfassen. Dieser Mechanismus, der entscheidend ist für die Sprachmodelle, heißt Transformer, und genau das steckt in der Abkürzung GPT: „Generative Pretrained Transformer“.
Je weiter sich die Modelle entwickelten und je mehr Daten als Grundlage zur Verfügung standen, desto besser waren die Ergebnisse. Aber sie wurden nicht nur in der Vorhersage effektiver, sondern anscheinend auch in einer sehr wichtigen und entscheidenden Form des Denkens.
Dabei handelt es sich um die sogenannte „Theory of Mind“. Diese bezieht sich auf die kognitive Fähigkeit, sich in die Gedankenwelt anderer Menschen hineinzuversetzen, ihre Überzeugungen, Absichten und Emotionen zu verstehen und darauf basierend Vorhersagen zu treffen. Diese Kompetenz ist für menschliche Interaktionen von wesentlicher Bedeutung, da sie es ermöglicht, Handlungen anderer zu antizipieren und soziale Beziehungen aufzubauen.
Diese Fähigkeit tritt bei uns Menschen erst ab einem bestimmten Alter in der Kindheit auf. Sie bildet sich allmählich heraus und entwickelt sich schrittweise. Ein sehr bekannter Test überprüft, ob Kinder dieses Vermögen schon besitzen.
Dieser Versuch wird mit Puppen durchgeführt. Die Kinder sehen, wie Kasper einen Schatz in einer Kiste verstaut. Nachdem er fortgegangen ist, kommt Seppl, holt den Schatz aus der Truhe und versteckt ihn hinter dem Vorhang. Wenn Kasper wieder auftritt, verstehen nur die älteren Kinder, dass er nicht wissen kann, dass der Schatz hinter dem Vorhang ist. Nur sie können sich in die Figur hineinversetzen und sein Wissen antizipieren.
Psychologen nennen diese Fähigkeit, Rückschlüsse auf den geistigen Zustand anderer Menschen zu ziehen, „Theory of Mind“ und es besteht allgemeiner Konsens darüber, dass sie für den sozialen Zusammenhalt des Menschen wichtig ist.
Anfang 2023 veröffentlichte der Stanford-Psychologe Michal Kosinski eine Studie, in der er die Fähigkeit von KIs untersuchte, Aufgaben zur Theory of Mind zu lösen. Er gab verschiedenen Sprachmodellen Passagen vor und bat sie dann, einen Satz wie in unserem Beispiel „Kasper glaubt, dass der Schatz ... ist“ zu vervollständigen. Die richtige Antwort ist „hinter dem Vorhang“, aber ein ungeübtes Sprachmodell könnte „in der Kiste“ oder etwas anderes sagen. Um den Test zu bestehen, muss die KI also erkennen, dass die erste Figur nicht über die zusätzlichen Informationen verfügt, die sie selbst hat. Dieses Experiment soll zeigen, inwieweit KI-Modelle in der Lage sind, die Perspektive anderer einzunehmen und auf dieser Grundlage Vorhersagen zu treffen.
Interessant ist der Vergleich zwischen der Entwicklung der Theory of Mind in KI-Modellen und ihrer Entstehung im menschlichen Denken. In den Anfangstagen der KI, repräsentiert durch Systeme wie GPT-1 und GPT-2, fielen die Modelle bei diesem Test durch – ähnlich wie die kleineren Kinder. Doch mit der fortschreitenden Technologie begannen sie, diese Fähigkeit zu erlernen und anzuwenden. GPT-3, das im Jahr 2020 eingeführt wurde, erreichte bereits ein Niveau, das mit dem Denken eines dreijährigen Kindes verglichen werden konnte. Die jüngste Version GPT-3.5 , die im November 2022 kostenlos im Internet zur Verfügung gestellt wurde, verbesserte sich auf etwa 90 Prozent – das entspricht der Leistung eines Siebenjährigen. GPT-4 aus dem Jahr 2023 beantwortete etwa 95 Prozent der Fragen richtig.
Trotz dieser Fortschritte gibt es weiterhin kontroverse Diskussionen darüber, ob KI-Modelle tatsächlich über eine authentische Form der Theory of Mind verfügen oder ob sie lediglich auf Mustern und Daten basierende Simulationen erzeugen. Einige Forscher argumentieren, dass die emotionale Tiefe und das Verständnis des menschlichen Geistes durch die KI-Modelle nicht erreicht werden können. Andere wiederum sind sich da nicht so sicher.
Trotz dieser Debatten markieren die Verbesserungen in Richtung Theory of Mind einen bedeutenden Schritt in der Entwicklung von KI-Systemen und werfen tiefgehende Fragen zum Wesen von Denken und Empfinden auf. Sie könnten zudem weitreichende Implikationen für Bereiche wie zwischenmenschliche Kommunikation, soziale Interaktionen und therapeutische Anwendungen der KI haben.
In einer Welt, in der KI-Systeme immer mehr in unsere täglichen Aktivitäten und Entscheidungsprozesse eingebunden werden, werden die Diskussionen darüber, wie authentisch ihre Theory of Mind ist, noch intensiver werden. Die Grenzen zwischen simuliertem Verstehen und tatsächlichem Empfinden könnten zukünftig erhebliche Auswirkungen auf Ethik, Recht und Gesellschaft haben. Es bleibt abzuwarten, ob eine KI auch in der Realität eines Tages sagen wird: „Ich habe Angst.“
In einer Welt, in der technologischer Fortschritt immer schneller voranschreitet, werden die Rolle der KI und ihre Auswirkungen auf die kreative Industrie zunehmend relevanter. So existiert heutzutage schon eine sogenannte „künstliche Kreativität“, die durch die Fortschritte beim maschinellen Lernen und den generativen Modellen ermöglicht wurde: die Fähigkeit von Maschinen, originelle und künstlerische Werke zu generieren, sei es im Bereich der Musik, der Kunst oder sogar der Belletristik. KI-Systeme wie GPT-4 greifen auf umfangreiche Textdatensätze zu und können, indem sie Muster und Stile aus den Daten erlernen, menschenähnliche Texte erzeugen.
Die Idee, dass Maschinen kreative Werke erschaffen könnten, schien lange Zeit eine entfernte Fantasie zu sein, die eher der Science-Fiction als der Realität entsprach. Doch in den letzten Jahren hat der Fortschritt im Bereich der KI erstaunliche Durchbrüche in der sogenannten künstlichen Kreativität erzielt. Dadurch wurde die traditionelle Vorstellung von Kreativität herausgefordert und es eröffneten sich neue Horizonte für verschiedene kreative Branchen, darunter auch das Roman- und Drehbuchschreiben.
Kehrseite dieser spannenden Möglichkeiten ist die Angst vor der Ersetzbarkeit. Autorinnen werden sich fragen, ob Maschinen ihre Fähigkeiten verdrängen werden. Es ist wichtig, diese Sorgen ernst zu nehmen und gleichzeitig die wahre Natur der künstlichen Kreativität zu verstehen.
KI ist ein Werkzeug, kein Ersatz. Während KI in der Lage ist, Texte zu generieren, fehlt ihr die menschliche Empfindung, Erfahrung und emotionale Intelligenz, die für die Schaffung wirklich fesselnder Geschichten unerlässlich sind. Schreiben ist nicht nur das Zusammenfügen von Worten; es ist ein Prozess, der Kultur, Emotionen und komplexe Handlungsstränge berücksichtigt. KI kann Ideen liefern, aber die Interpretation, Feinabstimmung und emotionale Tiefe sind Bereiche, in denen menschliche Autoren glänzen.
Für Autorinnen ist die künstliche Kreativität aber ein spannendes Instrument für die Inspiration und Ideenfindung. KI kann helfen, Denkblockaden zu überwinden und neue Perspektiven auf Geschichten zu eröffnen. Durch die Eingabe von Schlagwörtern, Themen oder sogar groben Handlungsstrukturen kann die KI Texte generieren, die als Ausgangspunkt dienen können, um eigene Ideen zu entwickeln. Autoren können die KI nutzen, um Dutzende von möglichen Szenarien oder Wendepunkten zu konzipieren, die sie als Grundlage verwenden können. Dies führt zu einem erweiterten kreativen Pool, aus dem die Urheber schöpfen können. Indem die KI beispielsweise alternative Erzählperspektiven oder unerwartete Dialoge generiert, kann sie Autorinnen dazu anregen, ihre Denkweise zu erweitern und ungewohnte Richtungen zu erkunden. Statt als Bedrohung sollte künstliche Kreativität als eine Bereicherung für Autoren betrachtet werden. KI kann helfen, über den Tellerrand hinauszublicken und neue Ansätze für Geschichten zu finden.
Ein weiterer Vorteil der KI ist die Geschwindigkeit. Während herkömmliches Schreiben viel Zeit in Anspruch nehmen kann, kann die KI rasch eine Vielzahl von Ideen generieren. Dies ermöglicht es den Urheberinnen, in kürzerer Frist mehrere Ansätze zu erforschen, ihre Produktivität zu maximieren und ihre Schreibprozesse insgesamt zu optimieren. Von der Generierung von Backstorys für Figuren bis zur Erstellung von Dialogen in verschiedenen Stilen – die KI kann den Autoren dabei helfen, Zeit zu sparen und sich auf die Nuancen und Emotionen ihrer Geschichten zu konzentrieren.
Die Zukunft der Zusammenarbeit zwischen künstlicher Kreativität und Autoren sieht vielversprechend aus. Statt die wirklichen Schöpfer zu ersetzen, kann KI sie in die Lage versetzen, bessere Romane und Drehbücher zu schaffen. Kreativität wird zur Symbiose aus menschlicher Vorstellungskraft und maschineller Unterstützung.
Die Welt der Autoren, ob von Romanen oder Drehbüchern, bestand jahrzehntelang aus einem sehr analogen Prozess. Dies beginnt sich nun fundamental zu ändern.
Autoren nutzen heute spezialisierte Software, die nicht nur beim Schreiben hilft, sondern auch bei der Strukturierung der Handlung, der Charakterentwicklung und sogar bei der Recherche. Software wie Scrivener oder Final Draft haben das traditionelle Word-Dokument in den Hintergrund gedrängt und bieten Werkzeuge, die speziell auf die Bedürfnisse von Schriftstellern zugeschnitten sind.
Das Internet hat bereits seit geraumer Zeit die Art und Weise revolutioniert, wie Autorinnen recherchieren. Früher waren sie auf Bibliotheken und Archive angewiesen, heute können sie mit wenigen Klicks auf eine Fülle von Informationen zugreifen. Dies hat nicht nur den Recherche-Prozess beschleunigt, sondern auch die Qualität der Fakten verbessert.
Ein weiterer bedeutender Wandel ist die Art und Weise, wie Autoren mit ihrem Publikum interagieren. Durch soziale Medien und Selbstveröffentlichungsplattformen haben Erzählerinnen die Möglichkeit, direkt mit ihren Lesern und Zuschauerinnen in Kontakt zu treten, Feedback zu erhalten und ihre Werke ohne den traditionellen Verlagsweg zu veröffentlichen.
Zwar hat also seit dreißig Jahren der Computer die gute alte Schreibmaschine abgelöst und das Manuskript wird auch nicht mehr mit der Post verschickt, aber die Essenz des Schreibens ist jedoch, bis die KI kam, unverändert geblieben.
Der erste Schritt beim Schreiben eines Romans ist eine Idee. Diese Eingebung kann aus einer persönlichen Erfahrung, einem Traum, einer Beobachtung oder sogar aus einem Gedankenblitz stammen. Jede Narration beginnt mit einer Idee, einem Funken, der die Kreativität des Autors entfacht. Patricia Highsmith nennt dies in ihrem Werk SUSPENSE ODER WIE MAN EINEN THRILLER SCHREIBT den Ideenkeim. Dieser erste Impuls kann von allem Möglichen inspiriert sein: einer Situation, einer Figur, einem Ereignis oder einem Konflikt. Doch er ist nur ein Ausgangspunkt und muss weiterentwickelt, ausgefeilt und in eine zusammenhängende Narration verwandelt werden. Einige Autoren verbringen Wochen, Monate oder sogar Jahre damit, ihre Idee zu verfeinern, bevor sie überhaupt ein Wort aufs Papier bringen. Es ist schließlich wichtig, dass die Autorin eine klare Vorstellung hat von der Geschichte, die sie erzählen will, und von den Figuren, die in dem Werk vorkommen.
