Grafik: TaTrung

So entstand unser Grusel-Guide

Von einem Team, das auszog, das Fürchten zu prompten

Es ist kein Geheimnis, junge Menschen lieben es sich zu gruseln. Ich glaube, es gibt keine relevante Zielgruppe für Horrorfilme, die die Altersgrenze von 35 überschritten hat. Auch ich war schon als Kind fasziniert von Vampiren, Werwölfen und Poltergeistern.

Grafik: TaTrung

Meine Deutschlehrerin in der zehnten Klasse überraschte ich mit einem Prüfungsaufsatz darüber, wie Stephen King die Beschreibung von absolut alltäglichen Dingen dazu nutzt, Gruselgestalten glaubwürdig und lebendig werden zu lassen. Ich liebte seine Bücher, und, um ehrlich zu sein, lese immer noch sehr gern alles, was der Meister auf den Markt bringt. Ich hätte nie gedacht, dass meine Sammlung an Gruselexperience mal in meinem Berufsleben eine entscheidende Rolle spielen könnte.

Bis zu diesem Frühjahr.

In unserem Kommunikationsteam diskutierten wir die Möglichkeiten von KI und sprachen darüber, wer mit welchen Tools welche Erfahrungen gemacht hatte. Wir hatten die ersten Workshops bereits hinter uns und arbeiteten an einer Strategie, wie wir KI-generierte Bilder in unsere Social-Media-Arbeit einfließen lassen. Schnell waren wir uns einig, dass wir gern ein KI-Projekt umsetzen wollen, am liebsten schnell, unkompliziert und mit einer steilen Lernkurve in der Anwendung für uns alle. Parallel arbeiteten wir an einer neuen Tour für unseren Audioguide und in einem Vortrag sprach ich darüber, wie modular unser Audioguide aufgebaut ist und das wir jederzeit neue Touren einstellen, variieren und einzelne Stücke austauschen können … Moment mal, da können wir schnell und unkompliziert … In meinem Kopf mergten der Audioguide und das noch unbekannte KI-Projekt zusammen und heraus kam die Idee eines Grusel-Audioguides. Wir würden einfach den bestehenden Audioguide von Chat GPT in eine Gruselversion umschreiben lassen und dann mittels Sprachsynthese in Audiostücke verwandeln. Und mit Blick auf den Kalender war klar: Perfekt, Ende Oktober ist Halloween, da launchen wir das Ganze.

Es stand relativ schnell fest, dass wir für die Texterstellung mit einem eigens dafür zugeschnitten GPT arbeiten wollen würden. Dieser „Creepy ReWriter“ wurde mit vier Grusellevel ausgestattet: Modus „Gruselige Geschichte“, „Mach diesen Text zu etwas, das Stephen King gefallen würde“, „Schreibe diesen Text im Stil von Black Mirror um“ und „Mache diesen Absatz zu einer Szene aus einem Hitchcock-Film“. Das letzte war ein Modus, der uns anfangs gar nicht geholfen hat, denn Chat GPT spuckte natürlich gleich komplette Drehbuchszenen aus, obwohl wir zunächst nur Text wollten.

Bitte einen Moment Geduld. Das Bild wird geladen.

Gleich vorweg: Das Textgenerieren hat viel länger gedauert, als wir gedacht hatten. Beim ersten Mal gab ich den kompletten Text der bestehenden Audiotour mit 22 Stationen ein und bekam ein weitaus kürzeres Textobjekt zurück, in dem nur am Anfang ein wenig rumgegruselt wurde, in der Mitte wurde einfach nur bestehender Text gekürzt. Das hieß, wir mussten jeden Text einzeln einspeisen, die verschiedenen Modi ausprobieren und auch alle Änderungswünsche immer über die Promptzeile einspeisen, denn alle Texte sollten komplett KI-generiert sein. Meine Kollegin Sara und ich arbeiteten parallel an den Texten, Sara mit einer großen Bewunderung für die Black-Mirror-Reihe, ich mit meiner tiefen Verbundenheit zu Stephen King, ich glaube, ich erwähnte es bereits.

Nebenbei suchten wir nach einem passenden Tool für die KI-basierte Stimmsynthese und entschieden uns für Eleven Labs. Im Grunde wird der Text in den Editor gepackt, eine Stimme ausgewählt und schon ist nach wenigen Minuten das Audiostück fertig.

Aber.

Das klingt dann noch nicht unbedingt gut. Die Stimmauswahl ist für die Deutsche Sprache überschaubar und richtig viele gruselige Stimmen gab es nicht. Mit den Einstellungen gelang es uns aber, eine passende, tiefe Erzählerstimme zu bauen. Auch das Einbauen einer zweiten Stimme ist unkompliziert, ihr macht einen Absatz pro Stimme, markiert den und weist die jeweils passende Stimme zu. Natürlich ist dann noch zu hören, dass unser Victor van Düster, der durch den Grusel Guide führt, manche Worte einfach nicht aussprechen kann – viel Spaß beim Entdecken der Fehler.

In Eleven Labs lassen sich auch Sounds generieren. Das ist ähnlich wie das Prompten von Bildern in Midjourney: einfach beschreiben, was zu hören sein soll, in welcher Atmosphäre und dann gibt es vier Sounds zur Auswahl. Sara hatte zuvor Chat GPT beauftragt, zu den entstandenen Stücken jeweils Vorschläge für die Sounds an der passenden Stelle zu machen und hat dann genau diese Sounds gepromptet. Aber insgesamt war es uns noch nicht rund genug und auch nicht gruselig genug. Wir haben also beide noch jede Menge Sounds nachgeneriert, z.B. das Atmen von Pilzwänden oder das Geräusch eines Stadtdschungels.

Am Ende haben wir alles selbst in Audition zusammengefügt, da wir keine KI gefunden hatten, die das für uns übernimmt. Und die Zeit wurde knapp, wir waren schon mitten im Oktober.

Bitte einen Moment Geduld. Das Bild wird geladen.

Alle Bilder, die ihr im Grusel Guide sehen könnt, sind mit Midjourney entstanden.

Was haben wir gelernt? Zuallererst hat es wirklich viel Spaß gemacht, diesen Grusel Guide entstehen zu lassen. Es war viel aufwendiger als gedacht und geplant (aber eben auch lustiger). Wir haben kein Tool gefunden, dass uns einen jeweiligen Arbeitsschritt komplett in sehr guter Qualität abgenommen hätte, wir mussten kleinteilig arbeiten. Kreativität ist nicht die allergrößte Stärke der genutzten Tools. Aber so, wie wir mit den KI-Tools dann gearbeitet haben, ist eine gute Audiotour entstanden, die wir ohne KI aus Ressourcengründen nicht umgesetzt hätten.

Wenn ihr über 14 seid, hört euch die Tour gern an. Wenn ihr in Berlin seid, kommt gern vorbei und holt euch die Sonderedition unseres Grusel-Nubis ab. Bis zum 4. November ist der Grusel Guide verfügbar, danach müsst ihr ein Jahr lang warten, bis Victor van Düster wieder durch die dunklen Seiten des Futuriums führt.

PS: Meint ihr, es lohnt sich eine englische Version für Stephen King?

Das Grusel-Guide-Team:

Idee und Konzept: Monique Luckas
KI-Texte und Sounds: Monique Luckas und Sara Oslislo mit Chat GPT und ElevenLabs
Schnitt: Sara Oslislo, Monique Luckas Clara Lichius mit Audition
KI-Bilder: Desirée Hennecke, Sara Oslislo, Monique Luckas mit Midjourney
CMS-Pflege: Ludmilla Ostermann, Sara Oslislo
Emotionaler Support: Ronny Beenen, Julia Ebeling, Nadja Mahler, Yasmin Zahn, Hannah Braun.

Das CMS des Audioguide wurde programmiert von FORK.