Audible Hörbücher mit künstlicher Intelligenz
Januar 31, 2024 Von Christian Gera

Audible-Hörbücher mit KI schöner ?

Audible-Hörbücher werden schon bald auch in Deutschland von künstlicher Intelligenz via Knopfdruck eingesprochen werden. Ist das gut? Oder schlecht? Macht das die Hörbuchsprecherwelt arbeitslos?

Fakt ist : Die faszinierende Symbiose von Literatur und gesprochenem Wort erlebt einen Wandel. Der die Hörbuchlandschaft in eine neue Ära führt bzw. führen soll.

Traditionelle Hörbuchsprecher, die mit ihrer kunstvollen Interpretation Geschichten lebendig werden lassen, treffen nun auf eine innovative Konkurrenz:

Die Künstliche Intelligenz (KI). Und die ist nun (zumindest schon in den USA) in der Lage, literarische Werke in akustische Meisterwerke zu verwandeln.

Dieser Blogartikel aus meiner Feder wirft einen Blick auf die aufregende Entwicklung bei Amazon, wo Indie-Autoren vor der Wahl stehen:

A) Ihre Geschichten entweder von menschlichen Sprechern oder

B) von synthetischen KI-Stimmen zum Leben erwecken zu lassen.

In einer Welt, in der Technologie und Tradition kollidieren, stellen wir die Frage: Wer wird das nächste Kapitel in der Hörbuchwelt schreiben – die einfühlsamen menschlichen Sprecher oder die kühle Präzision der Künstlichen Intelligenz?

Ich frage mich bei solchen „Vergleichen“ für die Zukunfsbranche Hörbuch immer: Was sind auf den jeweiligen Seite die Vorteile?

Was sind die Vorteile, wenn ein Mensch Bücher einspricht?

  1. Emotionale Tiefe und Ausdruck: Menschliche Sprecher können Emotionen authentisch vermitteln. Durch ihre Fähigkeit, Tonlage, Betonung und Pausen zu variieren, bringen sie die Gefühle der Charaktere und die Stimmung der Geschichte auf eine Weise zum Ausdruck, die von Künstlicher Intelligenz schwer nachgeahmt werden kann.
  2. Künstlerische Interpretation: Ein erfahrener Hörbuchsprecher kann eine künstlerische Interpretation der Geschichte liefern, die über bloßes Vorlesen hinausgeht. Durch das Hinzufügen persönlicher Nuancen und Stilelemente verleihen sie dem Hörer eine einzigartige Perspektive, die das Hörerlebnis bereichert.
  3. Charaktervielfalt: Menschliche Sprecher sind in der Lage, verschiedene Stimmlagen, Dialekte und Akzente zu verwenden, um eine Vielzahl von Charakteren zum Leben zu erwecken. Diese Vielfalt trägt dazu bei, dass die Hörer eine klarere Vorstellung von den Figuren entwickeln können.
  4. Anpassungsfähigkeit: Sprecher können sich an den Erzählstil des Autors anpassen und die Erzählung entsprechend gestalten. Sie verstehen den Kontext und können die Geschwindigkeit, Intonation und Betonung variieren, um die Aufmerksamkeit des Hörers zu lenken und die Geschichte besser zu vermitteln.
  5. Einfühlungsvermögen: Ein menschlicher Sprecher kann mit dem Text in Resonanz gehen, sich in die Figuren einfühlen und so eine tiefere Verbindung zur Geschichte schaffen. Diese emotionale Verbindung kann das Hörerlebnis intensivieren und dem Hörbuch eine persönliche Note verleihen.
  6. Qualität der Aussprache: Sprecher beherrschen die korrekte Aussprache von Wörtern und Namen, was die Verständlichkeit und Qualität des Hörbuchs verbessert. Dies ist besonders wichtig bei komplexen Fachbegriffen, Eigennamen oder sprachlichen Feinheiten.

Gegenfrage: Was sind die Vorteile, wenn eine künstliche Intelligenz (KI) Audible-Hörbücher einspricht ?

  1. Effizienz und Geschwindigkeit: KI kann Texte in kürzester Zeit verarbeiten und einsprechen, was die Produktion von Hörbüchern beschleunigt. Das ermöglicht eine schnellere Verfügbarkeit neuer Titel und eine zeitnahe Reaktion auf Nachfrage.
  2. Konsistenz: KI-Stimmen sind konstant und konsistent, was bedeutet, dass der Stil und die Qualität der Vorlesung nicht von Müdigkeit oder variierender Stimmung beeinflusst werden. Dies führt zu einem gleichmäßigen Hörerlebnis ohne Schwankungen.
  3. Verfügbarkeit verschiedener Stimmen: KI-Systeme können eine Vielzahl von Stimmen simulieren, darunter unterschiedliche Geschlechter, Altersgruppen und Akzente. Dies ermöglicht eine flexible Anpassung an verschiedene Charaktere und Erzählstile.
  4. Mehrsprachigkeit: KI kann problemlos zwischen verschiedenen Sprachen wechseln und somit die Vielfalt der Hörbuchproduktion in globaler Hinsicht erweitern. Dies ist besonders vorteilhaft für Autoren und Hörer in internationalen Märkten.
  5. Kosteneffizienz: Die Nutzung von KI kann kosteneffizient sein, da sie keine Honorare, Aufnahme- oder Studiozeiten benötigt. Dies ermöglicht es auch weniger bekannten Autoren, ihre Werke als Hörbücher zu veröffentlichen, ohne hohe Produktionskosten zu tragen.
  6. Skalierbarkeit: KI kann mühelos große Mengen von Texten verarbeiten, was bedeutet, dass eine Vielzahl von Büchern gleichzeitig in Hörbücher umgewandelt werden kann. Diese Skalierbarkeit erleichtert die Bewältigung großer Produktionsvolumen.
  7. Geringe Fehlerquote: Im Gegensatz zu menschlichen Sprechern neigt KI dazu, eine geringe Fehlerquote bei der Aussprache von Wörtern zu haben. Dies kann zu einer höheren Genauigkeit und Verständlichkeit des Textes führen.
  8. 24/7-Verfügbarkeit: KI ist rund um die Uhr verfügbar und kann zu jeder Zeit Hörbücher erstellen. Dies ermöglicht eine kontinuierliche Produktion ohne die Begrenzungen menschlicher Arbeitszeiten.

 

Welche Rolle spielt Amazon und die Audible-Hörbücher dabei?

Über 500.000 Hörbücher gibt es derzeit schon auf Audible. Tendenz steigend. Die Hörbuchlandschaft erlebt eine Revolution, und mittendrin steht Amazon mit einer bahnbrechenden Initiative: Künstliche Intelligenz (KI) wird nun auch zur Stimme von Audible-Hörbüchern.

Und das ganz klar und deutlich angekündigt. In einem aktuellen Programm testet der Tech-Gigant die Möglichkeit für Indie-Autoren, ihre Werke mithilfe von KI in ansprechende Hörbücher zu verwandeln.

Während dies neue Perspektiven für Autoren eröffnet, sind Kritiker besorgt über eine mögliche Flut von minderwertigen Produktionen. Zu Recht, wie ich finde.

Die renommierte Autorin Anna Mocikat, bekannt für ihre Cyberpunk-Romane, darunter „Space Punks“ und „Behind Blue Eyes“, hat aufgedeckt, dass eine beträchtliche Anzahl von Hörbüchern auf Audible nicht mehr von menschlichen Sprechern, sondern von synthetischen KI-Stimmen vertont werden.

Die Ära der KI-Audiobücher bei Amazon

Eine Anfrage beim Online-Riesen bestätigt die Einführung eines solchen Programms. Mit Hörbüchern als einem der am schnellsten wachsenden Formate möchte Amazon Indie-Autoren die Möglichkeit geben, mithilfe von synthetischer Sprachtechnologie schnell und unkompliziert Hörbuchversionen ihrer E-Books zu erstellen. Aktuell sind nur etwa vier Prozent der über Kindle Direct Publishing (KDP) selbstveröffentlichten Titel als Hörbücher verfügbar. Dieses Programm soll diese Lücke schließen.

Die Hörbücher, erstellt mit synthetischen Stimmen, werden klar als solche gekennzeichnet und sollen überall verfügbar sein, wo Audible-Bücher abgerufen werden können. Dies nicht nur als neue Einnahmequelle für Autoren, sondern auch als Erweiterung der Auswahl für die Endkunden.

Blick hinter die Kulissen der Audible-Hörbücher

Autoren, die an der Beta-Testphase in den USA teilnehmen, können über KDP ihre E-Books auswählen, Stimmen personalisieren, das Audiobuch vorab anhören und es nach der Veröffentlichung innerhalb von 72 Stunden weltweit auf Audible präsentieren. Die Preisspanne für diese KI-Audiobücher liegt zwischen 3,99 und 14,99 Dollar, wobei Autoren einen Anteil von 40 Prozent am Verkaufspreis erhalten.

Eine Besonderheit gibt es für Bücher, die im KDP Select enthalten sind. Durch diese Option können Amazon-Prime-Kunden die E-Books kostenlos lesen, während Autoren einen Teil des „KDP Select Global Fund“ erhalten, abhängig von der gelesenen Seitenanzahl. Gleiches gilt für die KI-Audiobücher, die von Audible Plus-Abonnenten kostenlos gehört werden können.

Kritik und Bedenken

Trotz der scheinbaren Vorteile gibt es berechtigte Kritikpunkte. Die Autorin Mocikat äußert Bedenken hinsichtlich der möglichen Auswirkungen auf menschliche Sprecher. Viele Indie-Autoren könnten sich nun für die kostengünstigere KI-Option entscheiden, was jedoch zu Lasten der Qualität geht. Synthetische Stimmen erreichen nicht das Niveau menschlicher Profis. Die befürchtete Konsequenz: Die Einkommen derjenigen Autoren, die auf menschliche Sprecher setzen, könnten schrumpfen.

Trotz dieser Bedenken betont Amazon, dass weiterhin die Möglichkeit besteht, mit menschlichen Sprechern zusammenzuarbeiten. Der „Audiobook Creation Exchange (ACX)“ dient als Marktplatz für Autoren und Sprecher, um gemeinsam qualitativ hochwertige Audiobücher zu produzieren. Aktuell steht diese Option jedoch nur Autoren aus den USA, Großbritannien, Kanada und Irland zur Verfügung.

Es bleibt abzuwarten, ob viele Indie-Autoren den Weg der KI wählen werden, wie von Mocikat prognostiziert. Der Trend zur KI könnte dazu führen, dass die traditionelle Sprecherbranche schrumpft, während Autoren sich dem Wandel anpassen müssen, um weiterhin in der sich verändernden Hörbuchlandschaft erfolgreich zu sein.

Mein ganz persönliches Fazit:

Meines Erachtens nach – und das ist mein Resümee – kann und wird die KI nicht gewinnen. Das hat mehrere Gründe – auch aus meiner Praxis und Expertise heraus. Auch Audible-Hörbücher müssen echt sein.

Insgesamt bieten nämlich nur (!) menschliche Hörbuchsprecher eine einzigartige Mischung aus künstlerischem Ausdruck, Anpassungsfähigkeit und emotionaler Tiefe, die das Hörerlebnis auf eine Weise bereichert, die über die rein technische Reproduktion von Text durch Künstliche Intelligenz hinausgeht. Ich denke, Menschen fühlen das. Sind Fehler in der Aufnahme und etwaige Eigenarten des Sprechers, ist das menschliche Übertragungs- und Empfangsfähigkeit. Wie ein unsichtbares Band, welches wir manchmal in unserer Kommunikation verspüren.

Obwohl KI einige klare Vorteile in Bezug auf Effizienz und Skalierbarkeit bietet, bleibt die Frage, ob sie die emotionale Tiefe und die künstlerische Nuance bieten kann, die viele Hörbuchliebhaber schätzen. Der Einsatz von KI in der Hörbuchproduktion sollte daher sorgfältig abgewogen werden, um den bestmöglichen Kompromiss zwischen Effizienz und künstlerischem Ausdruck zu finden. Spotify wird ziemlich sicher auch auf den KI-Zug aufspringen nach der Übernahme von Findaway Voices.

Ich will das nochmal verdeutlichen, weil diese Frage gerade bei meinen Student*innen und Menschen, die meine Ausbildung buchen wollen – so oft auftaucht:

Die Frage nach dem „Gewinner“ im Vergleich zwischen menschlichen Hörbuchsprechern und künstlicher Intelligenz (KI) ist komplex und hängt von verschiedenen Faktoren ab, einschließlich individueller Präferenzen und des gewünschten Hörerlebnisses. Beide Ansätze haben ihre Vor- und Nachteile, und die Entscheidung darüber, welcher Ansatz überwiegt, kann stark subjektiv sein. Hier sind einige Überlegungen:

Menschliche Hörbuchsprecher für Audible-Hörbücher:

Vorteile:

  • Emotionale Tiefe: Menschliche Sprecher können Emotionen authentisch vermitteln und eine tiefere emotionale Bindung zwischen dem Hörer und der Geschichte schaffen.
  • Künstlerische Interpretation: Die künstlerische Interpretation eines menschlichen Sprechers kann dem Hörbuch eine einzigartige Note verleihen und es zu einem Kunstwerk machen.
  • Natürliche Variation: Die Fähigkeit zu variierenden Stimmlagen, Dialekten und Akzenten ermöglicht es, verschiedene Charaktere lebendig zu gestalten.

Nachteile:

  • Kostenaufwendig: Die Anstellung menschlicher Sprecher kann teuer sein, insbesondere für weniger bekannte Autoren.
  • Begrenzte Skalierbarkeit: Die Produktion großer Mengen Hörbücher kann aufgrund menschlicher Arbeitszeiten und Kapazitäten eingeschränkt sein.

Künstliche Intelligenz für Audible-Hörbücher

Vorteile:

  • Effizienz: KI ermöglicht eine schnelle und effiziente Produktion von Hörbüchern.
  • Konsistenz: KI-Stimmen bieten eine gleichbleibende Qualität und Konsistenz ohne Schwankungen.
  • Mehrsprachigkeit: KI kann leicht zwischen verschiedenen Sprachen wechseln und so die globale Reichweite erweitern.

Nachteile:

  • Emotionale Begrenzung: KI kann Schwierigkeiten haben, die emotionale Tiefe und Nuancen in der Sprache zu erfassen, die menschliche Sprecher bieten.
  • Künstliche Klangqualität: Einige Hörer bevorzugen den natürlichen Klang menschlicher Stimmen gegenüber synthetischen KI-Stimmen.
  • Kreative Einschränkungen: KI kann Schwierigkeiten haben, komplexe künstlerische Entscheidungen zu treffen, die menschliche Sprecher intuitiv treffen können.

Es lässt sich sagen, dass die Wahl zwischen menschlichen Sprechern und KI stark von den Zielen des Autors, den Vorlieben der Hörer und den finanziellen Ressourcen abhängt. Einige Autoren bevorzugen möglicherweise die künstlerische Tiefe menschlicher Sprecher unter den Audible-Hörbücher, während andere die Effizienz und Skalierbarkeit von KI bevorzugen. In vielen Fällen könnte eine Kombination beider Ansätze, je nach Bedarf, die optimale Lösung sein.

Auch wenn in meinen Augen der Mensch gewinnen wird, ist meine Meinung subjektiv. Ich bin halt als schaffender Künstler/Hörbuchsprecher recht befangen was das angeht. Du sollst Deine gekauften Audible-Hörbücher von echten Menschen genießen! Ein Roboter-Stimme ersetzt unsere feinfühle Menschlichkeit meines Erachtens nach nicht.

Ich bin gespannt, wie Du das siehst. Ich freue mich auf Deine Kommentare!

PS: Update – einen 1sten Kommentar habe ich gerade schon bekommen. „Hörbücher mit KI eingesprochen ist wie Billig-Fleisch!“ Danke!!! Ich musste vortrefflich lachen. Ein gelungener Vergleich!

Bild von Joshua Woroniecki auf Pixabay