Neue Funktion Wie die neue Vorlesefunktion im RP-Portal funktioniert
Special | Düsseldorf · Lassen Sie sich ausgewählte Artikel unserer Redakteure vorlesen – von den Stimmen des jeweiligen Autors. Wie es funktioniert und was dahintersteckt, lesen Sie hier.
Diese Audioversion wurde künstlich generiert. Mehr Infos | Feedback senden
Ob im Auto, beim Joggen oder bei der Hausarbeit – in vielen Situation ist das Lesen am Bildschirm nicht möglich. Damit Sie auch in diesen Momenten von den Artikeln der Rheinischen Post profitieren können, haben wir eine innovative Audio-Funktion entwickelt: Lassen Sie sich RP-Artikel einfach vorlesen – und zwar von den Stimmen unserer Autorinnen und Autoren.
Was steckt hinter der Funktion?
Die Rheinische Post setzt als eines der ersten deutschsprachigen Medienhäuser auf eine innovative und qualitativ hochwertige KI-Technologie. Diese nutzt professionell im Tonstudio aufgenommenes Tonmaterial unserer RP-Redakteure, um die Stimmen der Kolleginnen und Kollegen zu synthetisieren. Die KI wandelt anschließend Text in Audio um: Die synthetisierte Stimme des Autors liest Ihnen den Text vor.
Die Artikel werden also nicht wirklich von Menschen vorgelesen?
Richtig, dafür nutzen wir die „geklonten“ Stimmen der Kollegen und einen Automatismus, mit dem veröffentlichte Texte automatisch vertont werden. Beispielsweise nutzt die Vorlese-Technik für Artikel unserer Wirtschaftschefin Antje Höning die synthetische Stimme der Kollegin.
Wieso nutzen Sie synthetische Stimmen Ihrer Redakteure?
Viele Vorlesefunktionen arbeiten mit standardisierten KI-Stimmen. Wir haben uns für den aufwendigeren, aber – unserer Überzeugung nach – persönlicheren Weg entschieden. Wir möchten, dass Sie ein authentisches Hörerlebnis haben. Die Stimme eines Menschen verrät viel über ihn: sein Alter, sein Geschlecht, seine geografische und soziale Herkunft oder seine stimmlichen Eigenschaften. All diese Informationen werden auch über die synthetisierten Stimmen transportiert. Unsere Autorinnen und Autoren sind, was die Rheinische Post ausmacht. Indem Sie die Stimmen unserer Journalisten kennenlernen, lernen Sie auch die Rheinische Post besser kennen.
Werden alle Artikel der Rheinischen Post auf diesem Weg vertont?
Nein, für den Anfang starten wir mit den Artikeln von rund einem Dutzend Kolleginnen und Kollegen. Alle Artikel mit Vorlesefunktion finden Sie unter rp-online.de/audio.
Wieso gab es bislang keine Vorlesefunktion auf der RP-Website?
Bis 2020 wurden täglich fünf Artikel der Rheinischen Post manuell vertont. Die Nutzung und der Produktionsaufwand standen jedoch in keinem positiven Verhältnis, sodass das Projekt eingestellt wurde. Eine automatisierte, KI-gestützte Vorlesefunktion kam für uns in der Folge zunächst nicht infrage, da die Technik zum damaligen Zeitpunkt schlichtweg nicht die qualitativen Standards unserer Redaktion erfüllte.
Zuletzt hat die technische Entwicklung aber (nicht nur) im Bereich der automatischen Vertonung von Texten enorme Fortschritte gemacht, sodass wir nun eine Vorlesefunktion anbieten können.
Lesen die synthetisierten Stimmen genauso gut vor wie ein Mensch?
Nein. Die Qualität hat sich zwar stark verbessert, hat aber weiterhin punktuelle Schwächen, beispielsweise bei der richtigen Betonung mancher dem System unbekannter Wörter. Auch das kontextuale Hervorheben von Sätzen oder Wörter, die beim menschlichen Vorlesen eine besondere Stimmung und Emotionen übermitteln, ist noch in der Entwicklungsphase. Dennoch bietet die aktuelle Version der Technik bereits ein komfortables Hörerlebnis, mit sauberer Aussprache und einer rhythmischen Sprachmelodie.
Hat die RP diese Technik selbst entwickelt?
Nein. Wir arbeiten mit dem amerikanischen Anbieter Elevenlabs zusammen, den auch große internationale Medienmarken wie die New York Times und die Washington Post für die Vorlesefunktion in ihren Portalen nutzen. Anders als die RP, nutzen diese Portal aber vor allem die „vorgefertigten“ Stimmen des Anbieters und nutzen keine Stimmen-Synthetisierung ihrer Autorinnen und Autoren.
Wie funktioniert die Synthetisierung von Stimmen genau?
Die Autorinnen und Autoren, deren Stimmen wir synthetisiert haben, haben im RP-Tonstudio etwa eine Stunde lang Texte vorgelesen – vorwiegend eigene Artikel, teils auch Gedichte oder fremde Prosa. Dabei kam es neben der Audioqualität auf einen möglichst authentischen Stimmklang an. Die synthetisierte Stimme soll Buchstaben, Silben und Wörter so aussprechen wie die jeweilige Person, inklusive Spracheigenheiten und dialektaler Färbung. Der Anbieter Elevenlabs verarbeitet diese Ton-Aufnahmen und trainiert sie mit seinem neuronalen Netzwerk. Dieses Netzwerk lernt, die Beziehung zwischen Texteingaben und den entsprechenden Sprachausgaben zu verstehen. Während des Trainings lernt das Modell, Merkmale wie Tonfall, Betonung und Rhythmus der Sprache zu imitieren.Sobald das Modell trainiert ist, kann es Text in Sprache umwandeln. Der eingegebene Text wird in phonetische oder sprachliche Einheiten zerlegt, und das Modell generiert daraufhin eine Audioausgabe, die diesen Text als gesprochene Sprache wiedergibt.
Werden bei der Nutzung des Audioplayers Daten von mir an Elevenlabs übermittelt?
Nein. Der Text des Artikels wird nach der Veröffentlichung automatisiert vertont. Dazu schicken wir den Artikeltext an ein System des Anbieters und erhalten eine Audio-Datei zurück. Diese Datei liegt auf unseren RP-Servern in Deutschland und wird Ihnen von dort im aufgerufenen Artikel zur Verfügung gestellt.
Ich habe Rückfragen, Lob oder Kritik. An wen kann ich mich melden?
Das Projekt wird von der RP-Redaktion betreut. Für Rückmeldungen melden Sie sich gerne per E-Mail an unsere Zentralredaktion in Düsseldorf: redaktion@rheinische-post.de oder nutzen Sie als RP+ Nutzer die Kommentarfunktion unter diesem Artikel. Beides können Sie auch tun, wenn Sie einen Fehler in der Audio-Version eines Artikels entdeckt haben.