Wie die Stimmen für ChatGPT ausgewählt wurden

ChatGPT hat mit seiner Einführung von Sprachfunktionen im September 2023 neue Maßstäbe gesetzt. Die Voice-Funktion, die es Nutzern ermöglicht, auf eine neue Art und Weise mit ChatGPT zu interagieren, wurde schnell zu einer der beliebtesten. Die fünf einzigartigen Stimmen – Breeze, Cove, Ember, Juniper und Sky – wurden sorgfältig von OpenAI ausgewählt, um den Nutzern eine optimale Erfahrung zu bieten.

OpenAI Voice

Bildquelle: 9to5mac

Ein umfassender Auswahlprozess

Im Mai 2023 begann die Suche nach den perfekten Stimmen für ChatGPT. In Zusammenarbeit mit führenden Casting-Direktoren und Produzenten wurden über 400 Einsendungen von professionellen Sprach- und Filmschauspielern geprüft. Die Kandidaten mussten ein vorgegebenes Skript einsprechen, das von alltäglichen Gesprächen bis hin zu komplexen Fragen reichte. Diese Vielfalt sollte sicherstellen, dass die Stimmen in verschiedenen Konversationskontexten überzeugend klingen.

Zusammenarbeit mit der Kreativbranche

OpenAI legt großen Wert auf die Unterstützung der kreativen Gemeinschaft. Daher wurde eng mit der Synchronisations- und Filmbranche zusammengearbeitet, um die richtigen Schritte zur Besetzung der ChatGPT-Stimmen zu finden. Jeder Schauspieler soll eine Vergütung über den marktüblichen Sätzen erhalten haben, was auch in Zukunft so bleiben soll, solange die Stimmen in den Produkten verwendet werden.

Ein wichtiger Aspekt war, dass die Stimmen nicht absichtlich die charakteristischen Stimmen von Prominenten nachahmen sollten.

Beispielsweise ist die Stimme von Sky keine Nachahmung von Scarlett Johansson, sondern gehört einer anderen professionellen Schauspielerin, die ihre natürliche Sprechstimme verwendet. Um die Privatsphäre der Sprecher zu schützen, werden deren Namen nicht bekannt gegeben.

Scarlett Johansson hat jedoch in einem kürzlich veröffentlichten Statement bekannt gegeben, dass eventuell mehr an der Geschichte dran ist, als OpenAI zu geben mag. Sam Altman wollte mehrfach Scarlett Johansson für eine mögliche Stimmbesetzung haben, die jedoch ablehnte. Nun hat sich OpenAI dazu entschieden, die Stimme „Sky“ zu pausieren, da sie zu ähnlich zu Johansson klinge - nachdem Scarlett Johansson rechtliche Schritte gegen OpenAI eingeleitet hatte.

Das offizielle Statement von Scarlett Johansson zu OpenAI. Bildquelle: X/BobbyAllyn

Kriterien für die Auswahl der Stimmen

Zu Beginn des Jahres 2023 arbeitete OpenAI mit unabhängigen, renommierten Casting-Direktoren und Produzenten zusammen, um ein Set von Kriterien für die ChatGPT-Stimmen zu entwickeln. Diese Kriterien umfassten unter anderem:

  • Schauspieler mit vielfältigem Hintergrund oder die mehrere Sprachen sprechen können

  • Eine Stimme, die zeitlos wirkt

  • Eine zugängliche Stimme, die Vertrauen erweckt

  • Eine warme, ansprechende, selbstbewusste und charismatische Stimme mit reichem Klang

  • Eine natürliche und angenehme Stimme

Die finalen Stimmen

Im Mai 2023 wurde eine erste Liste von 14 Schauspielern erstellt, die schließlich auf die fünf besten Stimmen reduziert wurde. Diese Schauspieler wurden nach San Francisco geflogen, um ihre Stimmen in Aufnahmesessions einzuspielen und das OpenAI-Team persönlich kennenzulernen.

Am 25. September 2023 wurden ihre Stimmen offiziell in ChatGPT eingeführt. Dieser Prozess erforderte eine intensive Koordination zwischen den Schauspielern und dem Casting-Team und dauerte insgesamt fünf Monate. Die Zusammenarbeit mit den Schauspielern setzt sich fort, da sie zusätzliche Arbeit für Audioforschung und neue Sprachfunktionen in GPT-4o beigetragen haben.

Zukunftsausblick: Neue Sprachmodi und zusätzliche Stimmen

In den kommenden Wochen wird ein neuer Sprachmodus für GPT-4o in der Alpha-Version für ChatGPT Plus-Nutzer eingeführt. GPT-4o ermöglicht eine noch natürlichere Sprachinteraktion mit ChatGPT, bewältigt Unterbrechungen reibungslos, verwaltet Gruppengespräche effektiv, filtert Hintergrundgeräusche und passt sich an den Tonfall an. Eine enorme Verbesserung also, zu dem vorherigen Sprachmodell. So gut, dass sich kürzlich Apple dafür entschieden hat, mit OpenAI im neuen iOS 18-Update zu kooperieren, um z.B. Siri noch besser zu machen.

Zukünftig können Nutzer mit noch mehr Optionen rechnen, da OpenAI plant, zusätzliche Stimmen in ChatGPT einzuführen, um den vielfältigen Interessen und Vorlieben der Nutzer gerecht zu werden.

Mit der sorgfältigen Auswahl und fortlaufenden Verbesserung der Stimmen zeigt OpenAI sein Engagement, eine erstklassige und vielseitige Nutzererfahrung zu bieten.

Zurück
Zurück

Microsoft stellt 'Copilot+' PCs mit KI-Funktionen vor: Alles, was du wissen musst

Weiter
Weiter

Apple und OpenAI: Ankündigung bei der WWDC zur Integration von ChatGPT in iOS 18