Wissenschaft

Psychologie

Stimme und Identität

Unser akustischer Fingerabdruck

29:07 Minuten

Ein Kind schreit in ein Mikrofon hinein.

Unser Organismus ist auf die Stimme ausgerichtet. Schon einen Tag nach der Geburt können wir die Stimme der Mutter von anderen Geräuschen unterscheiden. © Unsplash / Jason Rosewell

Von Martina Weber | 08.03.2022

Audio herunterladen

Die Stimme wird als Ausdruck der Persönlichkeit wahrgenommen. Von ihr schließen wir auf Alter, Geschlecht und sogar Attraktivität einer Person. Entsprechend bemühen sich viele, die eigene Stimme zu formen, damit sie so klingt, wie wir uns selbst sehen.

Wir sind in eine Welt voller Stimmen, Laute, Dur- und Mollklängen hineingeboren, in der unser erster Ausdruck ein Schrei in die Welt ist.

Unser Organismus ist auf die Stimme ausgerichtet. Bereits im Mutterleib erkennen wir die Stimme der Mutter. Einen Tag nach der Geburt können wir sie von anderen Geräuschen unterscheiden. Mit den ersten gurrenden und schnalzenden Geräuschen experimentieren wir mit unserer Stimme und treten mit unserer Umwelt ins Gespräch. Dann folgen die ersten Worte.

Das Zeitfragenfeature "Stimme und Identität: Unser akustischer Fingerabdruck" wurde erstmals am 5. November 2020 ausgestrahlt.

Die Stimme ist so etwas wie ein "Urphänomen", dessen Klang die Umwelt als menschliche Welt überhaupt erst hervorbringt, wie es Goethe beschreibt. So ist es auch in dem lateinischen Wort Per-Sonare eingeschrieben: Ein Mensch kann nur sein, aus dem etwas hervor- oder hindurchklingt. Angesteuert durch ein vermeintlich Vergängliches, durch unseren Lufthauch.

Hat die Stimme ein Geschlecht?

"Da saß ein ganz hübsches blondes Mädchen und das blonde Mädchen, das flüsterte immer so und tauschte Geheimnisse aus, bis es dann aufgerufen wurde in die Sprechstunde – und dann tönte aus dem Munde des hübschen Mädchens eine tiefe Männerstimme", sagt Julia Schwieger.

"Die Maske fiel in dem Moment und du hast sofort gemerkt: Das ist kein Bio-Mädchen, das ist ein Mädchen, das noch im Werden ist. Und schon in dieser ersten Stunde war mir klar: Die Stimme macht es."

Julia Schwieger, 62 Jahre alt, ist ehemaliger Professor und jetzt leitende Apothekerin. Als vor vier Jahren in der psychotherapeutischen Notfallsprechstunde sitzt, ist sie an einem entscheidenden Wendepunkt ihrer Transition von Mann zu Frau. Nach jahrelanger Hormonbehandlung sollten Operationen ihr den Körper und die Identität geben, die sie sich schon immer wünscht. Doch da ist das Gefühl, die Stimme könnte all dies in Sekunden wieder zerstören.

"So bin ich dann erst mal 30 Stunden in die Logopädie gegangen", sagt Julia. "Und da hat man eben versucht, die Stimme höher zu bringen, was kein Problem war, weil ich einen guten, sehr guten Stimmumfang hatte, und ich kam auch voll in diesen weiblichen Bereich hinein. Aber das Problem war: Die Stimme wurde immer wieder tiefer, wenn ich die Praxis verlassen habe. Ich arbeite ja sehr lange am Tag mit meinen Kollegen und Kolleginnen in der Apotheke zusammen. Die kennen mich zum größten Teil seit über 20 Jahren, und mit denen sprichst du so wie immer, das kannst du gar nicht vermeiden. Ich bin zudem verheiratet. Mit deiner Frau sprichst du wie schon immer. Die Stimme hat immer wieder instinktiv versucht, sich in den alten Zustand hineinzuversetzen."

"Der alte Zustand" meint den Frequenzbereich, in dem Julias Stimme als männlich wahrgenommen wurde. Dieser liegt zwischen 80 und 140 Hertz. Klingt die Stimme höher, zwischen 140 und 220 Hertz, ordnen wir diese einer weiblichen Person zu. Damit Julias Stimme in diesen Bereich kommt, musste sie das rückgängig machen, was das Testosteron zu Beginn ihrer Pubertät ausgelöst hat.

Vom 9. bis zum 18. Lebensjahr verändert sich die Stimme bei Jungen unüberhörbar. Durch das Sexualhormon Testosteron verändert sich der Kehlkopf, er wird größer. Während die Stimmlippen bei Mädchen in der Pubertät nur drei bis vier Millimeter wachsen, beträgt das Längenwachstum bei Jungen etwa einen Zentimeter. Das ist der Grund, weswegen die männlichen Stimmen tiefer klingen als die Mädchenstimmen. Je länger und dicker die Stimmlippen sind, desto weniger schwingen sie miteinander und desto tiefer ist der erzeugte Ton. Die mittlere Sprechstimmlage bei Jungen sinkt um eine Oktave, bei Mädchen nur um eine Terz. Mann und Frauen divergieren sich klanglich auseinander.

Während Transmänner ihre Stimme durch die Einnahme von Testosteron senken können, ist das bei Transfrauen nicht möglich. Daher hat Julia trotz logopädischer Stimmtherapien immer noch das Gefühl, ein Fagott in der Tasche zu haben, wie sie sagt.

"Und das möchte ich ja gerade nicht. Ich bin da sehr anspruchsvoll, muss ich sagen, meine Stimme soll schön sein. Und zum guten Schluss war dann die Operation bei Hess das Krönchen für mich."

Die Stimme als Kunstprodukt

Markus Hess ist Stimmchirurg und Leiter der Deutschen Stimmklinik in Hamburg. Zu ihm kommen Menschen, die an Stimmstörungen und Krankheiten wie Heiserkeit oder Kehlkopftumoren leiden. Seit einigen Jahren hat Markus Hess sich auch auf die Stimmfeminisierung spezialisiert.

"Stimmfeminisierung heißt, dass die Stimmen als einem anderen Geschlecht zugehörig wahrgenommen werden. Und bei Transfrauen ist es eben so, dass die als männlich wahrgenommen werden. Aber die Frau ist ja eine Frau, die auch akustisch als Frau rüberkommen will, insbesondere wenn sie nicht gesehen wird, sondern gehört wird, also am Telefon. Und wir wollen es schaffen, die Stimme so zu verändern, dass alle Menschen, die diese Stimme hören, sagen: Jawohl, das ist eine Frauenstimme."

Bei diesem mikrochirurgischen Eingriff werden die streichholzdicken Stimmlippen um 30 bis 50 Prozent vernäht. Etwa eine Stunde dauert der Eingriff. Vier Wochen lang darf nur geflüstert werden.

"Und dann hast du schon heimlich gesummt, was kommt denn da raus? Und dann fängt er an und sagt: Ja, jetzt geht es los. Jetzt sagen Sie doch mal: eins, zwei, drei, vier, fünf... So fing das an, ja, in dieser Höhe. Und er sagt: Ah, das ist aber schön hoch geworden. Und dann habe ich bis 20 gezählt in dieser Tonlage. Er war total angetan, und ich war so ein bisschen… Dachte, das ist keine Stimme, das ist irgendwie ein Kunstprodukt."

Ein Chirurgenteam bei einer Stimmlippenoperation. Ein Bildschirm zeigt die geöffneten Stimmlippen.

Mithilfe eines mikrochirurgischen Eingriffs können die Stimmlippen vernäht werden, um die Stimme zu erhöhen.© Getty Images / Fairfax Media / Miller

"Unser Ideal ist, wenn Anspruch und Wirklichkeit bei den Patientinnen kongruent sind", betont Markus Hess. "Wenn wir es schaffen, die Patientinnen da hinzukriegen, dass sie sagen: Das gefällt mir. So will ich sein. Das ist meine akustische und für andere wahrgenommene auditive Identität. Die Kongruenz, dass gesagt wird: Das ist meine Stimme, das bin ich."

Als "Ich" zu sprechen, heißt, authentisch zu sein, zu zeigen, wer ich bin. Und gleichzeitig entscheide ich mich, wer ich wann sein möchte. In diesem Moment übernimmt meine Stimme als Trägerin dieser Information eine Funktion. Sie ist eine Art Arbeitsgerät für mich. Meine Stimme löst sich von meinem Körper, von meiner geschlechtlichen Identität. Ich betrachte es als ein neutrales und geschlechtsloses Produkt.

"Es gibt keine menschliche Stimme auf der Welt, die nicht Objekt des Begehrens wäre – oder des Abscheus. Es gibt keine neutrale Stimme."

Roland Barthes in "Der entgegenkommende und der stumpfe Sinn"

Dieser Körnung der Stimme, wie Roland Barthes es in seinem gleichnamigen Buch formuliert, liegt eine Unverkennbarkeit inne, welche sich durch Klangfarbe, Rhythmus, Betonung manifestiert. Daraus schöpfen wir im täglichen Leben eine stimmliche Bandbreite an Emotionen, ja sogar Charakteren, die wir wie Masken aufsetzen. "Persona", dieses Wort im antiken griechischen Theater, meint eine Maske, die Schauspielerinnen und Schauspieler tragen, um Gefühle ihrer Rollen besser zum Ausdruck zu bringen.

"Die Stärke besteht darin, dass ich mir des Einflusses der Sprechtonhöhe auf meine Stimmwirkung bewusst bin, dass ich mir erstmal bewusst mache, dass es nicht egal ist, in welcher Sprechtonlage ich rede", sagt Michael Fuchs.

"Und wenn ich dann noch in der Lage bin, das attributionsgerecht, also dem jeweiligen Anlass angemessen richtig einzusetzen, dann darf ich erwarten, dass ich mit meiner Stimme die größte Wirkung erziele."

Michael Fuchs ist Facharzt für Stimm-, Sprach- und kindliche Hörstörungen an der Universität Leipzig.

"Wenn es um sachliche Informationen geht, wenn es darum geht, mit verbalen Argumenten zu überzeugen, neigen wir Menschen dazu, tieferen Stimmen mehr Vertrauen zu schenken als höheren Stimmen. Also hohe Stimmen werden oft mit Kindlichkeit, Unsicherheit, vielleicht auch mit Unwissen, mit einer gewissen Naivität verbunden. Während tiefe Stimmen… Man sagt 'Im Brustton der Überzeugung sage ich dir, das ist so und so'. Das sagt ja schon, ich nutze eine tiefere Frequenz, um dich zu überzeugen."

Neue Radiostimmen inszenieren Authentizität

Diese Charakterisierung ist insbesondere im Radio zu hören. Wie ihre männlichen Kollegen erklingen weibliche Radiostimmen im sonoren dunklen Timbre in Kultur- und Informationssendungen. Entgehen Frauen genderisierten Rollenzuschreibungen nur, wenn sie sich einem männlichen Stimmgenre anpassen?

"Wir haben eigentlich über sehr lange Zeit klassische Radiostimmen gehabt, die einen eher vollen dunklen Ton hatten, ausgebildete Stimmen. Wir haben jetzt zusätzlich zu diesen Stimmen zum Beispiel in Morningshows – sowohl in öffentlich-rechtlichen als auch in privaten Sendern – Stimmen die scheinbar nicht ausgebildet sind und mit diesem Ideal der klassischen Radiostimmen brechen", sagt Ines Bose, Professorin für Sprechwissenschaft und Phonetik an der Universität Halle.

Bose untersuchte zusammen mit Clara Finke von der Universität Leipzig, wie sich Radiostimmen in Unterhaltungsformaten von Morningshows stilisieren:

"Wir haben Stimmen, die relativ hoch sind, die kratzen, die auch mal hauchig sind, sehr tief sind und auch sehr hoch sind. Und das ist höchstwahrscheinlich ein Reflex darauf, dass das Radio in diesen Sendungen, in diesen Morning Shows zum Beispiel, vor allem darauf setzt, dass die Moderatoren und Moderatorinnen den Hörern besonders nahe sein sollen, eben nicht als Experten stimmlich auftreten sollen, sondern eher als die netten Leute von nebenan, die man zum Frühstücksplausch mit am Tisch sitzen hat."

Der Kunstgriff dieser Morning Shows besteht darin, Stimmen als Vehikel für Vertrautheit und Augenhöhe zu nutzen. Doch dass in dieser inszenierten Authentizität Rollenklischees bedient werden, wird in einer Folgestudie sichtbar, wie Ines Bose erklärt:

"Wenn man die wissenschaftlich analysiert, dann merkt man ganz stark, dass sie auf den Anchor-Moderator setzen, das ist auch immer ein Mann, der in der Regel von weiblichen Sidekicks umrahmt wird, die dann sowas wie Stichworte geben und bewundern, was der Hauptmoderator da von sich gibt."

Eine neutrale Stimme gibt es nicht

So zeigt die Sprechwissenschaftlerin Clara Finke zusammen mit der Radiojournalistin Jasmin Galonski in einer Studie, dass Frauen in Morningshows zwar in ihren verschiedensten Stimmkörnungen zu hören sind, aber in ihrem Inhalt und in der Ausformung hörbare Stereotypen verfestigen. Meine Utopie einer neutralen Stimme ist gescheitert.

Auf dem Klavier macht die Stimmtrainerin Kirsten Mall mit Julia Übungen. "Julia war eine neue Herausforderung für mich, weil es eine ganz neue Veränderungsidee gab, und ich habe mich selber anhand dessen noch einmal hinterfragt und andere Frauen und überlegt: Was ist denn eigentlich typisch weiblich? Was ist typisch Frau?"

Seit einem Jahr begleitet Kirsten Mall Julia auf dem Weg, ihre Sprechstimme zu finden, das heißt, deutlich zu artikulieren, Mut haben den Mund aufzumachen und ihr damit eine positive Präsenz zu geben. Vielleicht auch ein Stück weit sich von bestimmten Vorstellungen zu lösen. Das bedeutet auch, jahrelange Gewohnheiten abzutrainieren.

"Ich mache eine weibliche Stimme jedenfalls nicht nur an der Tonhöhe fest. Das war zum Beispiel, als Julia und ich uns trafen, zunächst so, dass ich immer eher tiefere Stimmübungen mit ihr gemacht habe, ich gemerkt habe: Oh, das ist ihr gerade gar nicht recht, weil sie mit einer weiblichen Stimme was Höheres, was Helleres verbindet. Ich hatte den Eindruck, dass sie das aber eher in diese Kunststimme treibt. Also eine Kopfstimme künstlich erzeugte, die unter sehr hoher Spannung stattfindet. Und ich hatte das Gefühl, dass Julia da mehr, ich nenne es jetzt mal Echtheit oder Natürlichkeit braucht."

Ein Mann und eine Frau singen in ein Radiomikrofon.

Stimme und Stereotyp: Welche Stimmen gerade angesagt sind, entscheidet auch der akustische Zeitgeist.© Getty Images / Bettmann

Diese anfangs befremdliche Stimme nach der Operation ist heute für Julia immer mehr ein Sicherheitsnetz geworden, um nicht mehr in die männliche Identität zurückzufallen, am Telefon, im Gespräch mit Kunden auf der Arbeit oder in unkontrollierten Momenten beim Lachen oder Niesen.

"Das erste Treffen, als wir uns kennengelernt haben, war auch sehr markant", erinnert sich Kirsten Mall. "Da hast du direkt damit begonnen, mich zu spiegeln. Du hast meine Sätze wiederholt oder meine Töne wiederholt, und auch das war eine neue Begebenheit für mich, dass ich plötzlich ständig wiederholt wurde. Ich hatte ein dauerhaftes Echo."

"Ich habe sicher immer noch den Hang dazu, Stimmen zu imitieren", sagt Julia. Ich merke, wie Julia mit weiblichen Stimmen aus der Umgebung spielt, sich an ihnen orientiert und versucht, an ihnen zu lernen. Gleichzeitig fange ich an, mein stimmliches Selbstbild zu hinterfragen. Was Kirsten für Julia ist, werde ich unfreiwillig in dem Moment auch: ein Sprechvorbild.

"Der Knackpunkt oder der ultimative Test ist immer das Telefonat", meint Julia. "Wenn du dann sprichst und wildfremde Leute rufen dich an, die dich gar nicht kennen, und sagen: Ach, Herr Schwieger. Dann bist du am Boden zerstört, weil du merkst: Irgendwas passt immer noch nicht."

Ob Menschen wie Julia als Frau in der Gesellschaft durchkommen, wie sie sagt, hängt auch vom Gegenüber ab.

Von der Stimme auf Attraktivität schließen

Wie prägnant wir Menschen anhand von Stimmen beurteilen können, zeigte Karl Bühler bereits 1931 mit einem Experiment im Radio Wien. Das Hörpublikum konnte anhand der Stimmen neben Alter und Geschlecht auch Gestik und Attraktivität interpretieren. Diese Verbindung von Stimme, bildhafter Vorstellung und Beurteilung konnten Wissenschaftler 2008 an der Technischen Universität Berlin mithilfe eines Phantombildprogramms bestätigen.

Männliche Sprecher mit einer tiefen Stimmlage gelten demnach als attraktiv, diejenigen mit einer schnellen und agileren Sprechweise als insgesamt sportlicher und jünger. Wer in einer ständig hohen Tonlage spricht, schätzten die Hörenden als weniger sportlich und attraktiv.

"Ich befasse mich seit einigen Jahren mit der Frage, wie die Persona, die ein Mensch verkörpert, also Sie oder ich als konkrete Person, wie wir über die Jahre auch eine Klang- und eine Stimmpersona ausbilden", sagt Holger Schulze, Professor für Musikwissenschaft an der Universität Kopenhagen.

Seit mehreren Jahren forscht er zur Kulturgeschichte der Stimme und Programmierung der menschlichen Sprache.

"Das heißt, dass in der Stimme, die wir zum Sprechen nutzen, natürlich viele Dinge eingehen, sowohl von Physischem, von Erleben, von Spracherfahrung, aber auch Lebensstilen und allen anderen Elementen. Dass diese Elemente unserer Stimme sich aber im weiteren Sinne auch mit unserem Körper verbinden, das heißt, dass nicht nur unsere Stimme was trägt und der Körper tut was ganz anderes, aber der Körper und die Stimme, die hängen zusammen."

Es gibt einen akustischen Zeitgeist

Zwar sind Stimmen und ihr Gebrauch kontextgebunden und kulturell verschieden, wie Holger Schulze erklärt, allerdings archivieren Stimmen auch einen entsprechenden akustischen Zeitgeist.

"Heute ist natürlich sehr oft das Stimm-Ideal, was ich bei Studierenden sehe und auch sonst bei vielen Menschen, ein Ideal, das vielleicht sehr durch Social Media, durch Influencer, durch Podcasts, durch TED-Talks geprägt ist. Das ist ein Habitus, der sehr zugänglich ist, der sehr dynamisch ist und der bissel humorvoll sein möchte. Bissel Witz erzählt, hier ein bisschen selbstironisch, aber nicht zu sehr. Und ja, auch ein bisschen nahbar, sehr, sehr nahbar ist. Und das wird natürlich auch durch Stimmcoaches, durch Mediencoaches, durch Medientrainer aufgegriffen und stabilisiert. Und umgekehrt natürlich auch in den Sendeformaten und in den Auftrittsformaten ebenso bestätigt, die es gibt von Berufen, Präsentation und Hochschule, Messen, Konferenzen. Entsprechende Leute werden eingeladen oder eben nicht eingeladen und eben als schlecht bewertet."

In den meisten Gesprächen mit Expertinnen und sprachwissenschaftlichen Texten wird eine natürliche Sprechstimmlage als das Ideal angesehen, unabhängig von Geschlecht, Tonlage. Hauptsache, die Stimme passt zu dir, du fühlst dich wohl, du wirkst authentisch. Doch was ist mit Menschen, die keine natürliche Stimme besitzen oder bei denen die Stimme eine technische Barriere darstellt?

Eine synthetische Stimme hat keine Persönlichkeit

Auf meiner Recherche für das Feature bin ich auf einen Aufruf bei Twitter gestoßen. "Ich suche eine Frau zwischen 18 und 30 Jahren, die mir ihre Stimme verleihen möchte."

Im Profil von Lilli Zeifert sehe ich auf Fotos eine lachende junge Frau, die im Rollstuhl sitzt. "Möchtest du meine Stimme sein? Dann schicke mir eine E-Mail mit einer Sprach- oder Videoaufnahme, in der du dich vorstellst."

Auf ihrer Webseite erfahre ich, dass sie 19 Jahre alt ist, zurzeit ihr Abitur macht und an einer dyskinetischen Zerebralparese erkrankt ist. Das bedeutet, dass ihr Körper sich ständig und unkontrolliert bewegt. Sie kommuniziert mit Hilfe der Sprachausgabe eines Computers, den sie mit ihrem großen Zeh bedient.

Wir schreiben uns per Mail. Ich möchte wissen, wie es ist, wenn die synthetische Stimme ein Teil der eigenen Persönlichkeit ist, und was für sie eine natürliche Stimme ausmacht. Auf meine Bitte hat sie die Antworten auf meine Fragen mit ihrem Tablet in ihrem Zimmer aufgenommen.

"Mein Problem ist der gleichmäßige Luftstrom, der mir aufgrund von meinen starken, unkontrollierten Bewegungen fehlt, den man jedoch zum Sprechen benötigt. Auch meine Zunge kann ich nicht gut kontrollieren. Ich kann dennoch einige Wörter selbst sprechen, das passiert dann aber eher zufällig und klingt sehr undeutlich und gepresst. Besonders gut funktioniert das, wenn ich wütend bin, weil sich dann die Luft anstaut und ich diese dann sozusagen explosionsartig herauslassen kann."

"Ich hatte schon viele Computerstimmen"

Ich kann Fragmente einer Sprache jenseits von artikulierten Wörtern erkennen: Atem- und Mundgeräusche sind von Lilli auf den Aufnahmen zu hören. Das sind Ausdrücke, die Maschinen nicht besitzen.

"Seitdem ich aktiv Musicals höre, kann ich im Alltag manchmal besser ein längeres Wort und mehr Silben sprechen, da ich alles, was ich höre, automatisch innerlich mitsinge. Dies trainiert, einen gleichmäßigeren Luftstrom aufzubauen, obwohl ich das aufgrund meiner starken Bewegungen, die nicht besser, sondern eher schlimmer werden, niemals wie andere Menschen können werde. Und eigentlich ist das einzige, was ich an meiner Behinderung wirklich bedaure, der Fakt, dass ich nicht singen kann."

Rein anatomisch sind Lillis Kehlkopf und Stimmbänder gesund. Deswegen kann sie emotionales Verhalten wie Lachen, Weinen und Schreien selbst ausdrücken.

"Ich hatte in meinem Leben schon viele Computerstimmen. Lange Zeit hatte ich eine Männerstimme, da ich die Frauenstimmen, die mir damals zur Auswahl standen, gar nicht mochte. Diese Männerstimme hatte einen sarkastischen Unterton, den ich wirklich sehr zu schätzen wusste. Aber natürlich war es für die Menschen befremdlich, dass ich als junges Mädchen mit einer erwachsenen Männerstimme sprach. Als ich dann mein Gerät wechselte und ich etwas älter war, entschloss ich mich, eine Frauenstimme zu verwenden. Diese konnte ich zwar individuell in Tonhöhe und Geschwindigkeit regulieren, doch wenn ich ehrlich bin, konnte ich mich mit keiner meiner bisherigen Stimmen identifizieren. Das Problem ist, dass man hört, dass diese synthetisch, von einem Computer erzeugt wurden und eben keine natürliche Betonung haben. Außerdem klingen sie etwas zu alt für mich als junge Frau."

Mit einer App zur perfekten Stimme

Und diese Stimme ist nicht einzigartig. Denn sie ist eine von vielen Sprachausgaben, die weltweit genutzt wird. Diese vermeintliche Computerstimme soll für Lilli aber mehr als eine technische Prothese sein. Genauso wie ich meine Stimme nicht ablegen kann, soll auch Lillis Stimme etwas Dauerhaftes, Erkennbares haben, das nicht durch Lizenzen eingeschränkt wird.

Das soll mit der App "My Own Voice" funktionieren. Sie hilft Menschen, die an Störungen in der Sprachproduktion und des Sprachverständnisses leiden, ihre eigene oder fremde Stimmen zu reproduzieren. Für eine elektronisch reproduzierte Stimme braucht Lilli etwa 350 eingesprochene Sätze einer Frauenstimme. Diese Text-to-Speech-Programme funktionieren nach einer Art Baukastenprinzip.

Eine Dirigentin hält für eine Einsingübung die Hand vor ihren Mund.

Mit bestimmten Übungen kann man versuchen, die Stimme höher klingen zu lassen.© Getty Images / Digital First Media / Boulder Daily Camera / Lewis Geyer

Ein Algorithmus analysiert die Sprachmelodie und die Klangfarbe des eingesprochenen Textes und zerlegt diese in natürliche Sprachbausteine wie Phoneme, Silben und Wörter. Zu jedem Sprachbaustein gibt es viele Puzzlesteine zur Auswahl. Die Leistung des Computers besteht darin, die passende Kombination zu finden, damit Melodie und Text einen Sinn ergeben. Die Qualität der Stimme hängt dabei auch von der Größe der Datenbasis ab: Je mehr Vorrat und akustische Variabilität der Puzzleteile, um so natürlicher das Endergebnis.

Ist die digitale Kopie der Stimme in der Datenbank gespeichert, kann sie mit einer Lizenz einem Nutzer oder einer Nutzerin ein Leben lang übertragen werden. Dann gehört diese Stimme einer zweiten Person. Ähnlich wie eine gespendete Niere. Die vermeintlich künstliche Stimme wird zu einem physischen Organ. Sie personifiziert sich ein weiteres Mal.

"Ich achte bei meiner Auswahl darauf, dass die Stimme mir persönlich gefällt, dass sie für mich altersgerecht klingt, dass ich mich mit ihr identifizieren kann. Die Stimme trägt sehr viel dazu bei, wie man von anderen Menschen wahrgenommen wird. Ich hatte zum Beispiel schon sehr oft das Problem, dass die Menschen mich für unhöflich hielten, da meine Stimme einen Satz so hart betont hat. Ich denke, meine neue Stimme wird kein extrem helles Timbre haben, und damit ich mich damit dann auch wirklich identifizieren kann, wird sie wohl auch ein gewisses Selbstbewusstsein ausdrücken müssen.

Welche Stimmen lassen wir gesellschaftlich zu?

Vielleicht wird auch diese Stimme am Ende nicht perfekt klingen. Aber allein die Möglichkeit, seinen eigenen Klang wählen zu können, gibt Menschen wie Lilli ein Stück weit mehr Selbstbestimmung. Ob diese Individualität gelingt, hängt auch von der Resonanz der Gesellschaft ab.

"Lassen wir Menschen zu, die auch Stimmenformen haben, die vielleicht anders gekörnt sind und andere Sachen in sich tragen. Lassen wir auch extrem technische Stimmen als gleichberechtigt zu", fragt der Musikwissenschaftler Holger Schulze. "Ich glaube, das ist ein Teil davon, wenn wir mehr non-binäre Stimmen zulassen, vielleicht auch sehr hohe Stimmen, sehr tiefe Stimmen, anders stotternde Stimmen. Vielleicht können wir dann auch mehr technische oder reiner technische Stimmen zulassen. Das würde von uns als Gesellschaft erfordern, dass wir quasi von der Heteronormativität, aber auch von unserem Alltagserwarten, runterkämen und quasi eine Bandbreite an Stimmen als beziehungsfähig annehmen würden."

Wer spricht und wer darf wann sprechen? Wenn es um die Mitbestimmung unserer Stimme geht, dann wird sie wie unser Gesicht und unser Körper zum Politikum. Die Stimmerkennungstechnologien in Call-Centern, Voice Banking und Voice Cloning für Dienstleistungsunternehmen zeigen uns, wie wertvoll und gleichzeitig verletzlich wir mit unserem akustischen Fingerabdruck sind.

Membran zwischen Innerem und Äußerem

Ein Stimmschluss entsteht dann, wenn beide Stimmlippen durch den Luftstrom aus unseren Lungen sich leicht berühren und miteinander schwingen, die Stimme klingt klar und kräftig.

Und so wird unsere Stimme selbst zu einer schwingenden Membran zwischen dem Innen und Außen, die versucht, im ständigen Abgleich mit der Welt ihre individuelle Authentizität zu behaupten. Dabei muss die Stimme nicht ausschließlich eine menschliche sein. Sie befreit sich von eindeutigen Zuschreibungen, von Rollen, und wird zu einer eigenen Körperlichkeit, die durchlässig ist für jedes Ideal.

"Ich bin groß, ich bin keine graue Maus", sagt Julia. "Ich gehe durch mein Leben und bin ganz stolz darauf, dass ich in den späten Jahren geschafft habe, das zu sein, was ich immer war. Und ich befinde mich jetzt in der längsten Phase meiner Veränderung, nämlich in der Sprechtherapie. Ein ganz großer Teil ist schon installiert, aber die Feinheit, das Schöne, das ist ja noch mein Ziel, das strebe ich an. Da möchte ich hin, und ob ich das schaffe, weiß ich nicht."

Diese Schönheit liegt für Julia in der Brillanz und dem Melodischen der Stimme: "Das ist so mein Ideal, dass ich eben diesen Stimmschluss erreiche, dass ich eine gewisse Brillanz in der Stimme habe, so wie ich die teilweise am Klavier habe. Wenn ich gut in Form bin, dann habe ich schon eine ganz gute Stimme am Klavier. Die dann aber in die Sprechlage zu transformieren oder zu transportieren, ist schwieriger, als ich gedacht habe. Ich habe mir das sowieso ganz einfach vorgestellt. Ich habe gedacht: Du müsste drei Wochen üben, und dann geht es weiter."

Sprecherinnen: Meriam Abbas und Martina Weber
Technik: Andreas Stoffels
Regie: Roman Neumann
Redaktion: Jana Wuttke

Eine Wiederholung vom 05. November 2020