Forensischer Stimmvergleich für Séance-Stimmen-Phänomene

Skeptiker, welche nach konventionellen Erklärungen für "Spirit-Stimmen" in Séances suchen, gehen meist davon aus, dass das Medium derartige Stimmen selbst vortäuscht (selbst wenn Medien wie Warren Caylor ihren Mund mit Klebeband oder Knebeln fest verschließen lassen). Auch wenn die Spirit-Stimmen deutlich anders klingen als die Stimme des Mediums, bleibt es schwierig, aufgrund solcher subjektiver Einschätzungen zu entscheiden, ob eine Spirit-Stimme vergetäuscht wurde. Hier können Techniken der Sprachsignalverarbeitung helfen, objektives Beweismaterial zu liefern und dabei obendrein Sprachmerkmale zu verwenden, welche kaum (bewusst) hörbar sind, da sie für unser Sprachverständnis nicht relevant sind.

Hier also einige Information und Ergebnisse der Untersuchungen mit Hilfe forensischer Stimmvergleiche (forensic voice comparison) auf Basis von Audioaufnahmen in Séances mit Warren Caylor. Vielen Dank an Warren und sein Spirit Team für die Unterstützung dieser Arbeit!

Anmerkung: Es handelt sich hier um laufende Untersuchungen/Auswertungen, die Ergebnisse und Beschreibungen auf dieser Web-Seite sind also sehr vorläufig. Im letzten Abschnitt erläutere ich weitere, noch anstehende Arbeitsschritte, um belastbarere Ergebnisse zu liefern.

Einleitung: Forensische Stimmanalyse für Séance-Phänomene

Die typische Aufgabe von forensischen Stimmvergleichen besteht darin, Stimmproben zu analysieren, zu vergleichen und zu entscheiden, ob ein Verdächtigter mit dem Täter identisch ist. Indem Stimmproben miteinander, aber auch mit anderen Stimmen verglichen werden, werden zwei Wahrscheinlichkeiten gegenüber gestellt: Wie wahrscheinlich ist es, dass die Stimme des Verdächtigten mit der des Täter identisch ist? Wie wahrscheinlich ist es, dass die Täterstimme von einer anderen Person stammen kann?

Um Belege für oder gegen die Echtheit von Spirit-Stimmen zu finden, muss dieser Ansatz etwas angepasst werden. Insbesondere ist zu berücksichtigen, dass das Medium versuchen könnte, eine Spirit-Stimme verzutäuschen, indem es die eigene Stimme bewusst verstellt, um anders zu klingen. So ist es vergleichsweise einfach, beim Sprechen die Tonhöhe zu ändern, um einen anderen klanglichen Eindruck zu erzeugen. Insofern liefert die Tonhöhe (Fachausdruck: Fundamentalfrequenz / F0) in der Regel nur sehr schwaches Beweismaterial. Wesentlich interessanter sind die Obertöne der Stimme, die sogenannten Formanten, welche vom Vokaltrakt (Stimmtrakt) abhängen - von seiner anatomischen Form und von der Art und Weise, wie er sich durch den (meist unbewussten) Einsatz von Stimme, Mund und Mundhöhle beim Sprechen verändert. Während die forensische Stimmanalyse meist mit vergleichsweise schlechter Aufnahmequalität wie z.B. bei Telefonmitschnitten auskommen muss, können die Séance-Stimmen mit hoher Audioqualität aufgenommen werden. Dadurch werden die höheren Formanten, insbesondere F3 und F4, als zuverlässige Quelle für die Analyse zugänglich.

Das folgende Bild zeigt ein Beispiel (die Spiritstimme "Albert"). Auf der linken Seite ist dargestellt, mit welcher Häufigkeit die Formanten F1 und F2 in einem bestimmten Verhältnis zueinander auftreten. Diese F1-F2-Kombination ist der entscheidene Faktor, um verschiedene Vokale klanglich zu unterscheiden (die ungefähren Position einiger Vokale sind eingezeichnet), aber sie hängt auch vom individuellen Sprecher ab. In der Mitte ist die Verteilung der Kombinationen der Formanten F3 und F4 dargestellt. Sie haben eine höhere Frequenz und spielen für das Sprachverstehen kaum eine Rolle, können aber umso hilfreicher sein, verschiedene Sprecher zu unterscheiden.

Kann das Medium die verschiedenen Spirit-Stimmen vortäuschen?

Eine erste, naheliegende Frage, um Séance-Skeptikern zu begegnen, lautet: Wie wahrscheinlich ist es, dass das Medium in der Lage ist, die verschiedenen, während der Séance zu hörenden Stimmen selbst vorzutäuschen - wobei zu berücksichtigen ist, dass das Medium dazu seine Stimme vermutlich gezielt verstellen würde.

Hier sind einige Darstellungen von verschiedenen Spirit-Stimmen aus Warrens Séances:

Schon der visuelle Eindruck zeigt viele Unterschiede. (Für diejenigen, die Luthers sehr tiefe Stimme kennen: Die hohen Fundamentalfrequenzen im Diagramm sind ein Problem der Tonhöhenerkennung, vermutlich harmonische Obertöne aufgrund von Luthers - nur im Sinne der Phonetik: "stimmloser" - Aussprache.)

Hier sind die (besonders relevanten) F3-F4-Verteilungen noch einmal in einer 3D-Ansicht dargestellt, um die unterschiedlichen Profile der Spirit-Stimmen und der Stimme von Warren Caylor zu verdeutlichen:

Vergleich Spirit-Stimmen und Warren Caylor

Vergleich Spirit-Stimmen und Warren Caylor

Zum Vergleich: Ein professioneller "Stimmkünstler"

Um die Unterschiedlichkeit der Spirit-Stimmen zu beurteilen, lautet eine zentrale Frage, inwieweit ein Sprecher (das Medium) in der Lage ist, seine Stimme gezielt anders klingen zu lassen. Zum Vergleich habe ich daher die Aufnahmen eines professionellen Künstlers, der bewusst mit seiner Sprache arbeitet, betrachtet: In seinen (in jeder Hinsicht empfehlenswerten) "Känguru-Chroniken" führt Marc-Uwe Kling äußerst lebendige Dialoge zwischen sich selbst und einem Känguru, das er selbst spricht, wobei er seine Stimme deutlich verstellt.

Bemerkenswerterweise sind die Stimmprofile sehr ähnlich, obwohl Marc-Uwe Kling als Künstler mit viel Bühnenerfahrung die Stimmen seiner Charaktere so spricht, dass sie ein deutlich unterschiedliches Eigenleben entwickeln - was sich im Diagramm zumindest in den sehr verschiedenen Fundamentalfrequenzen zeigt. Insbesondere die Formanten F3 und F4 sind jedoch für seine Orginalstimme und das von ihm gesprochene Känguru nahezu identisch.

Hier zur Verdeutlichung ebenfalls die entsprechende 3D-Ansicht:

Vergleich Marc-Uwe Kling - Känguru

Für zuverlässigere Belege sind natürlich noch weitere Messungen und objektive Distanzmetriken wünschenswert. Doch auch diese ersten Ergebnisse legen nahe, dass die in Warrens Séancen zu hörenden Stimmen deutlich unterschiedlicher sind, als dies ein Bühneprofi mit seiner eigenen Stimme zu erreichen vermag (und zwar ohne dabei obendrein den Mund mit Klebeband verschlossen zu haben, wie es bei Warren der Fall ist).

Spirit-Stimmen bekannter Persönlichkeiten

Weitere interessante Fragen ergeben sich, wenn die Spirit-Stimmen zu bekannten Personen gehören sollen, von denen Audioaufnahmen aus ihrer Lebenszeit verfügbar sind. Da sich in Warren's Séancen regelmäßig ein Spirit als Winston Churchill zeigt, ergeben sich zusätzliche interessante Forschungsmöglichkeiten.

In derartigen Fällen können vier oder mehr verschiedene Stimmen für die Analyse interessant sein:

Die Originalstimme des Mediums
Die Spirit-Stimme während der Séance
Originalaufnahmen der realen, historischen Person während ihres Lebens - ggf. in verschiedenen Altern, da sich die Stimme im Laufe der Jahre verändern kann
Andere Menschen, insbesondere Schauspieler, welche die Stimme der Originalperson nachzuahmen versuchen

Es ist klar, in diesem Fall entfernen wir uns deutlich weiter von dem Verdächtiger/Täter-Modell des typischen forensischen Stimmvergleichs, so dass auch das dort verwendete klassische Wahrscheinlichkeitsverhältnis zu erweitern wäre.

Hier also einige vorläufige Auswertungen der Stimmen. Die erste zeigt die Spirit-Stimme von "Winston" in Warrens Séances, die zweite die Originalstimme von Winston Churchill aus dem (willkürlich gewählten) Youtube-Video "We shall fight on the beaches" und die letzte den Schauspieler Albert Finney, wie er Winston Churchill in 'The Gathering Storm' spielt:

Bei diesen Vergleichen ergibt sich das Problem, dass die Stimmproben aus unterschiedlichen Quellen stammen und insbesondere Originalaufnahmen von Churchill naturgemäß eine deutliche schlechtere Qualität besitzen. Es bleibt zu untersuchen, inwieweit sich dies in der Formantenauswertung niederschlägt. Auch ergibt sich die Frage, wie sich Churchills Stimme im Laufe seine Lebens veränderte. Eventuell entspricht die Spirit-Stimme einem jüngeren oder (wie Lucius Werthmüller vermutet:) älteren Churchill. Gegenwärtig habe ich auch nur vergleichsweise kurze Stimmproben verwendet, so dass noch umfangreichere Auswertungen erforderlich sind. Vom ersten Eindruck her lässt sich vielleicht sagen, dass die Spirit-Stimme mindestens so nah am Original-Churchill ist wie der hochkarätige Schauspieler Albert Finney in seiner Rolle als Churchill in einer professionellen Fernsehproduktion, bei der er außerdem jeden Auftritt genau vorbereiten und üben konnte - während die Spirit-Stimmen typischerweise eine interaktive, spontane Unterhaltung mit den Teilnehmern der Séance führen.

Anmerkungen und nächste Schritte

Noch einmal sei daran erinnert, dass es sich hier um vorläufige Ergebnisse handelt. Weitere Untersuchungen sind notwendig, um hoffentlich belastbarere Belege zu sammeln. Einige mögliche nächste Schritte:

Berechnung einer objektiven Metrik, um die Abstände / Unterschiede zwischen den Formantengraphen zu erfassen, idealerweise um ein Wahrscheinlichkeitsverhältnis zu berechnen, wie es im forensischen Stimmvergleich derzeit bewährte Praxis ist.
Sammlung umfangreicherer Daten.
Untersuchung, inwieweit bei den Churchill-Auswertungen die unterschiedliche Audioqualität die Ergebnisse verfälschen kann.
Marc-Uwe Kling und sein Känguru sind nur ein Beispiel, wie sich das Verstellen der Stimme auswirken kann. Hilfreich wären weitere Beispiele, um diesen Ansatz mit mehr Daten zu unterfüttern.
Bezüglich der Formanten könnten deren Trajektoren (also die zeitabhängigen Verläufe) weiteres Material für die Sprecheridentifikation liefern. Dies erfordert allerdings die (mühselige) Arbeit, einzelne Laute in den Audioaufnahmen zu identifizieren und gezielt zusammenzustellen.
Die Formantenanalyse wurde mit der in diesem Bereich sehr populären Software Praat vorgenommen, wobei meine eigene Software einige Schritte zur Nachbearbeitung durchführt, u.a. um die Korrelationsdiagramme zu erzeugen und isolierte Messfehler herauszufiltern (Praat bezeichnet z.B. F2 als F1, wenn F1 nicht korrekt erkannt wurde). Idealerweise sollten für genauere Ergebnisse die automatisch berechneten Formanten noch manuell durch visuelle Inspektion des Spektrums überprüft und ggf. korrigiert werden (mühsame Arbeit...).

Literatur

Geoffrey Stewart Morrison, Vowel inherent spectral change in forensic voice comparison, in Vowel Inherent Spectral Change, edited by G. S. Morrison and P. F. Assmann, Springer, 2013
Jacob Benesty, Jingdong Chen, Yiteng Huang (Eds.): Springer Handbook of Speech Processing, Springer, 2008