vocal chords / Siebdruck auf PVC

 

[aɪ siːm tu spiːk] / Frequenzanalysen KI-generierter Stimmen /  gelochte Papierrollen, PVC

fig 1. / fig. 2 / Fotografien

20.000 tuning forks / mit Jakob Schreiter

Daisy, Daisy give me your heart to do / I‘m half crazy, hopeful in love with you / It won‘t be a stylish marriage / I can‘t afford the carriage / But you look sweet upon the street / On a bicycle built for two

singt ein IBM 704 im Jahr 1961. Der Vakuumröhrenrechner war die erste Maschine, die den vollen menschlichen Stimmumfang synthetisch erzeugen konnte. Schon einhundert Jahre vorher erkannte Hermann von Helmholtz, dass alle Klänge und Geräusche aus verschiedenen Einzelfrequenzen zusammengesetzt sind. Im Umkehrschluss gelang es ihm, aus der Kombination verschiedener Stimmgabeln Vokale zu erzeugen. Diesem Ansatz der Klangsynthese waren allerdings materielle Grenzen gesetzt, denn um die Komplexität der verschiedensten Laute der menschlichen Sprache vollständig abbilden zu können, hätte Helmholtz wohl 20.000 Stimmgabeln benötigt.
Heute beherbergen die meisten Endgeräte eigene KI-basierte Stimmcharaktere. Aus den merkwürdig melancholischen Klängen des 704 sind von Aufnahmen menschlicher Stimmen kaum zu unterscheidende, interaktive Kommunikationspartner_innen geworden.

Hänschen klein / ging allein / in die weite Welt hinein. / Stock und Hut / stehn ihm gut, / ist gar wohlgemut.

singt die wohl berümteste KI der Filmgeschichte HAL9000 kurz bevor der Astronaut Dave die letzten Schalteinheiten entfernt, um das System herunterzufahren. Das Lied mischt sich mit Daves schwerem Atem und einem zischenden Rauschen, das den rot beleuchteten Raum ausfüllt. Beim Shutdown verlangsamt sich der Gesang und seine Stimmlage wird schrittweise heruntergepitched. Für die deutsche Synchronisation lieh Peter Schiff HAL seine Stimme. In verhältnismäßig kurzer Zeit wurden die Aufnahmen für die Filmsequenzen gemacht. Schiff gab seiner Stimme einen warmen, freundlichen Klang und doch wirkt sie bis heute distanziert und befremdlich. Nur besonders aufmerksamen Ohren fällt vielleicht auf, dass die kurzen Pausen, die beim Sprechen zwischen den einzelnen Satzbausteinen entstehen, von keinem Lufthohlen unterbrochen werden. Schiffs Atmen wurde aus der Audiospur gelöscht.

Die Melodie von „Hänschen Klein“ war die erste, von einem Computer gespielte Melodie. In der englischen Synchronisation sang der HAL9000 „A bycicle for two“.

‚20.000 tuning forks‘ untersucht den individuellen Sprachklang, die Möglichkeiten simulierter Stimmenkonstitution mittels textbasierter Soundsynthese und die daraus resultierenden Suggestion eines intelligenten Gegenübers. Die Frage steht im Raum inwieweit modellierte Sprachintelligenz ein inhaltliches Verständnis für das erlernte Zeichensystem entwickeln kann oder die generierte Sprache ein formales Modell ist und damit ohne repräsentativen Wirklichkeitsbezug bleibt.