Spatial Audio für Microsoft Teams Rooms

Spatial Audio Microsoft Teams Rooms

Fast wäre es in der Fülle der Pressemitteilungen während der ISE 2023 in Barcelona untergegangen. Microsoft präsentierte gemeinsam mit QSC, einem der führenden Anbieter von professioneller Audiotechnik, Spatial Audio für Microsoft Teams Rooms (Link). Aber was ist das, brauchen wir das und wollen wir das? Diese Fragen können nicht beantwortet werden, ohne sich vorher ein wenig mit dem menschlichen Sehen und Hören zu beschäftigen.

Hörkomfort dank Ortung

Obwohl unsere Augen und Ohren vollkommen unabhängig arbeiten, kombiniert sie unser Gehirn zu einem gesamten Sinneseindruck der Lokalisierung, also WO sich unsere Gesprächspartner befinden. Liefern beide Sinne sehr ähnliche Informationen, so macht uns dies zufrieden und entspannt. Weil es eben „richtig“ ist. Was aber, wenn das Ohr meint, der Sprecher stehe links, das Auge ihn aber klar rechts im Blick hat?

Ist in einem Meetingraum das Display geradeaus vor uns, der Lautsprecher aber seitlich montiert, dann passiert genau das. Dann wird es interessant. Was wird wohl passieren, wenn wir in einem Experiment den Zuhörer ersuchen, jeweils genau dorthin zu zeigen, wo er den Sprecher lokalisiert?

Fall 1: Wir sehen, können aber nicht hören, z.B. der Lautsprecher ist stumm geschalten

==> Dann zeigen wir auf den Screen, weil unsere Augen den Sprecher dort sehen. Einfach und logisch, oder?

Fall 2: Wir hören, können aber nicht sehen

z.B. verbundene Augen, kein Video aktiv oder unsere Versuchsperson blickt gerade nicht auf den Screen
==> Dann zeigen wir auf den Lautsprecher, weil unser Ohr den Ton von dort hört!

Beide Sinne funktionieren übrigens jeweils mit erstaunlicher Präzision.

Fall 3: Wir sehen UND hören den Sprecher
(das sollte eigentlich der Default sein bei einer Videokonferenz!)

Dann wird es interessant. Unser Sehsinn ist dominant, unsere Testperson wird folglich auf den Screen zeigen. Trotzdem stimmt etwas nicht. Unsere Ohren melden die Stimme noch immer aus einer ganz anderen Richtung, nämlich von dort, wo der Lautsprecher ist!
Wichtig: Diese Dominanz gilt nur so lange unsere Testperson den Blick auf den Sprecher gerichtet hat! Ohne die Information des Auges bleibt nur der Höreindruck, die Lokalisierung springt daher auf den Lautsprecher! Geht der Blick nun wieder zurück zum Sprecher, wandert das Image wieder zum Screen, das Ohr wird wieder vom Auge überstimmt (aber nicht ignoriert!).

Dieser Vorgang ist verwirrend und anstrengend für unser Gehirn. Die Folge? Wir ermüden schneller und unsere Konzentration nimmt signifikant ab. Es fällt uns deutlich schwerer, dem Gespräch zu folgen. Dieser Effekt verstärkt sich sogar noch, wenn das Gegenüber in einer Fremdsprache spricht oder die Verständlichkeit ohnehin schon schlecht ist. Diese Anstrengung kann dazu führen, dass Menschen während eines langen Meetings einschlafen!

Wo ist nun die Verbindung zu Spatial Audio für Microsoft Teams Rooms?

Audio im typischen Meetingraum

Unsere Sinne sind bei Videokonferenzen besonders gefordert. Die Bild- und Tonübertragung ist selten perfekt und die Tatsache, dass wir mit einer Person kommunizieren wollen, die sich aber nicht im gleichen Raum befindet, verwirrt unser Gehirn. Umso wichtiger ist es, dass wir es möglichst „richtig“ machen.

Sehen wir uns nun einen typischen modernen Microsoft Enhanced Teams Room an. Die Bildschirmbreite ist dank Front Row Layout sehr groß, die einzelnen Teilnehmer verteilen sich über einen sehr großen horizontalen Winkel. Wir sehen Teilnehmer A genau in der Mitte, Person B ganz links außen und Person C von halb rechts. Aber aus welcher Richtung hören wir sie?

Audio vs. Video Lokalisation
Audio vs. Video Lokalisation
Möglichkeit A: Ein Center Lautsprecher in der Mitte des Screens

Dann kommen alle Höreindrücke von direkt vorne. Und zwar unabhängig von der Sitzposition der lokalen Teilnehmer. Egal wo diese sitzen, sie werden alle Remoteteilnehmer aus der Bildschirm-Mitte hören. Aber je nachdem, welcher Remote Teilnehmer spricht, ist dies mehr oder weniger falsch. Person B, welche ganz links außen im Bild zu sehen ist, wird trotzdem aus der Mitte gehört!

Möglichkeit B: 2 Lautsprecher links und rechts vom Screen, aber MONO-Übertragung

Dabei kommen alle Remoteteilnehmer aus allen Lautsprechern.
Hier kommt nun ein weiterer psycho-akustischer Effekt ins Spiel. Hören wir den gleichen Sound aus mehreren Quellen, so lokalisieren wir den Klang beim Lautsprecher mit der geringsten Entfernung! (Haas Effekt) Die links sitzenden lokalen Teilnehmer werden folglich die Remote-Teilnehmer alle im linken Lautsprecher (außerhalb des Screens!) lokalisieren und auf der rechten Seite des Tisches passiert das gleiche.

Localization hearing
Richtungshören

Nur die 1-2 Menschen exakt in der Tischmitte werden die Teilnehmer in der sogenannten „Phantom-Mitte“ lokalisieren. Genau dort ist zwar kein Lautsprecher, aber weil die Entfernung zu den beiden seitlichen Speakern gleich groß ist, erfindet unser Gehirn einen virtuellen Lautsprecher in der Mitte.

Stereo Phantom Center
Stereo Phantom Center Speaker
Möglichkeit C: Lautsprecher links und rechts vom Screen, aber STEREO-Übertragung

Bekanntlich werden bei Stereo zwei Audiosignale übertragen, eines für LINKS und eines für RECHTS. Welche Auswirkungen hat dies nun für unseren tollen Signature Teams Room mit Front Row?
Der Einfachheit halber gehen wir davon aus, dass uns die Microsoft Cloud auch ein „realistisches“ Stereo-Signal schickt, wo eben Remote-Teilnehmer B ganz links positioniert ist, A in der Mitte, etc.

Die Remote-Teilnehmer verteilen sich nun schön im Stereo-Panorama von ganz links nach ganz rechts. Großartig, oder? Nun ja, so richtig perfekt ist es trotzdem nur für jene, die genau in der Mitte sitzen. Diese genießen die Phantom-Mitte und das Panorama geht analog zum Bild vom rechten bis zum linken Bildschirmrand. Jene Leute aber, die seitlich sitzen, bekommen ein suboptimales Ergebnis, weil die Entfernung zu den Lautsprechern stark unterschiedlich ist. Exakt der gleiche Effekt wie zuhause, wenn Sie außerhalb des Stereo Dreiecks sitzen.

An dieser Stelle beginnen Sie vielleicht zu verzweifeln:

Ist es überhaupt möglich, tolles Spatial Audio für Microsoft Teams Rooms zu machen? JA, das ist möglich, aber es ist eben nicht so trivial wie es auf den ersten Blick erscheint.

Harald Steindl zum Thema Spatial Audio in UC-Räumen

Damit das Upgrade von Mono zu Spatial Audio für Microsoft Teams Rooms auch einen echten Nutzen für die User bringt, braucht es Audio-Expertise. Variablen wie Raumakustik, Platzierung und Auswahl der Lautsprecher müssen berücksichtigt und ein ordentliches Systemdesign muss erstellt werden.

Microsoft trifft hier keine Schuld

Genauso wie der Produzent einer CD oder DVD kann die UC-Plattform nur ein bestmögliches Signal anliefern. Es liegt dann am Kunden bzw. seinen Partnern selbst, das angelieferte Audio-Signal so im Raum optimal zu verteilen, dass alle Teilnehmer einen bestmöglichen Eindruck bekommen. Durch die richtige Auswahl und Positionierung geeigneter Lautsprecher, für die Positionierung der Stühle, etc.

Die wesentlichsten Parameter dafür sind:

  1. Die richtige Lautstärke.
    Keinesfalls ist mehr auch immer besser, ganz im Gegenteil! Eine dauerhaft zu laute Wiedergabe macht uns Menschen nervös. Gleichfalls ist eine zu geringe Lautstärke auf Dauer anstrengend. Zu laute Wiedergabe ist eher ein Indiz für schlechte Verständlichkeit! Zuhörer erhöhen die Lautstärke, weil sie glauben, dass lauter auch besser zu verstehen ist. Dies ist aber nur bedingt richtig.
  2. Optimale Sprachverständlichkeit
    Was nützt die perfekte Lautstärke, wenn wir Nichts verstehen. Für mangelnde Sprachverständlichkeit kann es viele Ursachen geben. Angefangen von schlechten Lautsprechern über falsche Positionierung bis hin zu unbrauchbarer Raumakustik. Gegen schlechtes Audio von der Remote Seite können wir lokal nur wenig unternehmen.
  3. Richtige Lokalisierung
    Das haben wir schon intensiv behandelt. Falsche Lokalisierung verschlechtert die Sprachverständlichkeit, weil unser Gehirn die Diskrepanz zwischen Sehen und Hören verarbeiten muss. Experimente zeigen, dass die Menschen bei schlechter Lokalisierung vermehrt auf den Bildschirm starren. Sie erinnern sich, sobald der Blick vom Sprecher weggeht, springt die Lokalisierung. Genau dies versuchen die Menschen instinktiv zu vermeiden. Eine solche verkrampfte Atmosphäre ist mit Sicherheit nicht gut für produktive Arbeit.

Spatial Audio für Microsoft Teams Rooms wirkt wie ein Verstärker

Was meine ich damit?

Gute und richtig konzipierte Räume werden durch Spatial Audio für Microsoft Teams Rooms nochmals massiv besser werden. Gleichzeitig werden Räume mit schlechtem Audio noch schlechter werden!

Meeting Room Audio Dilemma

Der Grund ist einfach: MONO Audio ist vielleicht nicht perfekt, aber „einfach“ zu hören. Der Ton kommt nur aus einer Richtung und wird nur einmal gehört. Die Richtung stimmt vielleicht nicht ganz, aber der Fehler ist zumindest konstant. Das Ohr kann sich, wenn auch mit Aufwand, auf diese Situation anpassen. Ein Stereosignal ist ungleich komplexer. Super, wenn es richtig gemacht ist, aber viel schlechter als Mono, wenn es falsch ist.

Mit diesem vergleichsweise einfachen Beispiel ist nur die ERSTE Ausbaustufe in Sachen Spatial Audio für Microsoft Teams Rooms erreicht. Mit Sicherheit werden noch weitere folgen; die Möglichkeiten für eine möglichst realistische Audio-Umgebung in Collaboration-Räumen sind noch lange nicht erschöpft.

Lassen Sie AV-Profis an die Arbeit

Audio und Videotechnik ist nicht trivial; Raumakustik ist ebenfalls ein komplexes Thema. Genauso wenig, wie jemand, der ein paar Geräte mit dem Heim-Router verbindet, damit zum Netzwerk-Profi wird, werden IT Spezialisten durch Teams Rooms Systeme automatisch zu AV-Ingenieuren.

Spatial Audio für Microsoft Teams Rooms ist eine tolle Erweiterung für diese marktführende Plattform. Damit diese auch in der Praxis gut funktioniert, ist ein gewisser Aufwand und Know-How nötig, ganz egal, was uns die Marketing-Spezialisten in der Theorie versprechen. Für die UC-Welt mag korrekte Stereo-Wiedergabe vielleicht neu sein, Tontechniker beschäftigt das Thema schon seit Erfindung des Tonfilms vor vielen Jahrzehnten. Nutzen Sie diese Erfahrung und Sie werden vom Ergebnis überrascht sein.