Share

Related

1 Monat her
Apple kündigt eine Investition von über 500 Milliarden Dollar in die amerikanische Wirtschaft an.
1 Monat her
Iris von Spot AI ermöglicht die Erstellung von KI-Videoagenten ohne Programmierkenntnisse.
4 Wochen her
Apple verbessert KI-Modelle mit synthetischen Daten unter besonderer Berücksichtigung der Privatsphäre.
1 Monat her

Kopfhörer mit KI-Technologie: Simultane Übersetzung mehrerer Sprecher in 3D-Sound

An der University of Washington wurde eine innovative Technologie entwickelt, die mittels Kopfhörern die gleichzeitige Übersetzung mehrerer Sprecher ermöglicht, ohne deren individuelle Stimme und Richtung zu verlieren. Diese sogenannte Spatial Speech Translation nutzt handelsübliche, geräuschunterdrückende Kopfhörer mit integrierten Mikrofonen und wird von Algorithmen unterstützt, die es schaffen, Sprecher im Raum zu identifizieren und deren Sprache in Echtzeit zu übersetzen und wiederzugeben.

Das System wurde von einem Forscherteam unter der Leitung von Tuochao Chen entwickelt, das die Ergebnisse auf der ACM CHI Conference on Human Factors in Computing Systems in Japan präsentierte. Die Software ist als Open-Source verfügbar, sodass andere Forscher auf dieser Basis weiterentwickeln können. Nach Aussage des Senior Autors Shyam Gollakota gelingt es erstmals, die natürliche Stimmenqualität und die Ortung der Sprecher zu bewahren.

Eine der bedeutenden Aufgaben, die das System bewältigt, ist das Erkennen der Anzahl der Sprecher in einer Umgebung – sei es drinnen oder draußen. Es übersetzt die gesprochene Sprache und erhält die Ausdrücke und Lautstärke jedes Einzelnen. Diese Lösung verzichtet auf Cloud-Computing zur Wahrung der Privatsphäre und funktioniert auf Geräten wie dem Apple M2 Chip.

Nach Tests in verschiedenen Umgebungen und einer Nutzerstudie bevorzugten die meisten Teilnehmer das System, das eine Verzögerung von 3-4 Sekunden für die Übersetzung aufwies, da kürzere Verzögerungen zu Fehlern führten. Diese Entwicklung stellt einen Schritt in Richtung des Abbaus von Sprachbarrieren zwischen Kulturen dar.

Lesenswert hierzu

Dieser Artikel wurde vollständig oder teilweise durch eine Künstliche Intelligenz (KI) erstellt. Obwohl wir bemüht sind, genaue und aktuelle Informationen bereitzustellen, können wir keine Garantie für die Richtigkeit oder Vollständigkeit des Inhalts übernehmen. Bitte überprüfen Sie alle Informationen und ziehen Sie bei Bedarf eine fachkundige Beratung hinzu.

Weitere News

5 Tagen her
Robotische Glider sammeln wertvolle Daten über das Schmelzen des gigantischen Eisbergs A-68a und seinen Einfluss auf den Südlichen Ozean.
5 Tagen her
Premiere Pro’s neues KI-Tool ermöglicht die Erweiterung von Video- und Audiomaterial.

Kategorien

Allgemein

Automatisierung

Digitalisierung

Forschung & Entwicklung

Generative KI

KI in der Praxis

KI in Marketing

KI-Anwendungen

KI-Ethik

KI-News & Trends

Produktivität

Robotik

Teilen Sie es mit der Welt!